Origin:使用上标、下标、数学公式和希腊字母等特殊格式的文本

Origin是一个优秀的科学作图软件。在实际使用过程中,经常需要在坐标轴标签(Tick Label,axis label)中使用诸如上标、下标等特殊格式的文本。坐标轴标签可以直接用其中的内置编辑器,然而常用的Tick Label则一直不清楚如何设置。

那么,如何在Tick Label中使用特殊格式的文本呢?答案在于Origin提供的一系列格式化函数中。

如图所示,Origin提供了诸如上标、下标、上下标、斜体、粗体、希腊字母、指定字体、字号等各种各样的函数。

例如我们要在Tick Label中使用水(H2O)作为标记,那么只需要在数据表格中填写 H\-(2)O 就会转变为H2O的格式。

RSEM: rsem-prepare-reference with NCBI GenBank/GFF3 File

解决方案如下:

  1. Download Genbank from NCBI;
  2. Convert Genbank to GFF3 with BioPerl;
  3. Modify the GFF3 file;
  4. Download Fasta from NCBI or use Genbank conversion;
  5. Use the modified GFF3 file in rsem-prepare-reference;

主要代码如下:

bp_genbank2gff3 --GFF_VERSION 3 file.gb
awk '$3!~/pseudo/' file.gb.gff > file.rsem.gff
# or more restrictly with only protein coding genes
awk '$3~/^(gene|mRNA|exon|polypeptide)$/' file.gb.gff > file.cds.gff
# remove the version number in fasta accession if no transcript is extract
rsem-prepare-reference file.fasta --gff3 file.rsem.gff reference_name

这里主要解决了以下错误:
Line x does not have attribute Parent

由于rsem遵循gene->transcript->exon的结构,并利用exon来作为RNA的最后形式(经过剪切和后处理的RNA),要求exon都有(且仅有)一个Parent。而GFF3文件中pseudogene和pseudogenic_exon是没有Parent的。

以下为rsem-gff3-to-gtf line 27-32。细菌基因组的GFF3文件在gene->transcript->exon中的映射关系如下:gene = type_gene, mRNA(tRNA, etc) = type_transcript, CDS = exon.


type_gene = ["gene", "snRNA_gene", "transposable_element_gene", "ncRNA_gene", "telomerase_RNA_gene",
"rRNA_gene", "tRNA_gene", "snoRNA_gene", "mt_gene", "miRNA_gene", "lincRNA_gene", "RNA", "VD_gene_segment"]
type_transcript = ["transcript", "primary_transcript", "mRNA", "ncRNA", "tRNA", "rRNA", "snRNA", "snoRNA", "miRNA",
"pseudogenic_transcript", "lincRNA", "NMD_transcript_variant", "aberrant_processed_transcript",
"nc_primary_transcript", "processed_pseudogene", "mRNA_TE_gene"]
type_exon = ["exon", "CDS", "five_prime_UTR", "three_prime_UTR", "UTR", "noncoding_exon", "pseudogenic_exon"]

Zotero: 标签的使用技巧

一次将多个条目加入同一个标签中

选中多个条目,拖动到左侧标签列表中即可。

对标签使用颜色和快捷键

用鼠标右键单击任一标签,选择设置颜色,可以为标签设置一个颜色和快捷键。快捷键最多可以有6个,分别是数字1-6。设置之后,可以点击数字1-6将选中条目设为所用标签,非常方便。

适合制作PowerPoint报告时候使用的Zotero引文样式

我定制了一个Zotero样式,特别适合在PPT中使用。分享给大家。具体效果如下图所示。

在引用时,显示第一作者、期刊和出版年。在引文清单时,最多仅显示3个作者,多余3个将只显示第一作者。同时显示文章标题、期刊和卷、期等信息。
author-journal-year-1

把这个csl文件拖放到Firefox窗口中即可安装。

使用时,先选择一个或多个文献条目,然后点击右键,选择“由所选条目创建引文目录…”。

author-journal-year-2

在打开的窗口中选择author-journal-year引文样式,输出模式“引文”和“引文目录”可选,直接复制在剪贴板中,粘贴到PowerPoint中即可。
author-journal-year-3

点击下载 author-journal-year.csl Citation Style Language (CSL).

STAMP: unknown error – Unicode encode error

STAMP是一个支持Windows、Linux系统的微生物群落分析软件。与Mothur或QIIME相比,感觉它更小巧、轻便。它没有从测序结果(MiSeq/454)出发直到分析结果的一整套流程,但是它具有从OTU Table出发进行统计分析、作图的能力。借助于scipynumpymatplotlib等Python库的支持,它的分析、绘图能力达到了一个非常令人满意的程度。相应结果基本可以直接在文章中使用。

STAMP is a software package for analyzing taxonomic or metabolic profiles that promotes ‘best practices’ in choosing appropriate statistical techniques and reporting results. Statistical hypothesis tests for pairs of samples or groups of samples is support along with a wide range of exploratory plots. STAMP encourages the use of effect sizes and confidence intervals in assessing biological importance. A user friendly, graphical interface permits easy exploration of statistical results and generation of publication quality plots for inferring the biological relevance of features in a metagenomic profile. STAMP is open source, extensible via a plugin framework, and available for all major platforms.

它需要的数据有两个:Profile和metadata,分别由两个文件提供。profile是OTU table等核心数据的来源,metadata则包含样品的分组、属性等实验关键设计。

profile文件可以由biom等文件格式转换。

在转换过程中出现了下图所示的UnicodeEncodeError:‘ascii’ codec can’t encode character in position 25-31: ordinal not in range(128)错误。经查是由于文件路径带非ascii字符(中文)造成的。将文件放在全英文的路径中就可以解决这一问题了。

STAMP_unknown error