在阿里云ECS上设置swap分区

对于内存比较小的ECS来说,开启swap可以避免偶尔的内存溢出。

以上的代码将创建1000M的swap分区(bs × count),即时启用。在剩余10% (swapiness)物理内存时将会使用swap。

同时,将配置写入系统文件。重启之后仍然会使用上述配置。

Origin:使用上标、下标、数学公式和希腊字母等特殊格式的文本

Origin是一个优秀的科学作图软件。在实际使用过程中,经常需要在坐标轴标签(Tick Label,axis label)中使用诸如上标、下标等特殊格式的文本。坐标轴标签可以直接用其中的内置编辑器,然而常用的Tick Label则一直不清楚如何设置。

那么,如何在Tick Label中使用特殊格式的文本呢?答案在于Origin提供的一系列格式化函数中。

如图所示,Origin提供了诸如上标、下标、上下标、斜体、粗体、希腊字母、指定字体、字号等各种各样的函数。

例如我们要在Tick Label中使用水(H2O)作为标记,那么只需要在数据表格中填写 H\-(2)O 就会转变为H2O的格式。

RSEM: rsem-prepare-reference with NCBI GenBank/GFF3 File

解决方案如下:

  1. Download Genbank from NCBI;
  2. Convert Genbank to GFF3 with BioPerl;
  3. Modify the GFF3 file;
  4. Download Fasta from NCBI or use Genbank conversion;
  5. Use the modified GFF3 file in rsem-prepare-reference;

主要代码如下:

bp_genbank2gff3 --GFF_VERSION 3 file.gb
awk '$3!~/pseudo/' file.gb.gff > file.rsem.gff
# or more restrictly with only protein coding genes
awk '$3~/^(gene|mRNA|exon|polypeptide)$/' file.gb.gff > file.cds.gff
# remove the version number in fasta accession if no transcript is extract
rsem-prepare-reference file.fasta --gff3 file.rsem.gff reference_name

这里主要解决了以下错误:
Line x does not have attribute Parent

由于rsem遵循gene->transcript->exon的结构,并利用exon来作为RNA的最后形式(经过剪切和后处理的RNA),要求exon都有(且仅有)一个Parent。而GFF3文件中pseudogene和pseudogenic_exon是没有Parent的。

以下为rsem-gff3-to-gtf line 27-32。细菌基因组的GFF3文件在gene->transcript->exon中的映射关系如下:gene = type_gene, mRNA(tRNA, etc) = type_transcript, CDS = exon.


type_gene = ["gene", "snRNA_gene", "transposable_element_gene", "ncRNA_gene", "telomerase_RNA_gene",
"rRNA_gene", "tRNA_gene", "snoRNA_gene", "mt_gene", "miRNA_gene", "lincRNA_gene", "RNA", "VD_gene_segment"]
type_transcript = ["transcript", "primary_transcript", "mRNA", "ncRNA", "tRNA", "rRNA", "snRNA", "snoRNA", "miRNA",
"pseudogenic_transcript", "lincRNA", "NMD_transcript_variant", "aberrant_processed_transcript",
"nc_primary_transcript", "processed_pseudogene", "mRNA_TE_gene"]
type_exon = ["exon", "CDS", "five_prime_UTR", "three_prime_UTR", "UTR", "noncoding_exon", "pseudogenic_exon"]

Zotero: 标签的使用技巧

一次将多个条目加入同一个标签中

选中多个条目,拖动到左侧标签列表中即可。

对标签使用颜色和快捷键

用鼠标右键单击任一标签,选择设置颜色,可以为标签设置一个颜色和快捷键。快捷键最多可以有6个,分别是数字1-6。设置之后,可以点击数字1-6将选中条目设为所用标签,非常方便。

适合制作PowerPoint报告时候使用的Zotero引文样式

我定制了一个Zotero样式,特别适合在PPT中使用。分享给大家。具体效果如下图所示。

在引用时,显示第一作者、期刊和出版年。在引文清单时,最多仅显示3个作者,多余3个将只显示第一作者。同时显示文章标题、期刊和卷、期等信息。
author-journal-year-1

把这个csl文件拖放到Firefox窗口中即可安装。

使用时,先选择一个或多个文献条目,然后点击右键,选择“由所选条目创建引文目录…”。

author-journal-year-2

在打开的窗口中选择author-journal-year引文样式,输出模式“引文”和“引文目录”可选,直接复制在剪贴板中,粘贴到PowerPoint中即可。
author-journal-year-3

点击下载 author-journal-year.csl Citation Style Language (CSL).