三种向NCBI提交SRA高通量测序原始数据的方法

将测序原始数据提交到SRA已经逐渐成为投稿的必备条件。对于高通量测序数据来说,动辄几百兆或者更大文件的传输是一个相对比较耗时的部分。NCBI提供了3种方式来提交这部分数据:

  1. 网页形式(包括浏览器上传和Aspera Connect插件上传);
  2. Aspera命令行方式提交;
  3. FTP方式提交。

第一种方式

网页提交应当是用户最熟悉的方式,跟日常上网的操作一样。但是,如果不使用Aspera Connect插件,一次只能提交一个文件。而且整个提交过程中没有进度提示,是最低效率的方式。然而,通过使用Aspera Connect插件,可以同时提交多个文件并看到进度。

一般情况下,使用Aspera插件在网页上提交是最方便的、推荐的上传方式。

不过,有时候由于浏览器、网络等存在问题,浏览器并不能正确调用Aspera软件。那就只能用其它方式传输了。

后面两种,都属于先将文件上传到临时文件夹(preloaded),随后再与SRA中的meta table中的文件列表一一对应起来的方法。

第二种方式

第二种方式是我最近一次使用的方式。当时,在浏览器上无法正确启动Aspera软件,并且使用时出现多次蓝屏。当你选择这种方式,需要打开一个命令行,输入网页上提示的命令即可。

下图即网页上面的提示。注意你需要下载一个key file在命令中使用。同时,还有把所有文件放在一个文件夹中。相应文件夹中的所有文件都会被上传。

命令运行时的界面如下:

这种方式传输速度也很快。我用WIFI是的连接速度在30 Mbps左右。

第三种方式

第三种方式,应当是最传统的文件传输方式,即FTP方式。选择FTP方式时,网页上会显示FTP服务器的地址、用户名、密码、用户目录等信息。需要注意的是,你并没有服务器根目录的访问权限,因此需要在设置FTP服务器时指定目录(FileZilla)。

首先,打开站点管理器,新建站点,填写主机、用户名、密码等信息。

其次,进入“高级”标签页,在上面把用户目录填写上。

这时候就可以连接了。需要注意的是,连接之后,需要在用户目录中新建一个子文件夹(必选操作)。然后才能将文件通过FTP传输到用户目录的新建子文件夹内。

根据我的使用情况,FTP传输的速度只有第二种方法的十分之一不到。除非你网络环境很好,否则不值得推荐。

===================================

综上所述,上传文件首选带有Aspera插件的浏览器模式,其次是Aspera命令行模式,再次FTP模式。

ggplot2作图中不使用科学计数法

科学计数法(1E+5)这种形式不适合大多数图片。拒绝使用的方法有很多,一个比较简单粗暴的方法是设置scipen参数: options(scipen = 200) 。

非常好用。

从一组照片创建PPT

每次听讲座时,总是会把感兴趣的内容用手机拍摄下来。随后整理归纳成相应的报告PPT。以前都是一张张添加,今天发现了一种批量添加的方法。

新建一个PowerPoint文档,选择插入 –》 相册,指定目录,导入图片,点击“确定”就一气呵成了。使用图片工具将图片压缩之后,存放备查。十分方便。

 

参考资料:http://blog.sciencenet.cn/blog-3777-321083.html

Windows系统中固定R的Library目录

每次R语言版本更新,都在Windows下面新安装一个目录,原来的Library无法继续使用。

通过设置R的环境变量,可以实现将R_LIBS_USER固定到一个地方。

在Linux系统中,方法很简单,只需要在~/.Rprofile文件中指定

在Windows下设置R_LIBS_USER的一个途径是在${R_HOME}\etc\Rprofile.site文件中添加一句:

别忘了运行下一条命令更新全部的包哦!

 

清理Windows 10系统盘

Windows最近发了个大更新。自国庆节期间更新系统之后,50G的系统盘已经几乎被填满了。Windows就是这么臃肿,越用越慢。这方面真是大不如Linux。用了几年的Ubuntu根目录才1G左右,简直把Windows吊打的渣都不剩。

吐槽归吐槽,但是还是不得不着手对系统进行清理。

首先打开系统自带的磁盘清理工具,19.2G的Windows.old清理之后,感觉清爽了不少。

其次,打开磁盘占用分析神器 RidNacs 扫描C盘,发现 System32\DriverStore 臃肿的不堪入目。居然占用了15G空间。

使用 DriverStore Explorer 查看,可以发现,绝大多数都是N卡的显卡驱动。每个驱动400M,总共有好几十个。

NVIDIA也是个怀旧的公司,每次更新驱动,都会将老版驱动做一个备份,于是这个文件夹就越来越大了。不得不说,在这一点上跟Windows还是挺一致的。

下一步,准备把所有旧驱动删掉。通过设备管理器确认现在正在使用的显卡驱动就是上面图片中最新的哪一款,于是将其它所有NV驱动选中,使用 DriverStore Explorer 删除。

此外,还发现一个文件夹非常大。就是这个:C:\Users\All Users\Microsoft\DataMart\PaidWiFi\OffersCache\Offers

从命名上来看,这纯粹是个广告嘛。于是保留了 zh-cn 以外,其余全部删除。

 

www.gqgtpc.com/thread-102248-1-1.html