蛋白质组数据如何轻松上传到公共数据库?
点击上方“蓝色字体”关注我们
蛋白组学、代谢组学服务专家
编者按
在完成了前期实验设计,样本制备,组学实验,数据分析和文章撰写等主要工作,终于准备投稿蛋白质组学相关结果的文章时,不少老师会发现主流的蛋白质组学杂志及其他非组学杂志一般都会要求投稿人在第三方平台提交蛋白质组学的原始数据。本期小鹿就为大家分享一下如何解决投稿前的最后一只拦路虎!
为什么上传数据?
1. 供审稿人检查数据与数据处理流程。
2. 与学术界共享,其他人得以再次利用数据进行深度挖掘或不同角度进行研究。
3. 增加自己的引用率。
4. 给自己节省数据储存空间。
5.督促研究者提供好数据!杜绝学术不端!
原始数据上传到哪?
ProteomeXchange(简称PX),是应用较为广泛的蛋白质组学质谱数据存储平台(http://www.proteomexchange.org),旗下包括了PRIDE Archive, MassIVE, PeptideAtlas, and jPOST等平台;
其中iProX是中国学者使用较多的上传蛋白质学质谱数据的存储平台(http://www.iprox.org),因服务器在国内,数据上传的速度相对较快,被国内学者较为青睐。
图 | ProteomeXchange以及其旗下平台
蛋白组学数据上传步骤
步骤一:登录网址
https://www.iprox.org/
步骤二:注册账号和登录
a.点击右上角的注册按钮,填写所需要的账号名称、密码、用户单位和邮箱等信息;
b.填写完后,iProX系统会给您填写的邮箱发送确认邮件;
c.点击确认链接激活后,既可以使用注册的用户名(UserName)和密码(Password)登陆系统。
步骤三:创建新项目
iProX提交系统以项目为数据管理单位的(相当于一次完整的实验研究),一个项目下可以有多个子项目(多次实验结果)。可以认为一个子项目为一个项目下面的一次实验;如果没有重复/对照等不同类型的实验,一个项目下面可以只有一个子项目。
(一)登录系统后,用户可以直接通过首页上方“Project-New Project”的方式创建新项目;
(二)或者通过选择“My Space”,然后在Project Tree下方点击Project,再选择右侧的"New Project"进行新项目创建。
接着填写创建项目所需的信息,页面中有 “*”标记的为必填项,其他内容为选填项。
注意:
a.is Public:选择项目(包括下面子项目)共享权限,“public”为立即向公众公开,“To be public”用户可以选择数据公开的时间,“private”为暂不公开(直到用户修改权限后才公开)。
b.Add to Groups:将项目(包括下面子项目)共享到选择的群组,选择后,即使是“private”的项目和子项目,也对该group成员公开。
c.Add to subprojects:将项目(包括下面子项目)添加到选择的超项目,选择后,项目和子项目的实验元信息可通过超项目浏览,但项目和子项目数据的访问权限同“isPublic”中的选择。
填写完信息后点“Continue”保存当前填写信息进入下一步。
步骤四:创建子项目
子项目中大量实验元信息需要通过标准的控制词汇表(CV,Control Vocabulary)进行填写,包括Species、Tissue、Cell type等,点击“Choose”键,在填出的控制词汇表窗口进行条目选择,可以通过常用列表选择条目或者搜索条目进行填写。
步骤五:上传数据文件
iProX系统中数据文件在子项目下面上传。完成子项目信息页面填写后点击页面下方的Continue进入上传文件页面 。iProX提供两种上传文件的方式:通过网页直接上传(Upload by Browse),适合少量并且较小的文件(网页上传文件大小不能超过4Gb);通过Aspera插件上传(upload by Aspera),适合大量较大的文件(不受文件大小和数量的限制)。
1.完整提交需要包含的文件
a. 结果文件(result):mzIdentML(要有对应的PEAK文件,即spectra)、prideXML;
b. 质谱仪器产出的原始文件(MS instrument raw output)。
2.部分提交需要包含的文件
a. 搜库文件(SEARCH):即搜索引擎输出的结果文件 (search engine results, protein/peptide identifications);
b.质谱仪器产出的原始文件(MS instrument raw output)。
选择好提交数据的方式(Complete submission/Partial submission)和上传文件方式(Browse/Aspera)后,点击“Add file”选择本地要上传的数据文件,可以同时选择多个文件;系统会根据文件名后缀自动判断文件类型,对判断不正确的文件类型,可以点击文件后面的下拉菜单进行修改,可为每个文件添加其一个多个关联的文件。完成上述操作后请点击“Start upload”进行文件上传,文件上传完成后页面上会出现提示,然后可以点击“Continue”进入提交页面。
步骤六:提交项目和子项目
点击下方“submit”键后项目(包括子项目)将提交给iProX数据管理员进行发布前审核,审核通过后提交者邮箱和站内信将收到相应通知,此时用户上传的数据文件正式完成提交。审核通过后,就可以获得IProX编号。
步骤七:数据集的引用
原始数据上传完成后,可以在文章致谢后的"Data Availability"中或者其他位置写明数据集的访问信息(URL, project ID),保密的数据集需在邮件里告知编审数据访问的账号和密码。
学会了吗?快来试一试吧!
.
文末看点|lumingbio
上海鹿明生物科技有限公司多年来,一直专注于生命科学和生命技术领域,是国内早期开展以蛋白组和代谢组为基础的多层组学整合实验与分析的团队。目前在多层组学研究已经有了成熟的技术方法,欢迎各位老师前来咨询哦~
猜你还想看
END
Lisa 整理
欢迎转发到朋友圈
本文系鹿明生物原创
转载请注明本文转自鹿明生物
我知道你在看哟
点“阅读原文”了解更多