通过命令行下载植物基因组数据(phytozome)
在linux服务器上做植物转录组数据回帖,需要从phytozome下植物基因组,木有ui于是使用api方法下载。 欢迎大家批评指正,转载请标明出处:https://www.ivistang.com/articles/304 (opens new window)
# 注册账号
注册地址:https://phytozome.jgi.doe.gov/pz/portal.html (opens new window)
# 登录
curl 'https://signon.jgi.doe.gov/signon/create' --data-urlencode 'login=USER_NAME' --data-urlencode 'password=USER_PASSWORD' -c cookies > /dev/null
1
USER_NAME即注册邮箱,USER_PASSWORD即密码
# 获取下载文件列表files.xml
curl 'https://genome.jgi.doe.gov/portal/ext-api/downloads/get-directory?organism=PhytozomeV12' -b cookies > files.xml
1
xml列表形式的PhytozomeV12所有可下载物种与信息,相当于https://genome.jgi.doe.gov/portal/pages/dynamicOrganismDownload.jsf?organism=PhytozomeV12 (opens new window) 中的内容。 PhytozomeV12可以换成其他物种。
# 下载文件
比如说我要下载拟南芥基因组Athaliana_167_TAIR9.fa.gz 首先从files.xml中找到对应url记录
<file label="PhytozomeV12" filename="Athaliana_167_TAIR9.fa.gz" size="34 MB" sizeInBytes="35962482" timestamp="Wed Jan 08 16:37:22 PST 2014" url="/portal/ext-api/downloads/get_tape_file?blocking=true&url=/PhytozomeV12/download/_JAMO/585474417ded5e78cff8c47b/Athaliana_167_TAIR9.fa.gz" project="" library="" md5="f4ffc2e412f4e6d907aa18d6f4777f22" fileType="Assembly" />
1
然后同样适用curl进行下载,注意把&
改成&
curl 'https://genome.jgi.doe.gov/portal/ext-api/downloads/get_tape_file?blocking=true&url=/PhytozomeV12/download/_JAMO/585474417ded5e78cff8c47b/Athaliana_167_TAIR9.fa.gz' -b cookies > Athaliana_167_TAIR9.fa.gz
1
官方参考链接:https://genome.jgi.doe.gov/portal/help/download.jsf#/api (opens new window)
上次更新: 2024/03/11, 23:50:27