上期给大家介绍了NCBI、Ensembl 这2个主流的查找基因组的数据库,其中收录的物种广泛(植物、动物、微生物),是我们查找物种基因组最常用数据库。对于一些常年深耕某一种/一类物种的研究者,常常会搭建该类物种专属数据库:如水稻数据库、棉花数据库、柑橘数据库等等。
本期给大家介绍10种重要的作物基因组数据库,供大家研究使用。
01 水稻基因组数据库-RAP
水稻注释计划 (RAP) 始于2004年,当时国际水稻基因组测序项目完成了日本晴品种的基因组测序,旨在为科学界提供精确注释的水稻基因组序列。你可以通过这个数据库工具栏的“DOWNLOAD”基因组下载页面。可以通过下拉框选择不同版本的基因组进行基因组及gff的下载。
网站链接:https://rapdb.dna.affrc.go.jp/
02 小麦基因组数据库(IWGSC)
国际小麦基因组测序协会(International Wheat Genome Sequencing Consortium,IWGSC)是一个由小麦种植者和植物科学家组成的国际合作组织,成立于2005年。
数据库链接:https://www.wheatgenome.org/
03 棉花基因组数据库
棉花功能基因组数据库(CottonFGD)集成了现代基因组/转录组数据和搜索/分析/可视化模块除了提供基因组资源之外,它还为棉花研究人员和其它功能基因组研究提供一个简单、快速、可视化的数据分析平台。
数据库链接:https://cottonfgd.net/
04 大豆基因组和遗传数据库
SoyBase数据库于1990年建立,最初只包含大豆相关的遗传信息,如遗传图谱和大豆孟德尔遗传学信息。随着大豆基因组序列的发布,基因、序列、转录组数据、甲基化数据等也逐渐集成到SoyBase中。
数据库链接:https://www.soybase.org/
05 油菜多组学数据库
该数据库以前期发布的BnPIR、BnTIR以及BnVIR数据库的为基础,进一步搜集了近年来新发布的多组学数据集,并进行了统一过滤、处理和分析,最终构建出目前最为系统和全面的油菜多组学数据库-BnIR。该数据库收录了30个甘蓝型油菜基因组信息。
数据库链接:https://yanglab.hzau.edu.cn/BnIR
06 茄科作物基因组数据库
Sol Genomics Network (SGN)收集了茄科植物(包括番茄、马铃薯、辣椒、矮牵牛和茄子等)基因组信息的数据库。
数据库链接:https://solgenomics.net/
07 葡萄属植物基因组学数据库
VitisGDB(Vitis genome and genetic database)是我国葡萄遗传资源的首个原创性数据库,收录了葡萄属7个物种共22个基因组组装数据。通过整合多种可视化组件与基因组在线比较工具,为用户提供方便的数据检索、下载和在线分析服务。
数据库链接:http://vitisgdb.ynau.edu.cn/
09 谷子功能基因组学数据库
SIFGD(Setaria italica Functional Genomics Database)是中国农业大学整合谷子数据和分析结果构建的功能基因组学数据库,同时,数据库还提供了一些基因功能分析工具,比如基因家族识别、BLAST搜索、GSEA、motif分析等。
数据库链接:http://structuralbiology.cau.edu.cn/SIFGD/index.html
10 十字花科植物基因组资源综合数据库
Brassicaceae Database (BRAD)是由中国农业科学院蔬菜花卉研究所开发的十字花科植物基因组资源综合数据库,除了提供传统的数据库服务(如基因功能注释、基因序列、在线BLAST和基因组浏览器等),BRAD还具有微共线性分析、系统发育树构建、变异图谱和引物设计等特色功能。
数据库链接:http://brassicadb.cn
A total of 38
10
rice g
ra
in's images were taken for the two species, processed and feature inferences were made. 7 morphological features were obtained for each g
ra
in of rice.
Dataset Information
Additional Information
Among the certified rice grown in TURKEY, the Osmancik species, which has a large planting area since 1997 and the Cammeo species grown since 2014 have been selected for the study. When looking at the gene
ra
l cha
ra
cteristics of Osmancik species, they have a wide, long,
一、nt和nr
数据库
nt库和nr库大家都比较熟悉,一个核酸库,一个蛋白库,两者既可以通过NCBI进行在线BLAST,也可以在ftp://ftp.ncbi.nih.gov/blast/db地址中将如下文件下载后,进行
本地BLAST。在此还是简单说明一下在线比对方法:
打开https://blast.ncbi.nlm.nih.gov/Blast.cgi,根据下表选择合适的程序(图表来自网络)
粳稻参考
基因组
日本晴主要常用的有两个版本,
分别为The Rice Annotation Project (
RA
P)(https://
ra
pdb
.dna.affrc.go.jp/index.html)和
Rice Genome Annotation Project (RGAP7,MSU)
(http://rice.plantbiology.msu.edu/index.shtml)。分别由两个团队进行维护,因此其注释基因数量和基因登录号也不相同。
RA
P格式为“Os-Chr-g-number”,MSU格式为“LOC_Os-Chr-g-number”。
BnaGVD: A Genomic Variation Database of
Ra
peseed (B
ra
ssica napus)
BnaGVD:甘蓝型油菜
基因组
变异
数据库
油菜是一
种
典型的多倍体
作物
,也是世界上最
重要
的油料
作物
之一。随着高通量测序技术的快速发展和测序成本的降低,特定
作物
的大规模
基因组
数据已成为可能。
然而,原始序列数据大多保存在国家生物技术信息中心的序列读取档案馆和欧洲核苷酸档案馆中,所有研究人员
RGAP:基因命名法
在访问水稻
基因组
注解计划的FTP地址或网页上的模拟分子数据时,会见到其内部使用的术语,如TU和基因模块。这篇文章旨在解释此计划的命名法,并且将其与生物学家普遍使用的命名法联系起来。
转录单位:
一个转录单位相当于一个基因或模拟分子上的一个基因座。转录单元以一
种
精确的命名规则储存在
数据库
中,合适名字如:x.tyyyyy 。其中,x指的是BAC或模拟分子的收录编
官网:https://github.com/thx/
RA
P
在线版:http://
ra
p.taobao.org/
官网 Wiki:https://github.com/thx/
RA
P/wiki/home_cn
官网部署手册...