绑定机构
扫描成功 请在APP上操作
打开万方数据APP,点击右上角"扫一扫",扫描二维码即可将您登录的个人账号与机构账号绑定,绑定后您可在APP上享有机构权限,如需更换机构账号,可到个人中心解绑。
欢迎的朋友
万方知识发现服务平台
获取范围
  • 1 / 1
  (已选择0条) 清除 结果分析
找到 6 条结果
[期刊论文] 刘金定 张赞 黄水清 李飞
-
北大核心 CSTPCD CSCD AJ CA CBST
-
摘要:随着高通量RNA测序(RNA-Seq)技术的发展和测序成本迅速下降,RNA-Seq技术已经成为生物学研究的重要工具,为生物学家全面地了解和研究转录组提供了机遇.高通量测序具有读长短、存在一定比例的测序错误、数据量大等特点,因此RNA-Seq数据分析与基因组分析和传统的EST数据分析有所不同.本文通过介绍不同的测序平台、原始数据产生和低质量数据过滤的计算流程,对短序列比对、转录组拼接、功能注释、以及差异表达分析进行了研究和分析,最后对RNA-Seq在昆虫学研究中的应用进行了综述,并对RNA-Seq技术进行了总结和展望....
[期刊论文] 刘莹 王娜 张赞 李飞
-
北大核心 CSTPCD CSCD AJ CA CBST
-
摘要:随着测序技术的发展,昆虫转录组数据不断积累,在昆虫学研究中的应用也越来越广泛.在害虫抗药性的研究中,转录组数据分析也是重要的最新研究手段.本文通过对5种鳞翅目害虫转录组的生物信息学分析,鉴定出13种与抗药性相关的基因,发现细胞色素P450基因序列数量最多,共887条.另外,谷胱甘肽S-转移酶、鱼尼丁受体、氨肽酶N、糖基转移酶相关的基因序列多于100条.同时,对这5种鳞翅目昆虫中部分Bt受体相关的基因做了多序列比对和进化分析.分析认为,从多物种、多基因的角度提出对农药抗性的系统性研究,是害虫抗性研究的发展趋势....
[期刊论文] 张赞 刘金定 黄水清 李飞
-
北大核心 CSTPCD CSCD AJ CA CBST
-
摘要:随着深度测序和基因芯片技术的不断发展,基因组、转录组、表达谱数据大量积累.目前,至少有10多个昆虫的基因组已被测序,30多个昆虫的转录组数据被报道.显然,传统的生物统计学方法无法处理如此海量的生物数据.量变引发质变,生物数据的大量积累催生了一门新兴学科,生物信息学.生物信息学融合了统计学、信息科学和生物学等各学科的理论和研究内容,在医学、基础生物学、农业科学以及昆虫学等方面获得了广泛的应用.生物信息学的目标是存储数据、管理数据和数据挖掘.因此,建立维护生物学数据库、设计开发基于模式识别、机器学习、数据挖掘等方法的生物软件,以及运用上述工具进行深度的数据挖掘,是生物信息学的重要研究内容.本文首先简要介绍了生物信息学的历史、研究现状及其在昆虫学科中的应用,然后综述了昆虫基因组学和转录组学的研究进展,最后对生物信息学在昆虫学研究中的应用前景进行了展望....
摘要:随着测序技术的进步,大规模基因组测序数据和海量RNA-Seq数据不断涌现,昆虫学研究逐步追赶人类后基因时代研究的步伐,迎来了生物数据的大时代.目前,已有155种昆虫基因组序列可从公开数据库中获得,共发表昆虫基因组研究论文30余篇,昆虫RNA-Seq数据量则更多.面对如此海量测序数据的原始积累,数据的存储和使用者之间的鸿沟越来越大,昆虫基因数据散乱在各大数据库中,严重影响了基因大数据的管理和共享,构建昆虫大数据库平台的重要性越来越突出.为此,我们构建了InsectBase昆虫基因组数据库(http://www.insect-genome.com/),总数据存储量达120 G.InsectBase共收集了155种昆虫基因组(隶属于16个目),其中61个基因组具有注释信息(Official gene set,OGS),116个转录组数据,237个物种的EST序列, 69个物种的7544条miRNA序列,2个物种的83262条piRNA序列,构建了78个物种的22536个信号通路,116个昆虫的UTR序列和CDS序列.针对61个有OGS注释的昆虫,开展了数据挖掘.对研究较多的36个基因家族开展了系统分析,运用OrthoMCL直系同源算法发现了7个物种中的直系同源基因,共找到1∶1∶1直系同源基因973个.InsectBase昆虫基因组数据库提供序列查询、序列比对、基因组可视化、信号通路和注释、进化分析和进化树构建,所有基因数据均可下载.从PubMed中下载了94758昆虫研究相关文献,通过数据挖掘,建立了昆虫学领域的关系网络平台iFacebook,初步实现"基因-研究者-昆虫物种"等三者之间的关系网络,便于促进学术交流.InsectBase是综合型的生物信息学数据库,数据种类齐全、功能全面、用户使用方便,有利于昆虫学研究者对基因数据的获得、整理和分析,促进昆虫分子生物学研究.
摘要:随着测序技术的进步,大规模基因组测序数据和海量RNA-Seq数据不断涌现,昆虫学研究逐步追赶人类后基因时代研究的步伐,迎来了生物数据的大时代.目前,已有155种昆虫基因组序列可从公开数据库中获得,共发表昆虫基因组研究论文30余篇,昆虫RNA-Seq数据量则更多.面对如此海量测序数据的原始积累,数据的存储和使用者之间的鸿沟越来越大,昆虫基因数据散乱在各大数据库中,严重影响了基因大数据的管理和共享,构建昆虫大数据库平台的重要性越来越突出.为此,我们构建了InsectBase昆虫基因组数据库(http://www.insect-genome.com/),总数据存储量达120 G.InsectBase共收集了155种昆虫基因组(隶属于16个目),其中61个基因组具有注释信息(Official Gene Set,OGS),116个转录组数据,237个物种的EST序列,69个物种的7544条miRNA序列,2个物种的83262条piRNA序列,构建了78个物种的22536个信号通路,116个昆虫的UTR序列和CDS序列.针对61个有OGS注释的昆虫,开展了数据挖掘.对研究较多的36个基因家族开展了系统分析,运用OrthoMCL直系同源算法发现了7个物种中的直系同源基因,共找到1∶1∶1直系同源基因973个.InsectBase昆虫基因组数据库提供序列查询、序列比对、基因组可视化、信号通路和注释、进化分析和进化树构建,所有基因数据均可下载.从PubMed中下载了94758昆虫研究相关文献,通过数据挖掘,建立了昆虫学领域的关系网络平台iFacebook,初步实现"基因-研究者-昆虫物种"等三者之间的关系网络,便于促进学术交流.InsectBase是综合型的生物信息学数据库,数据种类齐全、功能全面、用户使用方便,有利于昆虫学研究者对基因数据的获得、整理和分析,促进昆虫分子生物学研究.
[博士论文] 张赞
农业昆虫与害虫防治 南京农业大学 2014(学位年度)
摘要:转录组通常指所有信使RNA的集合。通过RNA-Seq技术,人们可获得大量的转录组序列信息,开展基因表达、功能分析、信号通路构建和分子进化分析等。本文以昆虫转录组为研究对象,开展了6种昆虫的比较转录组学研究,对昆虫转录组进行了分类,提出了两个评估昆虫转录组拼接质量的参数(Contigs containing the intact CDS,长度比率中住数LR50),开发了基于转录组的昆虫信号通路构建软件iPathCons,建立了昆虫信号通路数据库iPathDB。
  1、三化螟和稻纵卷叶螟的转录组测序分析
  将三化螟(Scirpophaga incertulas)和稻纵卷叶螟(Cnaphalocrocis medinalis)的卵、幼虫、蛹、成虫等不同发育时期的试虫分别提取RNA,混合后进行转录组测序。分别获得2100万条三化螟的Reads,总共约15亿bp的转录组数据;4300万条稻纵卷叶螟Reads,约32亿bp的转录组数据。使用Trinity和SOAPdenovo拼接,经过比较,选用Trinity的拼接结果进行了表达丰度分析、基因注释、COG分析等。结果显示,三化螟和稻纵卷叶螟的转录组分别有45%和50%的序列能够被注释为蛋白编码基因,其余转录本无法注释,可能为非编码RNA序列或蛋白基因序列的非翻译区。
  2、六种昆虫的比较转录组分析
  从SRA数据库中下载了中华蜜蜂、丝光绿蝇、褐飞虱和烟粉虱的转录组原始数据,进行了拼接,使用nr数据库注释。然后对三化螟、稻纵卷叶螟、中华蜜蜂、丝光绿蝇、褐飞虱和烟粉虱等6个昆虫的转录组进行比较分析。丝光绿蝇转录组被注释为蛋白编码基因的比例最高,达到57%;其次为褐飞虱转录组,为56%;最少为烟粉虱,仅28%。利用双向Blast的最优匹配法进行直系同源搜索,长度比值在0.9~1.1之间的序列作为含有完整CDS的序列。在三化螟、稻纵卷叶螟、中华蜜蜂、丝光绿蝇、褐飞虱和烟粉虱等6个昆虫中分别发现了2,258、2,058、3,626、5,053、2,094和2,173条完整CDS的转录本序列。GO分析发现,6个昆虫在生化过程(Biological Process)中的差异最为明显,丝光绿蝇在发育过程(Developmental Process)中所占比例为44%,明显比其他五个物种多。在三化螟、稻纵卷叶螟、褐飞虱和烟粉虱等4个农业害虫中发现的细胞色素P450基因序列比丝光绿蝇和中华蜜蜂多,可能与农业害虫受到农药等环境因子更多的选择压力有关。丝光绿蝇中有一类特异的嗅觉蛋白(Odorant BindingProtein,OBP),表明蝇类具有更发达的嗅觉。在三化螟、稻纵卷叶螟、中华蜜蜂、褐飞虱和烟粉虱等昆虫中,发现了系统性RNAi相关的关键基因Sid-2,但是该基因没有在丝光绿蝇中找到。上述结果表明,不同昆虫转录组之间差异较大,一方面可能是由测序覆盖度的差异造成,另一方面也反映了物种之间的差异,显示转录组可用于分子进化和分子分类等研究,比较转录组学是将来转录组数据分析的发展方向之一。
  3、昆虫转录组数据拼接质量的评估软件开发
  转录组数据质量影响到后续分析的可靠性。目前主要根据N50的大小进行转录组质量评估,具有较大的局限性。为此,我们提出了两个指标来评估转录组的质量,包含完整CDS序列的百分比(CCIC)和长度比率中位数(LR50),其主要是通过转录组序列的完整性来评价转录组拼接质量。首先,将转录组序列分为四个类别:有完整CDS的序列、有5'UTR的片段、有3'UTR的片段和CDS片段。然后,计算转录组中的CCIC百分比和LR50。利用果蝇转录组数据进行模拟分析,表明CCIC百分比和LR50能够更加客观合理地反应转录组的拼接质量。使用LR50评估了6种昆虫转录组的拼接质量,发现三化螟和稻纵卷叶螟转录组的拼接质量不高。
  4、昆虫信号通路的构建软件iPathCons
  为了充分利用转录组数据,开发了iPathCons软件用于从昆虫转录组数据构建信号通路。以KEGG中20个昆虫的信号通路信息为模板,利用iPathCons分析了其他15个昆虫的基因组数据,构建了信号通路。因此,总共获得了35个昆虫的信号通路数据,以这些数据为模板,构建了iPathCons网络服务器,用于从转录组数据构建昆虫信号通路。进一步利用iPathCons从17个昆虫转录组数据中构建了信号通路,并进行了比较分析,发现72%的人类疾病相关信号通路在昆虫中能够被发现,表明昆虫可作为人类疾病模型开展相关研究。通过文献搜索,在35个基因组已知的昆虫中检索出翅发育相关的基因,构建了昆虫翅发育的信号通路。结果表明,9个昆虫的翅发育信号通路是完整的,16个昆虫缺失Ser基因,6个昆虫缺失Vg基因,4个昆虫缺失Ser和Vg两个基因。分析发现,在同等测序深度下,信号通路“淀粉和糖代谢(Starchand sucrose metabolism)”在中华蜜蜂中是完整的,包含了所有9个基因,而在其他昆虫中仅发现了3个基因,表明与糖代谢相关的基因在中华蜜蜂中的表达量很高,这可能与中华蜜蜂采集花蜜有关。
  5、昆虫信号通路的数据库iPathDB和在线分析网站
  构建了52个昆虫信号通路的数据库iPathDB,搭建了昆虫信号通路网站,提供昆虫信号通路数据的查询和下载,网站地址为:http://ento.njau.edu.cn/iPath。该数据库共包含了6个目,12,074个昆虫信号通路,98,813个基因的注释,414,895条序列。目前,分子生物学已经进入到系统生物学时代,从信号通路和基因网络的层次研究“基因与性状”之间的关系,是未来发展趋势,iPathDB的构建为从信号通路水平开展相关分析提供了可能和重要的参考。
  (已选择0条) 清除
公   告

北京万方数据股份有限公司在天猫、京东开具唯一官方授权的直营店铺:

1、天猫--万方数据教育专营店

2、京东--万方数据官方旗舰店

敬请广大用户关注、支持!查看详情

手机版

万方数据知识服务平台 扫码关注微信公众号

万方选题

学术圈
实名学术社交
订阅
收藏
快速查看收藏过的文献
客服
服务
回到
顶部