绑定机构
扫描成功 请在APP上操作
打开万方数据APP,点击右上角"扫一扫",扫描二维码即可将您登录的个人账号与机构账号绑定,绑定后您可在APP上享有机构权限,如需更换机构账号,可到个人中心解绑。
欢迎的朋友
万方知识发现服务平台
获取范围
  • 1 / 1
  (已选择0条) 清除 结果分析
找到 1 条结果
[硕士论文] 袁亚洲
生物医学工程 电子科技大学 2017(学位年度)
摘要:基因识别是对DNA序列进行分析,获取其中重要信息的第一步。目前测序技术的发展使得测序数据呈爆发式增涨,然而实验方法无法快速有效的从海量信息中获取知识,基于此运用计算机技术来识别基因的方法应运而生。在2015年,我们课题组研发了原核生物基因识别程序ZCURVE3.0,该算法是基于Z曲线理论,采用新的机器学习算法SVM,增加新的特征变量,并且对内部参数进行进一步的优化,使得该识别算法更加快速准确高效。在预测出基因后,还需要知道其相应编码的蛋白质,于是我们基于ZCURVE3.0算法,对其进行进一步的升级,添加相关的功能,使得其成为完善的可视化集成系统。
  在本基因识别可视化系统中,第一部分是对ZCUREV3.0的功能进行可视化(BAGA)实现,其保留了相应识别算法的所有功能。在通过对50个原核生物的全基因组进行测试,选取比对阈值,排除伪基因,同时使得删除的正确基因数尽可能少,那样基本保持正确的基因数不变。在与GenBank提供的总的基因数相比,BAGA的预测基因识别率为97.60%,预测结果的特异度为96.74%,与ZCURVE3.0的特异度94.21%相比有2%的提升。BAGA附加预测率为3.34%,比ZCURVE3.0(6.08%)下降接近3%。附加预测率的降低,表明其预测错误的基因数目相比ZCURVE3.0有更进一步的减少。第二部分是对于ZCURVE3.0和Prodigal两个基因预测软件联合方法(BAGA2.0)的实现,通过保留两者预测相同的基因,对不同的基因进行序列比对,调节合适的参数,保留比对得分较高的基因,将这两部分的基因作为最终联合预测的基因。BAGA2.0对应的识别率为98.73%,特异度为96.09%。这两者性能,都比ZCURVE3.0效果要好。另一方面,BAGA2.0的附加预测率为4.08%比ZCURVE3.0(6.08%)要低。综合来看,联合两者来识别细菌的基因性能要更优。此外,虽然BAGA2.0的特异度比BAGA要低,其附加预测率要大,但是其识别率和准确度却更佳。
  在本文中采用BLAST序列比对实现了对于预测的基因进行功能注释,对于系统中实现的两部分的预测结果都能够实现注释,而且能够选择快速注释和完全注释两者不同方式。同时,集成基因组岛预测程序。我们将此完善的集成软件编译成各种不同系统的版本,使用者能够访问http://cefg.cn/zcurve-visualization/下载,并免费使用。
  (已选择0条) 清除
公   告

北京万方数据股份有限公司在天猫、京东开具唯一官方授权的直营店铺:

1、天猫--万方数据教育专营店

2、京东--万方数据官方旗舰店

敬请广大用户关注、支持!查看详情

手机版

万方数据知识服务平台 扫码关注微信公众号

万方选题

学术圈
实名学术社交
订阅
收藏
快速查看收藏过的文献
客服
服务
回到
顶部