开题报告内容:(包括拟研究或解决的问题、采用的研究手段及文献综述,不少于2000字)
一、研究背景幽门螺旋杆菌(Helicobacterpylori26695)是一种寄生在人体胃粘膜上的病原体,人体感染后产生急性炎症反应和上皮细胞损伤,并逐渐发展为胃炎、消化道溃疡、胃癌。1994年世界卫生组织/国际癌症研究机构(WHO/IARC)将幽门螺杆菌定为Ⅰ类致癌原。幽门螺旋杆菌全基因组的测序和注释工作也告一段落,总共包含1627个基因,编码的具有特定功能的蛋白有1573个。另一方面,伴随着丰富的生物数据库的开发,其中蕴含了庞大的信息资源,为研究生物体的生理特征、代谢表型、病理分析提供了基础。目前幽门螺旋杆菌的代谢网络模型有Palsson实验组2002年和2005年构建的模型,近些年,随着科研的进步,幽门螺旋杆菌的基因组数据也变得更加完善,因此,本论文首先要重构这样的代谢网络模型,利用perl语言编程技术对三大幽门螺旋杆菌的权威数据库信息进行整合,重构出新的代谢反应数据库,并在此基础上不断完善和补充,并且利用COBRA(constraintsbasedreconstructionandanalysis)工具包对这个网络进行仿真分析,通过比较仿真计算结果与实际生长表型,进一步改善模型,得到一个高质量的代谢网络模型,供代谢工程或物种间进化研究。
1.代谢工程的发展和现状
代谢工程是组成系统生物学中的一个学科,它研究的关键是要通过对代谢网络的系统分析了解细胞代谢网络结构及其调控机制,在充分了解的基础上重新设计代谢系统。由于代谢网络是一具有复杂非线性调控机制的网络,基因、酶和代谢之间的调控和变化并非是简单的线性关系,这使得人们在一种简单线性关系的指导下利用代谢工程技术改造菌种时常常失败。因此要尽量接近代谢网络的实际情况和成功地控制代谢网络的通量分布就必须要建立模型对代谢网络进行定量系统的分析;而建立代谢网络模型的基础就是建立代谢反应数据库。
1.构建全基因组代谢网络模型的研究现状
近来生物网络模型正在向深层次发展,已有的网络模型包括代谢网络、转录调控网络、信号转到网络等。在这些网络中,由于代谢网络的信息相对完备和可靠,因而成为生物信息学的一个重要研究对象。在过去十几年里,代谢网络模型研究领域有了非常迅速的发展,具统计,目前已有89个物种的134个全基因组代谢网络重构完成。随着计算模拟算法的发展,全基因组代谢模型已经能够进行相关的模拟预测。代谢网络重构已经成为研究代谢系统生物学不可或缺的工具。全基因组代谢网络的构建方法已经相对成熟,包括以下几个阶段:初始模型的建立;模型完善;模型验证;进一步完善模型,后四个阶段循环反复,直至得到一个准确、可靠的模型。模型的构建是一个反复迭代的过程,例如大肠杆菌的代谢网络重构在过去二十年里一直被扩大和完善。通常,代谢网络重构过程耗时耗力,时间跨度从几个月到数年。随着代谢网络重构的生物体数量的增加,找到自动化或半自动化的方法直接从基因组注释来重构代谢网络模型的需求一直在加大。尽管相关经验和知识越来越多,但至今为止,仍然无法完全自动重构成熟的高质量代谢网络。手工构建为主同时尽可能多的辅以计算机技术是目前代谢网络模型的主要重构方式。2.全基因组代谢网络模型的insilico分析研究现状随着重构全基因组代谢网络数量的不断扩大,人们对于网络自动分析的研究也逐渐深入。代谢网络分析工具从最初的利用LINDO等数学分析工具的线性规划工具包,到现在已经有很多专门针对生物代谢网络的软件和工具包开发出来。本课题拟利用的COBRA是Palsson实验组开发的免费网络分析工具包,在Matlab环境下运行,使用基于约束的方法对全基因组网络模型进行细胞表型的量化预测,它包含了多种FBA算法,能够完成通量分布计算、不同底物生长表型预测、基因敲除分析、通量可变性分析(系统鲁棒性分析、表型相平面分析)、前体必要性分析、副产物产量计算等多种分析功能,2011年开发的新版本COBRAToolboxv2.0又增加了空白填补、13C分析、组学分析和可视化等功能。
二、实验内容和意义
1研究内容1.1幽门螺旋杆菌基因组代谢相关注释信息的搜集从世界上较为权威的BIGG、KEGG、JCVICMR、ExPasyEnzyme、BioCyc等数据库提取幽门螺旋杆菌(Helicobacterpylori26695)相关的代谢信息,整合、标准化格式后存入文本。1.2三个数据库的比对以BIGG数据库为基础,将三个数据库的代谢信息相比对,建立包含确定反应的新数据库。1.3初始模建对于上一步中不确定的代谢反应,查阅相关文献,做补充和修改完善新数据库,形成代谢网络的初始模型。1.4Gap分析与填补由于一些代谢途径的不完整,导致初始模型存在很多缺口(Gap),应用COBRA工具包里的GapFind发现初始模型中的gap,并填补。PathwayTools可辅助查找。1.5基于模型的模拟分析和初步预测将代谢网络信息转化为数学模型,在基于Matlab环境下的COBRA工具包进行相关仿真与分析,计算应用流平衡分析方法(FBA)。例如:计算生长速率、鲁棒性分析、表型相平衡分析、基因敲除模拟实验。1.6进一步完善模型根据模拟计算的结果与实验结果比较,进一步完善模型,得到高质量的代谢网络模型。
2研究意义
今年来越来越多的证据显示,幽门螺旋杆菌的感染和慢性胃炎以及消化性溃疡的形成有密切关系,此外,有许多资料显示幽门螺旋杆菌的持续感染是导致形成胃癌和胃黏膜淋巴癌的主要因素之一,为人类重要病原。为了进一步了解幽门螺旋杆菌,就需要了解幽门螺旋杆菌的遗传背景和生理性状及功能,而这些都是建立在明确代谢网络的基础上。目前国际上还没有比较完善的幽门螺旋杆菌的代谢反应数据库,因此,本论文就以重构代谢反应数据为目的,并在此基础上不断对其完善和补充,以期达到高质量的最终目标。
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。