如何根据基因测序分析结果找到通路

动植物基因组De?新测序分析(Novo sequencing analysis)又称从头测序分析(de novo sequencing analysis),是指在没有任何参考序列信息的情况下,对一种动植物进行测序,利用最新的生物信息学方法获得一个物种的基因组序列图谱,并进行基因组结构注释、功能注释、比较基因组学分析等一系列后续分析。第三代测序技术(以PacBio和纳米孔为代表)具有长阅读的特点,自2015在动植物基因组从头开始使用。这类测序分析的结果可广泛用于农业、林业、渔业、畜牧业、医学和海洋的研究。

图1不同测序技术的阅读长度、准确性和基因组连续性评估

三代测序技术原理

PacBio测序原理

采用边合成边测序的方法,以其中一条DNA链为模板,用DNA聚合酶合成另一条链,荧光信号进一步转化为碱基信号。同时,PacBio对CCS测序模式进行了升级,获得了长阅读长度的高保真(HiFi)15 kb阅读,从而提高了基因组组装的准确性。

图2三代PacBio测序原理

纳米孔测序原理

当单链DNA分子通过纳米孔时,每个核苷酸将获得不同的电流信号。记录每个孔中离子电流的变化,并转换成基于马尔可夫模型或递归神经网络的基序列。此外,超长阅读(ULRs)是ONT平台的另一个重要特征,并具有促进大基因组组装的潜力。

信息分析内容

德?Novo研究内容

基因组拼接的多软件拼接及拼接结果的评价

基因预测和注释编码基因预测;重复序列注释和转座组件分类;非编码RNA注释;假基因注释等。

Hi-C辅助基因组组装有效数据评估;重叠群聚类、排序和方向分析;贴装结果评估

生物学问题分析

比较基因组学研究

基因家族聚类;

系统进化树的构建;

基因家族扩张和收缩的分析;

物种分化时间的计算;

LTR形成时间的估计;

全基因组复制事件;

选择性压力分析

具体生物问题的分析结合组学研究方法,深入分析一个物种的生物问题。

草莓基因家族的聚类分析

薏苡全基因组复制事件分析

阿月浑子的系统进化树和基因家族收缩与扩张分析。

陆地棉亚基因组的线性分析

技术服务流程

样品交付

数据库构建排序

数据分析

发布报告

售后问题解答

产品优势

公司成立于2009年,深耕基因组测序领域11年,长期致力于成为精准的基因组组装专家;

拥有全球最主流的三代测序平台(PacBio测序平台和纳米孔测序平台),拥有数万个物种的双平台组装和基因组组装的丰富经验。

Hi-C染色质构象捕获技术库有效数据比例高,挂载效率高达99%。凭借丰富的多倍体物种研究经验,结合第三代基因组组装获得染色体水平基因组的同事进一步提高了基因组组装的质量。

凭借自主研发的领先的基因组测序和分析技术,获得了23项发明专利和超过150项核心软件著作权。

项目经验示例

合作条款案例

案例1

基于更新的亚洲棉A基因组对243份二倍体棉花重要农艺性状的研究

243份二倍体棉花材料的再测序?基于更新的基因组识别关键农艺性状的遗传基础

期刊:自然遗传学

影响因子:27.125

发布单位:中国农业科学院棉花研究所、北京百迈克生物科技有限公司等。

出版年份:2065438+2008年5月

研究背景:

棉花是研究植物多倍体的宝贵资源。亚洲棉和草本棉的祖先是现代异源四倍体棉花亚基因组的供体。本研究利用三代PacBio和Hi-C技术重新组装了高品质亚洲棉基因组,分析了243份二倍体棉花种质的群体结构和基因组分化趋势,确定了一些有助于棉花皮棉产量遗传改良的候选基因位点。

研究结果:

1,亚洲棉第三代基因组组装;

亚洲棉的基因组组装是结合三代测序进行的,Hi-C * * *获得142.54 Gb,组装出1.71 Gb亚洲棉基因组,重叠群N50=1.1 Mb,最长的重叠群为12.37 Mb。利用Hi-C技术将1573 Mb的组装数据定位到13条染色体上。与已发表的基因组相比,当Hi-C数据与更新后的基因组比较时,非对角不一致性明显减少(图1 a-b)。

图1亚洲棉花基因组两个版本的HI-C数据比较

2.二倍体棉花群体的遗传进化分析;

对230份亚洲棉花和13份棉草进行了重新测序。基因组比较、系统进化树、群体结构分析、PCA、LD和选择性清除分析表明,亚洲棉和棉草(a)与雷蒙棉同时分化。亚洲棉花起源于中国南方,然后传入长江和黄河流域。大多数具有驯化相关特征的种质经历了地理隔离(图2)。

图2二倍体棉花的群体进化和群体结构分析

3.亚洲棉花全基因组关联研究(GWAS):

对来自不同环境的11重要性状进行全基因组关联研究分析,鉴定出亚洲棉11重要农艺性状的98个显著相关位点。GaKASIII的同义替换(半胱氨酸/精氨酸替换)导致棉籽中的脂肪酸组成(C16:0和C16)。发现棉花枯萎病抗性与GaGSTF9基因表达的激活有关。选取亚洲棉花种质中的158份皮棉和57份无皮棉材料进行GWAS相关分析,发现了与表皮毛和纤维发育相关的信息(图3)。

二倍体棉花的群体进化和结构分析。

研究结论:

通过三代测序+Hi-C技术完成了亚洲棉的基因组重组,基因组组装指数从72?Kb增加到1.1 Mb,为后续亚洲棉的群体遗传学等相关研究奠定了基础。通过群体遗传进化的相关性分析,发现亚洲棉和草棉(A型)与雷蒙棉(D型)同时分化,证明亚洲棉起源于中国南方,传入长江和黄河流域。通过整合GWAS和QTL分析方法,定位了亚洲棉脂肪酸含量、抗病性和皮棉生长发育相关基因并验证了其相关功能,促进了亚洲棉复杂农艺性状的改良。

案例二,

二倍体、野生和栽培四倍体花生的比较基因组分析揭示了亚基因组的不对称进化和改进。

花生的比较?二倍体和培育的四倍体基因组?揭示花生不对称亚基因组进化和改良

期刊:高级科学

影响因子:15.804

发布单位:河南农业大学、北京百迈克生物科技有限公司

出版年份:2019 11。

研究背景:

花生作为我国重要的经济作物,是提供重要蛋白质和油脂的基础。花生属包括30个二倍体品种,1异源四倍体野生花生(花生)和1栽培花生(花生)。野生四倍体花生作为改良栽培花生农艺性状的重要野生资源供体,一直是国内外学者的研究热点。对花生属唯一的野生异源四倍体花生进行了基因组研究。