专栏名称: 生信帮
学生信,做分析,找生信帮(OmicsGang),官方网址(https://omicsgang.com/)
TodayRss-海外RSS稳定源
目录
今天看啥  ›  专栏  ›  生信帮

最全面T2T基因组组装方法总结

生信帮  · 公众号  · 科技自媒体  · 2024-08-02 08:53
    

主要观点总结

本文主要讨论了如何构建一个端粒到端粒(T2T)的基因组组装,包括测序数据、组装工具和组装策略的关键点。随着三代测序技术的进步和基因组组装工具的更新,越来越多的T2T甚至是完整基因组被发表。本文重点回顾了T2T组装的方法,包括测序数据的选择(以三代测序为主,二代测序为辅),推荐的数据量(PacBio HiFi数据50×以上,ONT ultralong数据,以及Hi-C数据100×以上)。针对这些数据有三种主要的组装策略。此外,还介绍了使用的组装工具以及初步组装后的后续分析和优化。最后,文章还提及了一些参考文献。

关键观点总结

关键观点1: 测序数据的重要性及选择

三代测序数据是T2T基因组组装的先决条件。必须采用三代测序为主,二代测序为辅的方法进行组装。PacBio HiFi数据和ONT数据具有不同的优点,HiFi数据测序准确性高,长度长,ONT数据具有超长的reads长度,在组装一些复杂的基因组区域时有天然优势。

关键观点2: 组装策略

基于数据主要有三种组装策略,分别是仅使用ONT数据组装,仅使用HiFi数据组装,以及ONT和HiFi数据混合组装。对于不同的物种和基因组,需要选择适合的组装策略。

关键观点3: 组装工具的选择和使用

目前针对三代测序数据的组装工具非常丰富。如Hifiasm,Canu,wtdbg2,Flye等可以处理HiFi数据,NECAT,NextDenovo等可以处理ONT数据。对于纯合二倍体来说,同时输入HiFi和ONT数据就足以产生不错的初步组装结果。

关键观点4: 初步组装后的后续分析和优化

初步组装后,需要基于N50和NG50,BUSCO值选择连续性和完整性更好的组装进行后续分析。使用GetOrganelle等工具将细胞器和rDNA序列组装,随后去除比对到的contigs。还需要利用HiFi或Illumina数据进行抛光,消除错误。

关键观点5: 其他注意事项和挑战

在T2T基因组组装过程中还面临一些挑战,如预测端粒序列、鉴定着丝粒位置等。需要使用特定的工具和方法来解决这些问题。


免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照