DE NOVO在分子生物学里作何解释
“从头”的意思,也就是fromthebeginning的意思。比如Denovosynthesisofcomplexmoleculesfromsimplemoleculesinbiochemistry,就是从头合成的意思。
DE NOVO在分子生物学里作何解释
denovo[di:'nəʊvəʊ]
n.重新,更始
来自于拉丁语。
如果原文是
http://www.sciencemag.org/cgi/content/abstract/1138659v1
“Strong”协会对于自闭症(患者)进行的“重新拷贝/调查记录数据变化”活动。
mutations多用variations,同义。
CopyNumberVariations(CNV)
拷贝数据突变。
autismspectrumdisorders(ASDs)
一种自闭症患者。精神病术语。
FDA 发布医疗器械 De Novo 分类最终规定
一文详解基因组denovo组装原理和实战
关于更多生物医疗大数据分析工具和软件的介绍和使用请看六点了官网。
内容导读
1、基因组组装
2、基于De-BruijnGraph的组装算法
3、SOAPdenovo的安装和使用说明:安装、说明、配置、运行
4、SOAPdenovo案例实战:数据下载、配置、运行、输出
基因组组装是基因组分析的关键,对物种起源与进化,挖掘功能基因进而研究疾病发生和发展具有重大意义。
然而由于目前市面上广为应用的二代测序技术获得的测序序列一般都较短,因此怎样通过短片段组装成完整的基因组成了亟待解决的问题。
基因组组装可分为基于参考基因组的组装(Mappingassembly)和从头组装(denovoassembly)。两者主要的差别在于是否存在已知的基因组参考序列作为参照。本文我们主要介绍的是denovo组装,即不依赖任何基因组参考序列相关信息而进行的序列组装。目前,应用于主流的基因组denovo组装的算法主要有两个[1]:OLC方法(Overlap-Layout-Consensus)和DBG方法(De-BruijnGraph)[2]。
而DBG方法的核心思想是将序列拼接问题转化为人们所熟知的欧拉图(EulerGraph)问题[3]。
DBG方法内存消耗相对较低,运算速度快,且准确率高。
目前主流的基因组装算法都是基于DBG方法改进设计的。
A:基因组DNA打断成小的片段,进行建库和双端测序。150~500bp的进行直接双端测序,长的片段2-10kb的则先进行环化再进行双端测序。
B:组装的核心部分,进行De-BruijnGraph的构建。构建De-Bruijn图的第一步是将测序readk-mer化,而所谓的k-mer是指将reads分成包含k个碱基的字符串,即拿一个k长度的窗口在整个read上1个碱基一个碱基的滑动,每次滑动窗口内部都会产生一个k大小的序列,即为一个k-mer,因此一般长短为m的reads可以分成m-k+1个k-mers。其中k一定是奇数,如果是偶数遇到回文序列可能会产生完全相同的k-mers。我们将k-mers作为图的节点,如果两个节点有K-1个共同重叠子集,就把两个节点连接在一起,这样就会形成De-BruijnGraph,可以看到该图可以很好地展现出序列的顺序信息。
C:进行图结构的精简。尽管前面步骤已经初步构建出图形,但是实际上由于测序错误,重复,杂合等原因,图上会出现很多类似翼尖(tips)、气泡(bubbles)等问题,因此还需要进一步简化。此处简化主要包含四个方面:1)去除tips(可能为测序错误导致的);2)去除低覆盖度的路径;3)解开微小重复的区域(可以通过read穿过来解决)4)合并bubbles气泡区(可能为测序错误,重复或者杂合导致的)。
D:拆分出contig。在重复的节点处剪断,输出contigs。
E:构建scaffolds。重新用reads和contigs进行比对,使用paired-end信息来把单一的contigs连接成scaffolds。1)pairedreads比对到contigs上,使临近的contig建立连接;3)paired-end信息的不同插入片段被用来一步步从短到长的建立scaffold.
F:最终是把多个scaffold组装成无GAP的基因组序列。
直接下载二进制:
mac链接:https://sourceforge.net/projects/soapdenovo2/files/SOAPdenovo2/bin/r240/SOAPdenovo2-bin-r240-mac.tgz/downloadlinux链接:https://sourceforge.net/projects/soapdenovo2/files/SOAPdenovo2/bin/r240/SOAPdenovo2-bin-LINUX-generic-r240.tgz/download