开放阅读框
结构基因的正常核苷酸序列
分子生物学中,开放阅读框(Open Reading Frame, ORF)从起始密码子开始,是脱氧核糖核酸序列中具有编码蛋白质潜能,结束于终止密码子连续的碱基序列。
由于密码子(codon)读写起始位点的不同,DNA序列可能按六种ORF阅读和翻译(每条链三种,对应三种不同的起始位点)。ORF识别则是确定哪种开放阅读框对应真正的多肽编码序列的过程。
真核生物中,ORF可能跨过外显子,在mRNA中进行拼接。基因中的ORF包含并位于开始编码与终止编码之间,由于一段DNA或核糖核酸序列有多种不同读取方式,因此可能同时存在许多不同的开放阅读框架
词语释义
开放阅读框[open reading frame,ORF] 是结构基因的正常核苷酸序列,从起始密码子到终止密码子的阅读框可编码完整的多肽链,其间不存在使翻译中断的终止密码子。
在mRNA序列中,每三个连续碱基(即三联“密码子”)编码相应的氨基酸。其中有一个起始密码子AUG和三个终止密码子UAA,UAG,UGA。核糖体从起始密码子开始翻译,沿着mRNA序列合成多肽链并不断延伸,遇到终止密码子时,多肽链的延伸反应终止。由于读写位置不同,ORF在两条链上具有六种可能性。
例子
以一段5'-UCUAAAGGUCCA-3'序列为例,此序列共有3种读取法:
UCU AAA GGU CCA
CUA AAG GUC
UAA AGG UCC
由于UAA为终止密码子,因此第三种读取法不具编译出蛋白质的潜力,故只有前两者为开放阅读框架
软件介绍
现在有很多找ORF的软件,包括在线的,如:ORF Finder的功能ORF Finder被用来预测已存在的编码区的小基因序列。它较早应于序列设计,应用优于长片断、高质量的匹配。ORF Finder把提交序列分成六个亚区,并对这六个阅读框分别进行默认,赋予每个亚区一个确定其编码内容的度量,如果可能将对每一亚区进行进一步分析。每个亚区按照已有的分类结果,被随机提交给查找它们是否编码蛋白质的特定测试收集器。最后只有那些具有编码潜能的重要区域才被报道。除此之外,ORF Finder也可用于大规模的开放式阅读框寻找,支持对整个基因组的分析。
参考资料
目录
概述
词语释义
例子
软件介绍
参考资料