在
分子生物学中,开放阅读框(Open Reading Frame, ORF)从起始密码子开始,是
脱氧核糖核酸序列中具有编码蛋白质潜能,结束于
终止密码子连续的
碱基序列。
由于密码子(codon)读写起始位点的不同,DNA序列可能按六种ORF阅读和翻译(每条链三种,对应三种不同的起始位点)。ORF识别则是确定哪种开放阅读框对应真正的
多肽编码序列的过程。
在
真核生物中,ORF可能跨过
外显子,在mRNA中进行拼接。基因中的ORF包含并位于开始编码与终止编码之间,由于一段DNA或
核糖核酸序列有多种不同读取方式,因此可能同时存在许多不同的开放
阅读框架。
开放阅读框[open reading frame,ORF] 是
结构基因的正常
核苷酸序列,从起始密码子到
终止密码子的阅读框可编码完整的多肽链,其间不存在使翻译中断的终止密码子。
在mRNA序列中,每三个连续
碱基(即三联“密码子”)编码相应的氨基酸。其中有一个起始密码子AUG和三个终止密码子UAA,UAG,UGA。
核糖体从起始密码子开始翻译,沿着mRNA序列合成多肽链并不断延伸,遇到终止密码子时,多肽链的延伸反应终止。由于读写位置不同,ORF在两条链上具有六种可能性。
现在有很多找ORF的软件,包括在线的,如:ORF Finder的功能ORF Finder被用来预测已存在的
编码区的小基因序列。它较早应于序列设计,应用优于长片断、高质量的匹配。ORF Finder把提交序列分成六个亚区,并对这六个阅读框分别进行默认,赋予每个亚区一个确定其编码内容的度量,如果可能将对每一亚区进行进一步分析。每个亚区按照已有的分类结果,被随机提交给查找它们是否编码
蛋白质的特定测试收集器。最后只有那些具有编码潜能的重要区域才被报道。除此之外,ORF Finder也可用于大规模的开放式阅读框寻找,支持对整个
基因组的分析。