View on GitHub

rosalind_solve

Transitions and Transversions

背景知识

转换和颠换比例(transition/transversion ratio)

点突变,也称作单碱基替换,指由单个碱基改变发生的突变,可以分为转换(transitions)和颠换(transversions)两类。转换指嘌呤和嘌呤之间的替换,或 嘧啶和嘧啶之间的替换。颠换指嘌呤和嘧啶之间的替换。

问题

给定:两个长度相同的DNA序列s1和s2

输出:两个序列的转换和颠换比例

示例输入:

>Rosalind_0209
GCAACGCACAACGAAAACCCTTAGGGACTGGATTATTTCGTGATCGTTGTAGTTATTGGA
AGTACGGGCATCAACCCAGTT
>Rosalind_2200
TTATCTGACAAAGAAAGCCGTCAACGGCTGGATAATTTCGCGATCGTGCTGGTTACTGGC
GGTACGAGTGTTCCTTTGGGT

示例出:

1.21428571429

解决

s1 = 
s2 = 

transitionsmap = [("A","G"),("G","A"),("C","T"),("T","C")]
transversionsmap = [("A","C"),("C","A"),("T","G"),("G","T")
    ,("A","T"),("T","A"),("C","G"),("G","C")]

transitions = 0
transversions = 0
for i in range(len(s1)):
    pos = (s1[i],s2[i])
    if pos in transitionsmap:
        transitions += 1
    elif pos in transversionsmap:
        transversions += 1
    else:
        pass

print(transitions/transversions)

扩展

点突变,也称作单碱基替换,指由单个碱基改变发生的突变,可以分为转换(transitions)和颠换(transversions)两类。转换指嘌呤和嘌呤之间的替换,或 嘧啶和嘧啶之间的替换。颠换指嘌呤和嘧啶之间的替换。

由于转换没有改变碱基的结构,而颠换使碱基的化学结构发生较大变化,因此转换比颠换更加常见。在整个基因组上,一般转换和颠换比例平均为2,但是在编码区,比例会 高一些,经常超过3。有的转换不会改变编码的氨基酸,也不会改变蛋白质结构,因此被称为沉默替换。

转换和颠换比例是一个快速有效的基因组分析统计指标,因为可以快速定位编码DNA。