赵泠的回答
因为演化不追求高效、不追求精简、没有提前设计、没有预设目标。来自逆转录病毒的序列、复制时出错而报废的序列等玩意,只要不对携带者的可育后代数量造成明显不利影响,就有概率在基因组里长期存在并积累。一些逆转录转座子可以徐徐增多。
不过,并非所有物种的 DNA 里都有大量非基因片段。许多原核生物的基因组缺少无用序列,DNA 病毒更是如此。人们曾删掉一些酵母菌的大部分无用序列并让其继续生存。
真核生物基因组里的许多非编码序列没有作用,可以按传统称为“垃圾 DNA”。人类基因组里约 90% 的序列看起来真的符合“垃圾 DNA”的描述。
历史上,一部分学者将没有功能或对生物体的健康没有积极影响的 DNA 描述为“垃圾 DNA”,他们对“没有功能”的标准不一。近年来,这造成了许多混乱:
- 一些研究发现了一些非编码序列的功能,媒体将其报道为“垃圾 DNA 原来有这样那样的作用”。但是,“一些非编码序列有功能”是已有数十年历史的理论,“垃圾 DNA”不是指“所有的非编码序列”;
- 一些研究发现特定的未参与调控基因表达的非编码序列在发生特定的突变后可以干扰基因表达,媒体也将其报道为“垃圾 DNA 原来有这样那样的作用”。但是,在实验动物身上将这样的非编码序列删掉不会引起这样的干扰。
- 看起来,人类基因组里编码蛋白质或对其进行各种调控的序列、以转录出的 RNA 发挥功能的序列加起来不到基因组全长的 10%,已经解析出具体功能的部分不到基因组全长的 6%,而媒体的报道经常让读者以为“垃圾 DNA 全都有用或至少大半有用”。
2012 年,DNA 元件百科全书(ENCODE)项目的研究人员用宽泛的定义(生物化学功能,能转录成 RNA、能结合组蛋白、涉及脱氧核糖核酸酶Ⅰ等全都算“功能”)宣布人类基因组约 80% 的部分有功能,这之中大多数功能序列既不编码蛋白质又不调控基因表达。
2017 年,Dan Graur 的计算显示,人类基因组中至少 75% 的序列不应该有直接的功能。
Graur 综合考虑了物种传代过程中面临的有害突变的风险性、人类历史进程中已知的人口稳定度和繁殖率,计算显示,假设人类基因组 100% 具有功能,按照现在知道的有害突变率范围,每对夫妇平均而言要生育 24 个以上的孩子,才能有 2 个孩子健康存活。这显然是不可能的。
- 如果人类基因组 80% 具有功能,那么每对夫妇平均需要生育 15 个孩子,才能有 2 个孩子健康存活。
- 当然,如果那所谓“功能”其实特别低效和次要,那么突变的危害也会缓解。
2022 年,一项研究对来自英国的 150119 人的基因组进行了测序,最终数据库包含来自 149960 个人的基因组序列,检测到 585040410 处 SNP、58707036 处短插入缺失,发现这些突变在基因组里的分布明显不均匀[1]:
- 外显子和其附近的调控序列的突变明显少于全序列平均水平。无功能区域的突变较多。突变最少的序列约有 13% 是外显子,其余是非编码序列,这些非编码序列不成比例地靠近外显子。
人类基因组里约 1% 的长度是外显子。你可以算出:
0.01/0.13 = 0.0769
你可以不太严谨地声称,这显示人类基因组里约 8% 的区域在较大幅度更改时影响生存。
在这问题下,就像全世界的类似问答一样,你会看到一些回答对“垃圾 DNA”做出不准确的描述。你可以注意到,人类的文化包含大量无用的或错误的模因。情况是类似的:模因的演化同样不追求高效、不追求精简、没有提前设计、没有预设目标。