这项新发现虽然令人开心,但也让科学家很困惑,因为大王花似乎仍然在制造色素体的隔间,莫利纳说:“当我们用电子显微镜进行研究时,我们发现了色素体,但里面却是空的,这种情况很诡异。”
大花草科的植物清除不需要的基因听起来似乎是为了让自己基因体变得更小和更有效率,但矛盾的是寄生花的基因体其实很大:估计总共有3.2到3.5千兆碱基(gigabases)的DNA,大约与人类差不多,那到底是什么东西塞满了它们的基因体?
首先,里面有偷来的基因。戴维斯的研究团队估计,大花草科的植物至少有1.2%基因源自过去与现在的其他物种,通常都是从宿主身上偷来的。这听起来可能没什么,但这种程度的基因转移对细菌以外的生物来说相当罕见。因此,即使只有百分之一的基因以这种方式产生,科学家还是感到非常惊讶。
由于这些寄生植物数千年来不断在窃取基因,它们的基因体就像是一个“巨大的DNA墓地”。研究团队仔细挖掘了这片墓地,并将10种潜在宿主的藤蔓基因体进行比对,科学家得以追溯大花草科的过去,蔡丽敏说:“这些水平转移的基因仿佛是DNA化石。”
科学家在这些DNA化石中发现了“可能可追溯至白垩纪中期灭绝的宿主”。如今,现存已知的大花草科大约有40种,它们都寄生在崖爬藤属(Tetrastigma)的藤蔓上。但在崖爬藤属以前,大花草科的成员似乎曾经寄生在胡椒属植物上,当然也顺便窃取了宿主的基因。这种生态历史几乎无法从石头化石中发现,因为寄生植物的花并不会开很久,而且其细丝状的形体不太可能变成化石。
然而,这些被偷的基因只是寄生花庞大基因体中的一小部分。它的大部分是被称为转座子(也称为“跳跃基因”)的DNA序列的复制所组成,萨克顿说:“大花草科的基因体中有90%是重复的。”
由于基因体中的高度重复,戴维斯花了很长时间才为寄生花拼凑出一个基因体草图。直到大约10年以前,基因体测序技术很容易被重复序列所阻碍,萨克顿说:“就像是在晴朗无云的蓝天拼拼图,每一块都是完全相同的形状,根本没办法完成。”而利用目前的基因体测序技术能处理更长的DNA片段,但即便如此也只能拼凑估计约40%的寄生花基因体-因为其余的部分依然重复性太高。
植物生物学家萨马・沙希德(SaimaShahid)研究了植物的转座子功能,他指出大花草科拥有丰富的转座子很惊人,数量大约为菟丝子的两倍。在其他寄生植物的测序中,主导元素为“反转录转座子”,它通过转录成RNA在基因体中移动。然而,大王花的主导元素却是DNA转座子,这些转座子不断重复复制并粘贴自己到基因体之中,沙希德说:“这是非常耐人寻味且不寻常的现象。”
为什么寄生花一开始就有这么多“跳跃基因”呢?至今科学家还没有定论,但答案或许会改变人类对寄生植物基因体的理解。
转座子被认为是“自私的”基因;它们甚至不惜牺牲自己拥有的基因体来进行复制。因此,宿主的基因体通常会控制住它们,大多数时候,他们的目标是让基因默化。因此,若不是大花草科的生长规则出现问题,就是寄生植物发现了让这些元素跳跃的好处。
科学家推测,大花草科的转座子过剩可能是生长环境孤立导致的结果,由于大花草科只寄生在崖爬藤属的藤蔓上,每一片藤蔓对它们来说都像是一个与世隔绝的孤岛,在生长受限的小种群中,很少有来自外界的基因流动,因此,即使是有害的转座子基因复制也可能随着时间演进而积累,直到基因体结构变得过于庞大。