机器学习现在可以生成不存在的人的真实基因组

5二月2021

技术

我们已经看到GAN会生成面孔，伪造的传记，歌曲。现在，他们还产生了人工基因组，与真正的基因组几乎没有区别。

在新算法和IT进步之间，机器现在可以学习越来越复杂的模型。它们会生成高质量的合成数据，例如逼真的图像，甚至是虚构的人的简历。

现在在国际期刊上发表的研究 PLOS遗传学 展示了机器学习在生物识别数据上的高级应用。该系统从现有的生物库中生成不属于真实人类但具有真实基因组特征的整个人类基因组块。

绕过隐私问题

“现有的基因组数据库是宝贵的资源生物医学研究，“ 他说 布拉克·耶尔门，该研究的第一作者，塔尔图大学现代群体遗传学初级研究员。 “问题在于，出于合理的道德考虑，它们无法公开访问或受到漫长而冗长的执行程序的保护。这给研究人员造成了重大的科学障碍。机器生成的基因组，即“人工基因组”，可以帮助我们在安全的道德框架内克服这个问题。”

多学科团队进行了多项分析，以评估机器学习生成的基因组与真实基因组的质量。 “值得注意的是，这个基因组模仿了我们在真实人群中观察到的复杂性，并且对于大多数特性来说， 它们与用于训练我们算法的生物库的其他基因组没有区别。除了一个细节：它们不属于任何基因捐赠者。” 博士卢卡·帕加尼（Luca Pagani），该研究的资深作者之一，Mobilitas Pluss研究员。

机器生成的基因组，即“人工基因组”，可以帮助我们在安全的道德框架内克服问题
布拉克·耶尔门

基因组是真正的原始基因组还是“复制品”？

该研究还涉及评估人工基因组与真实基因组的接近程度，以验证原始样本的隐私是否得到保护。 “虽然检测数千个基因组的隐私泄露可能看起来像大海捞针，但结合多种统计措施使我们能够仔细检查所有模式。有趣的是，对复杂分散模式的详细探索反过来又导致了评估方面的其他改进。甘并将推动机器学习领域的发展。”医生这样说 弗洛拉·杰伊（Flora Jay），法国国家科学研究中心CNRS的研究协调员和研究员）。

总而言之，已经提供了机器学习方法伏地，传记和许多其他功能对少数想象中的人类。现在，我们也对它们的生物学有了更多的了解。这些具有逼真的基因组的虚构人类可以充当实验台，代替未公开获得的真实基因组。

这项研究可以消除基因组学研究的主要障碍，特别是对于代表性不足的人群。

詹卢卡·里乔（Gianluca Riccio）Melancia adv 创意总监、文案撰稿人和记者。它是意大利未来研究所、世界未来协会和 H+ 的一部分。自 2006 年以来，他负责指导意大利未来学资源 Futuroprossimo.it。

报告研究、发现和发明， 联系编辑组！ 在 Whatsapp 上关注 Futuro Prossimo： 独家新闻和更新（免费）。

Fatto Quotidiano 上的 FP
阿尔贝托·罗比亚蒂 (Alberto Robiati) 和吉安卢卡·里奇奥 (Gianluca Riccio) 引导读者了解未来的情景：我们必须创造一个可能的明天的机会、风险和可能性。

关于同一主题：

最后

机器学习现在可以生成不存在的人的真实基因组

技术

分享

在新算法和IT进步之间，机器现在可以学习越来越复杂的模型。它们会生成高质量的合成数据，例如逼真的图像，甚至是虚构的人的简历。

绕过隐私问题

基因组是真正的原始基因组还是“复制品”？

这项研究可以消除基因组学研究的主要障碍，特别是对于代表性不足的人群。

奥威尔超市：面部识别购物需要重新考虑

VASA-1，微软的人工智能仅用一张照片创建超现实的角色

Amodei，Anthropic：“人工智能很快就能自主复制和生存”

电池回收2.0，墓碑上的主题是“电动汽车是还是不是？”

合成但有生命：细胞挑战人工与生物之间的界限

德国，一年前我们告别了核电：为什么他们不会回去

赫库兰尼姆揭示柏拉图的秘密：重建他的结局

无尽地回收塑料：新的先进回收技术

机器学习现在可以生成不存在的人的真实基因组

分享

在新算法和IT进步之间，机器现在可以学习越来越复杂的模型。 它们会生成高质量的合成数据，例如逼真的图像，甚至是虚构的人的简历。

绕过隐私问题

基因组是真正的原始基因组还是“复制品”？

这项研究可以消除基因组学研究的主要障碍，特别是对于代表性不足的人群。

在新算法和IT进步之间，机器现在可以学习越来越复杂的模型。它们会生成高质量的合成数据，例如逼真的图像，甚至是虚构的人的简历。