看看我在想什么：将思想转化为 HQ 视频的 AI

28 2023五月

技术

一组研究人员开发了一种人工智能模型，能够直接从大脑活动中重建高清视频：我们几乎在读心术。

似乎在未来，思想不再只是我们脑海中转瞬即逝的图像，而是可以成为高清视频。未来似乎越来越接近现实。一群技术精湛的研究人员刚刚打开了神经科学领域的潘多拉魔盒。为了帮助他，需要大量的人工智能。

庆嘉欣，陈子骄 e 周娟海伦来自新加坡国立大学和香港中文大学的研究人员介绍了一些相当有趣的研究工作。该团队将从功能磁共振成像 (fMRI) 获得的数据与稳定扩散生成人工智能相结合，创建 MinD视频，一种可以直接从大脑读数生成 HQ 视频的模型。

科幻小说的东西，你可能会说：但不，所有这些都严格记录在 arXiv 上，e 这是链接.

MinD-Video 不是一个简单的视频生成器，而是一个完整的系统，旨在使人工智能完成的图像解码与大脑完成的图像解码进行通信。但是如何训练这样的系统呢？

研究人员使用了一个公共数据集，其中包含观看视频的受试者的视频和相关的 fMRI 读数。显然，这项工作的结果令人钦佩。

科学家发布的视频显示了真正令人着迷的结果。以一段以田野中的马为主题的原创视频为例。 MinD-Video 通过创建更有活力的马匹版本来“重建”它。在另一个案例中，一辆汽车驶过一片树林，重建的视频显示了沿着蜿蜒道路的第一人称旅程。

研究人员表示，重建的视频具有“高质量”，具有明确的动作和场景动态。 以及精度？ 85%, 显着改善以前的尝试.

“未来是光明的，潜在的应用是巨大的。从神经科学到脑机接口，我们相信我们的工作可以产生重要影响”作者宣称。研究结果并不止于此：他们的工作强调了视觉皮层在视觉感知中的主导作用，以及他们的模型在训练过程中学习日益复杂的信息的能力。

这项新研究中使用的稳定扩散模型使可视化更加精确。 “我们的模型相对于其他生成模型（例如 le 甘，是制作更高质量视频的能力。它利用从功能磁共振成像编码器中学习到的表征，并使用其独特的扩散过程来生成更好地符合原始神经活动的 HQ 视频，”研究人员解释道。

总之，我们似乎真正进入了时代读心术通过人工智能。一个充满一千种可能性的领域，限制似乎只有想象力。

詹卢卡·里乔（Gianluca Riccio）Melancia adv 创意总监、文案撰稿人和记者。它是意大利未来研究所、世界未来协会和 H+ 的一部分。自 2006 年以来，他负责指导意大利未来学资源 Futuroprossimo.it。

Fatto Quotidiano 上的 FP
阿尔贝托·罗比亚蒂 (Alberto Robiati) 和吉安卢卡·里奇奥 (Gianluca Riccio) 引导读者了解未来的情景：我们必须创造一个可能的明天的机会、风险和可能性。

关于同一主题：

最后