似乎在未来,思想不再只是我们脑海中转瞬即逝的图像,而是可以成为高清视频。未来似乎越来越接近现实。一群技术精湛的研究人员刚刚打开了神经科学领域的潘多拉魔盒。为了帮助他,需要大量的人工智能。
“投影仪”大脑
庆嘉欣,陈子骄 e 周娟海伦来自新加坡国立大学和香港中文大学的研究人员介绍了一些相当有趣的研究工作。该团队将从功能磁共振成像 (fMRI) 获得的数据与稳定扩散生成人工智能相结合,创建 MinD视频,一种可以直接从大脑读数生成 HQ 视频的模型。
科幻小说的东西,你可能会说:但不,所有这些都严格记录在 arXiv 上,e 这是链接.
MinD-Video 究竟是如何工作的?
MinD-Video 不是一个简单的视频生成器,而是一个完整的系统,旨在使人工智能完成的图像解码与大脑完成的图像解码进行通信。但是如何训练这样的系统呢?
研究人员使用了一个公共数据集,其中包含观看视频的受试者的视频和相关的 fMRI 读数。 显然,这项工作的结果令人钦佩。
看到想法,我们到了那里
科学家发布的视频显示了真正令人着迷的结果。以一段以田野中的马为主题的原创视频为例。 MinD-Video 通过创建更有活力的马匹版本来“重建”它。在另一个案例中,一辆汽车驶过一片树林,重建的视频显示了沿着蜿蜒道路的第一人称旅程。
研究人员表示,重建的视频具有“高质量”,具有明确的动作和场景动态。 以及精度? 85%, 显着改善 以前的尝试.
读心术和HQ视频,下一步是什么?
“未来是光明的,潜在的应用是巨大的。从神经科学到 脑机接口,我们相信我们的工作可以产生重要影响”作者宣称。研究结果并不止于此:他们的工作强调了视觉皮层在视觉感知中的主导作用,以及他们的模型在训练过程中学习日益复杂的信息的能力。
这项新研究中使用的稳定扩散模型使可视化更加精确。 “我们的模型相对于其他生成模型(例如 le 甘,是制作更高质量视频的能力。它利用从功能磁共振成像编码器中学习到的表征,并使用其独特的扩散过程来生成更好地符合原始神经活动的 HQ 视频,”研究人员解释道。
总之,我们似乎真正进入了时代 读心术 通过人工智能。一个充满一千种可能性的领域,限制似乎只有想象力。