谷歌 刚刚介绍了双子座, 其人工智能的新前沿,其演示震惊了世界。 YouTube 上发布的一段视频显示了双子座对视觉和语言刺激的解读和反应的非凡能力。
这个看似简单的测试很快就变成了令人难以置信的展示,展示了该人工智能在理解周围世界并与周围世界互动方面的“近乎人类”的能力。
谷歌双子座:人工智能的巨大飞跃
Google Gemini 的出现(我们去年 9 月曾报道过) 在最初的公告中)标志着人工智能领域的一个转折点。双子座解释和响应不同视觉和语言信号的能力超越了我们迄今为止从人工智能技术中看到的任何能力。
这不仅仅是视觉识别或自然语言理解方面的突破。您在演示中看到的是这两种功能的极其无缝集成,使人工智能更接近于对人类环境的真正理解。
Google Gemini 演示:通向未来的窗口
首先,如果你错过了,你一定要看到它。她在这:
演示开始时,一名人类参与者要求 Gemini 描述他所看到的情况。 双子座很容易理解放置便利贴并在上面画一条即兴线条的简单动作。 但正是考验的继续,才揭示了双子座真正的力量。
随着图画演变为可识别的人物——一只鸭子,双子座不仅正确识别了物体,还提供了周围环境的细节,展示了对视觉环境的全面理解。
超越认知:互动与翻译
谷歌双子座的智能不仅仅局限于视觉解释。当参与者介绍游戏和翻译请求时,Gemini 都会准确回应。它能够将“鸭子”翻译成各种语言,并能够理解和参与简单的游戏,突显了交互性和多功能性的水平,而这在以前似乎是人类独有的。
像Google Gemini这样的技术的实际应用?呃。定义其界限是不可能的。从手术到教育,从家庭应用到创意产业,可能性似乎无穷无尽。 Gemini 可以彻底改变我们与技术交互的方式,使人机界面更加直观、自然和高效。
是的,但是我们什么时候才能使用它呢?
在对我们在演示中看到的内容表示由衷的钦佩之后,我还必须指出,到目前为止,来自谷歌的“脂肪”还很少。吟游诗人,被拖入与对手对抗的竞技场 ChatGPT OpenAI e 的 克劳德 Anthropic,被提出了太多的期望。 “现场”的技术不如竞争对手(仅限于语言模型:其他AI如Deepmind的) 伟大的成果即将到来)。 事实上,Google Gemini 仍然没有正式的发布日期,这让人有些沮丧。
也许这看起来“太先进了,难以置信”,也许是因为你迫不及待地想掌握它,但演示的时间已经结束了。 Google Gemini 演示有望克服当前人工智能技术的局限性:那么让我们看看它的实际效果。
别让我怀疑这只是另一种拖延时间的方式。
编辑8/12/2023: 给你。甚至不是故意的。在许多用户的坚持下,谷歌承认实际的 Gemini 演示是“使用电影剧照和短信”创建的,而不是让 Gemini 实时响应绘图或桌子上物体的变化,甚至预测它。这远没有视频让你相信的那么令人印象深刻,更糟糕的是,缺乏关于实际输入法的声明使得 Gemini 的准备情况相当值得怀疑,谷歌的行为也是如此。