每当有人谈论“人工智能 在拐角处”,准备在一切方面超越我们,然后我读了一项最近的研究,发现地球上最先进的人工智能系统甚至不能告诉我今天是星期几,时钟显示几点。 这不是很讽刺吗? 这些可以生成逼真图像、在扑克牌游戏中获胜、在我们说完句子之前完成我们句子的数字巨头,在简单的日历面前却完全迷失了方向。
这就像看着一位不会系鞋带的量子物理学家:在实验室里很聪明,但在日常琐事上却很笨拙。日历是我们的祖先几千年前掌握的物品,但对于这些所谓的“想要更高级”的智慧生物来说,它仍然是一个谜。但为什么?
机器奇怪的暂时无能
你是否想过,为什么一个六岁的小孩能够读懂模拟时钟(当然,如果我们教他的话),而像超级计算机这样强大的计算系统却会出现故障?根据大学进行的研究 爱丁堡最先进的人工智能能够正确解读手的位置 不到25%的时间。 坦白说,这是一个令人尴尬的结果。
当指针被风格化或者罗马数字取代阿拉伯数字时,问题变得更加复杂。想想看,我们人类几千年前就用日晷解决了这个问题;今天我们甚至拥有可以测量月相和心率的手表,但人工智能似乎还停留在石器时代。
即使有或没有秒针都不会改变人工智能的性能,这表明问题比看起来的更为严重。这不仅仅是一个视觉识别的问题,而且还是一个空间和上下文解释的问题。 但这还不止于此。
日历:数字巨头面临的难题
我发现特别有趣的是日历如何成为这些人工智能难以逾越的障碍。研究人员发现,即使是最好的模型 他们有 20% 的时间会计算错误的日期。 想象一下,依靠人工智能来安排重要的约会,而误差幅度如此之大:你可能会有五分之一的时间错过约会。
由 罗希特(Rohit Saxena) 的 信息学院 他们强调,这些机器在完成小学生可以轻松完成的任务方面表现得非常糟糕。对于擅长生成复杂文本的系统来说,识别假期或计算未来和过去的日期似乎是深奥的概念。
还 艾约·杰玛参与这项研究的另一位研究人员指出了这种情况的讽刺之处:为复杂推理而设计的系统在面对日常任务时却遇到了困难。就像获得诺贝尔奖一样 (字面上地) 不知道如何安装灯泡。
对我们的数字化未来的影响
想象一下,如果家庭自动化系统无法正确管理时间表;虚拟助手会在凌晨 3 点叫醒你,让你以为该上班了;机器人会晚一天到达约定地点。这听起来像一部喜剧的情节,但这却是真正的艺术水平。
这些看似微不足道的问题对于将人工智能融入时间敏感的应用程序具有巨大的影响。想想日程安排助理、自主机器人或视障人士的工具:它们都依赖于对时间和日期的正确解读。
该研究将于 28 年 2025 月 XNUMX 日在新加坡举行的“大型语言模型的推理与规划”研讨会上发表,强调了机器能力方面的巨大差距。如果我们真的希望人工智能成为我们日常生活中不可或缺的一部分,那么现在就该让它学会看钟表了。
最终,尽管这些系统在其他领域可能非常出色,但它们表明,实现真正与我们自己的智能相当的智能的道路仍然很漫长。或许,正是在这些日常的细小的无能为力中,体现出了人与机器之间最深的差别。这一次,我几乎很高兴,时间之手对他们来说仍然是一个谜。