意大利时间晚上 21 点,OpenAI 在 YouTube 上进行了现场直播,展示了其新产品 GPT-4,该版本的水平明显高于几个月前推出的前一个版本。现在的“对话专家”ChatGPT不仅功能更强大,而且还能“看”。而这一因素可以导致人工智能的发展空前加速。
从 GPT-3 到 GPT-4 大海经过
ChatGPT 是 OpenAI 的“电子小天才”,可以用文本和代码回复消息,它已迅速成为历史上增长最快的应用程序,每月拥有超过 100 亿用户。
与它的发展同时,用户社区和用户指南也诞生了(我还发布了一个:如果你有兴趣 你可以在亚马逊上找到它)甚至是“原始职业”, 提示工程师.
然而,尽管 ChatGPT 取得了成功,但仍有一些问题需要解决。他倾向于“产生幻觉”,生成听起来合理但事实并非如此的文本。它反映了偏见,有时它“刺穿”了其创造者预见的非法短语的过滤器。
新的基于 GPT-4 的版本解决了大部分这些问题,并提高了(很多)性能。
睁开眼睛看世界
该模型的最大新颖之处在于它能够响应文本和视觉提示。想想各种可能性:识别一幅画的作者、解释一个模因的含义、为照片创建标题……事实是,可能的应用领域扩展得如此之大,以至于可能的列表变得巨大。
但 GPT-4 并不止于此:它也比其前身更加“智能”,在多项测试中超越了它的结果,例如针对法律专业人士的测试 (法学院入学考试),那些用于进入美国大学的(SAT), 还有很多其他的。 OpenAI 声称 GPT-4 准确度提高 40% 在生成真实内容方面 倾向减少 82% 响应非法提示(再见“邪恶”版本的聊天机器人)。
剩下的都是历史
我们会对生成人工智能将获得越来越多(而且越来越快)的令人难以置信的特性感到好奇。凭借其“看见”的能力,GPT-4 将为我们日常使用的许多应用程序提供支持。
首先,如前所述,新的 ChatGPT (付费版),现在能够处理多达 25.000 个单词的文本:它可以总结、编写和重写、管理整本书。 GPT-4 也是搜索引擎的一部分 兵。 该 汗学院 正在使用它为学生创建虚拟导师,同时 是我的眼睛 开发了一个人工智能助手,可以为有视觉障碍的人分析和描述照片。
跟上它的发展将变得越来越复杂。
GPT-4,未来展望
显然,这个系统仍然可以改进,仍然有不完善的地方,但进步是显着的,而且非常迅速。该公司已经在探索如何将音频、视频和其他输入集成到模型的未来版本中。他们的目标是让 GPT-4 成为通过为众多应用程序提供支持来改善人们生活的宝贵工具。
很快这个设备还会告诉我们它对我们衣服的看法,或者推荐最合适的发型。它将为我们向朋友和亲戚展示的监视系统提供支持,以便它们立即只向他们开放。它将使我们的汽车成为“超级跑车”,以个人方式与驾驶员互动。这将成为许多盲人的“叙述声音”,并将帮助他们感觉更加融入。谁知道还有什么。
如前所述,我无法向您显示所有到达点:最多将您带回官方公告的起点 在 OpenAI 博客上或 昨天演讲的视频,这样您就可以自己得到一个想法。
然而现在,让我们对这位非凡的多面手说“欢迎”,对于那些还没有理解它的人来说,他已经改变了我们的生活。