GPT-4 到来，并开始窥探我们的生活：超级聊天机器人现在“看到”

三月15 2023

技术

ChatGPT 现在可以通过 GPT-4 理解图像，GPT-XNUMX 是 OpenAI 刚刚推出的新人工智能模型。

意大利时间晚上 21 点，OpenAI 在 YouTube 上进行了现场直播，展示了其新产品 GPT-4，该版本的水平明显高于几个月前推出的前一个版本。现在的“对话专家”ChatGPT不仅功能更强大，而且还能“看”。而这一因素可以导致人工智能的发展空前加速。

从 GPT-3 到 GPT-4 大海经过

ChatGPT 是 OpenAI 的“电子小天才”，可以用文本和代码回复消息，它已迅速成为历史上增长最快的应用程序，每月拥有超过 100 亿用户。

与它的发展同时，用户社区和用户指南也诞生了（我还发布了一个：如果你有兴趣你可以在亚马逊上找到它）甚至是“原始职业”，提示工程师.

然而，尽管 ChatGPT 取得了成功，但仍有一些问题需要解决。他倾向于“产生幻觉”，生成听起来合理但事实并非如此的文本。它反映了偏见，有时它“刺穿”了其创造者预见的非法短语的过滤器。

新的基于 GPT-4 的版本解决了大部分这些问题，并提高了（很多）性能。

睁开眼睛看世界

该模型的最大新颖之处在于它能够响应文本和视觉提示。想想各种可能性：识别一幅画的作者、解释一个模因的含义、为照片创建标题……事实是，可能的应用领域扩展得如此之大，以至于可能的列表变得巨大。

但 GPT-4 并不止于此：它也比其前身更加“智能”，在多项测试中超越了它的结果，例如针对法律专业人士的测试 (法学院入学考试)，那些用于进入美国大学的（SAT), 还有很多其他的。 OpenAI 声称 GPT-4 准确度提高 40% 在生成真实内容方面 倾向减少 82% 响应非法提示（再见“邪恶”版本的聊天机器人）。

新功能的示例。系统知道它看到了什么：它分析图像，不仅能够完美地描述其内容，还能解释它。例如，他知道如何发现不寻常或有趣的方面。就像这个例子一样。

剩下的都是历史

我们会对生成人工智能将获得越来越多（而且越来越快）的令人难以置信的特性感到好奇。凭借其“看见”的能力，GPT-4 将为我们日常使用的许多应用程序提供支持。

首先，如前所述，新的 ChatGPT （付费版），现在能够处理多达 25.000 个单词的文本：它可以总结、编写和重写、管理整本书。 GPT-4 也是搜索引擎的一部分兵。该 汗学院 正在使用它为学生创建虚拟导师，同时 是我的眼睛 开发了一个人工智能助手，可以为有视觉障碍的人分析和描述照片。

跟上它的发展将变得越来越复杂。