自 ChatGPT 首次亮相以来,一些挑战者(或崇拜者)已经发出声音,以抢走一些原本集中在 OpenAI 模型上的注意力。今天有一个引起很大轰动的名字:克劳德2.0。是的,你没有看错,镇上还有另一位警长,他承诺执行他的法律。让我们来看看是什么让克劳德 2.0 如此特别。
流亡者的“反抗”
克劳德的2.0版(你可以在这里找到它)不仅仅是更新。 这个AI模型诞生于 人类的是一家由两位前 OpenAI 合作者创立的初创公司,与之前的版本 1.3 相比,是一个巨大的飞跃。
数据不言而喻。 在测试中 人类评估法典,旨在评估 Python 编程的熟练程度,Claude 2.0 获得 令人印象深刻的 71,2%, 明显改善 至之前的 56,0%.
这还不是全部:他还表现出了出色的数学技能,仅得一分 在 GSM88,0k 上提高 8%, 一组年级数学问题。克劳德是每个人都希望在考试时陪伴在身边的人工智能。
克劳德2.0,“好”巨人
在其显着特征中,Claude 2.0 当然包括更“礼貌”的设计,特别强调减少伤害,尽量避免冒犯性或危险的内容。与之前的版本 Claude 1.3 相比,新模型在生成置信响应方面的效率提高了一倍。这使其成为寻求安全、环保产品的公司的理想选择。
然而,“巨人”的定义是在数量层面上获得的:Claude 2.0 可以一次性处理大量数据。我说的是 100.000 个令牌,或者大约 75.000 个单词。就像读一本小说一样!
克劳德比ChatGPT强吗?
百万欧元的问题。 Claude 2.0 在 ChatGPT 上的表现如何? 如果你会原谅我 我认为巴德还没有达到标准。我会考虑三个因素,还有一些“内脏”。
上下文限制:
克劳德2.0: 如前所述,它有 100.000 个令牌的限制,这使得它能够处理更长的文本提示并拥有更大的上下文和内存窗口。
聊天GPT: 根据版本的不同,它有各种限制: 聊天GPT-3 限制为 4096 个代币, GPT4 (8K) 限制为 8000 个代币 e GPT4 (32K) 它的上限为 32000 个代币。这意味着 ChatGPT 的对话“记忆”不会像 Claude 2.0 那样回溯。
处理时间:
克劳德2.0: 专为更快的性能而设计,平均响应时间约为 5 秒。
聊天GPT: 通常需要几秒到 30 秒的时间才能生成响应。 在需求高峰期间,速度可能会降低。
考试成绩 – USMLE、BAR 和 GRE:
克劳德2.0: 它在 GRE 写作部分和律师资格考试中的得分高于 ChatGPT。
聊天GPT: 他在 GRE 的语言和数学部分以及 USMLE 考试中的成绩比克劳德好。
美国医师执照考试: 它代表“美国医师执照考试”。这是针对想要在美国获得行医执照的医生的考试。该考试评估医生应用知识、概念和原则的能力,并展示对安全有效的医学实践至关重要的技能。 酒吧: 它指的是律师考试,这是个人必须通过才能获准在特定司法管辖区执业的考试。美国各州的律师考试有所不同,但通常包括一系列针对各种法律主题的笔试。 GRE: 它代表“研究生入学考试”。这是许多大学(尤其是美国)硕士和博士学位课程入学的标准化考试。评估候选人的口头、定量和分析性写作技能。
其他需要考虑的事情
旁注:ChatGPT 更受欢迎,而 Claude 仅在美国和英国可用(但即使您不在这两个国家/地区,也可以使用 VPN 尝试)。 再次强调:目前 Claude 是免费的,而 ChatGPT 有两个版本:免费和付费。 其他? 哦是的。 ChatGPT 有插件,Claude 2.0。 但是Claude 2.0更新到2023年,ChatGPT更新到2021年。但是ChatGPT可以在线连接,而Claude 2.0不能。
简而言之,他们给自己一个很好的理由。 我仍然认为 ChatGPT 领先,但我必须说 Claude 2.0 是一个出色的挑战者,并且很快就会尝试超越。 凭鼻子看,你会选择什么? 或者更确切地说:您已经在使用两者了吗? 你更倾向哪个? 我们在这里阅读您的信息,请告诉我们您对 Futuro Prossimo 社交渠道的看法!