由前 OpenAI 研究人员创办的人工智能公司 Anthropic 发布了其升级版聊天机器人 Claude 2,将目光直指 ChatGPT 和 Google Bard 等竞争对手。
在克劳德首次亮相仅五个月后,它的后继者就拥有了更长的回复时间、细致入微的推理和卓越的性能,在 GRE 阅读和写作考试中取得了令人印象深刻的成绩。
Claude 2 被誉为人工智能的 “强者”,能够在一次提示中消化多达 100,000 个词块,大约相当于 75,000 个单词。与 Claude 之前的 9000 个词组限制相比,这是一个巨大的飞跃,它带来了一个独特的优势:人工智能能够以更符合语境、更完善的方式提供回复。
通过标准化测试评估,新模型在法律、数学和编码等多个领域都取得了长足进步。据 Anthropic 称,克劳德 2 在律师资格考试的选择题部分取得了 76.5% 的成绩(GPT-3.5 取得了 50.3% 的成绩),在 GRE 阅读和写作考试中取得了高于 90% 的研究生院申请者的成绩。克劳德 2 号还在 Codex HumanEval Python 编码测试中取得了 71.2% 的高分,在 GSM8k 小学数学问题中取得了 88.0% 的高分,显示了其先进的计算能力。
据 TCN 报道,Anthropic 的 Claude 具有独特的 “宪法 “设计,这是一套受《世界人权宣言》启发而制定的规则,使其能够在没有人类反馈的情况下自我完善,识别不当行为并调整自己的行为。
但是,与 ChatGPT 和谷歌的新 “巴德 “这两位 “山中霸主 “相比,它的表现又如何呢?让我们先来看看它们在规格上的优势。
价格:
- ChatGPT: 对使用 GPT-3.5 版本的用户免费。如果想使用功能更强大的 GPT-4 版本,则必须每月支付 20 美元购买 ChatGPT Plus 版本。
- 克劳德:免费
- Bard: 免费
可用性:
- ChatGPT:是三者中可用性最高的。
- Bard:可用的国家比 ChatGPT 少。
- Claude:在美国和英国暂时可用。
隐私:
- ChatGPT: 让用户删除他们的互动。不支持通过 VPN 浏览。
- Bard:有一个在 18 个月内自动删除互动的选项。不允许用户检索以前的互动。支持 VPN,这使得它几乎可以在世界任何地方使用,绕过了政治限制。
- Claude:允许用户删除对话。支持 VPN 浏览。
支持的语言:
- 支持的语言
- ChatGPT: 支持 80 多种语言。
- Bard:支持英语、日语和韩语。
- Claude:支持多种广泛的语言,如英语、西班牙语、葡萄牙语、法语、普通话和德语等。如果它不能识别某种语言(或输入有许多语法错误),它会提供一个介绍性短语,然后用英语回答。
- ChatGPT: 免费版支持 7096 个上下文标记,ChatGPT Plus (GPT-4) 支持 8192 个标记。OpenAI 提供支持 32K 标记的版本,但 ChatGPT 不使用该版本。
- Bard:支持 8196 个上下文令牌。
- Claude:支持 100,000 个上下文标记–不是错别字。
- ChatGPT: 免费版没有附加功能。GPT Plus 提供插件商店、代码解释器和由 Microsoft Bing 支持的暂时停止的网页浏览功能。提供 API 支持。
- Bard:聊天机器人仍处于试验阶段,但将提供插件商店和谷歌套件集成。提供有限的 API 访问权限。
- Claude:该聊天机器人可添加到 Slack 中并处理不同任务,如总结线程、提供建议、头脑风暴等。提供 API 支持。
- 优势:克劳德 2 处理多达 100,000 个代币的大型上下文的能力令人印象深刻。它在法律、数学和编码等多个领域表现出色,在标准化测试中获得高分。它可以在没有人类反馈的情况下自我改进和适应,并支持 VPN 浏览。聊天机器人还可以添加到 Slack 中进行任务处理,并提供 API 支持。
- 缺点: 暂时只在美国和英国可用。Claude 2 缺乏互联网连接,如果被问及当前真实世界的数据,可能会提供错误信息。它可能会在复杂任务中出错,但听起来很有说服力。
- 优势:ChatGPT 是三种模式中可用性最强的,支持 80 多种语言。ChatGPT Plus 版本还提供 API 支持和插件商店。
- 缺点: 与 Claude 2 相比,它的上下文处理能力有限。免费版不提供额外功能,与付费版相比功能更有限,质量也更差。它的网页浏览功能会暂时停止,无法提供实时数据。在某些复杂任务中,它可能会生成不恰当的结果。
- 优势:Bard 支持 VPN 浏览。由于与互联网连接,它可以提供实时数据。Bard 还计划与 Google Suite 集成,并提供插件商店。
- 劣势: 与 ChatGPT 相比,Bard 支持的语言较少。它的 API 访问受限,上下文处理能力也不如 Claude 2。在某些复杂任务中,Bard 的回复可能是通用的、无用的–如果用户希望降低产生幻觉的风险,这是一个合理的妥协。
支持的语言:
语境处理:
特征:
提示之战: ChatGPT vs Bard vs Claude
TCN使用相同的提示来比较三个聊天机器人获得的结果。
理解外语
首先,我们询问了一个常用西班牙语俚语的意思。事实证明,克劳德的解释更仔细、更准确,ChatGPT 提供了足够好的解释,但巴德拒绝回答,理由是它不会说西班牙语。不过,当我们把提示语从 “这是什么意思 “改为 “相当于什么英语 “时,它提供了比 ChatGPT 更好的回答,尽管没有克劳德 AI 的回答那么广泛。
最新信息
然后,我们询问了模型们比特币今天的价格。这不仅测试了网页浏览功能,还衡量了每款产品基于单个订单提供的信息量。
ChatGPT 失败。它没有连接到互联网,因此无法提供最新信息。克劳德也没有互联网连接。然而,与 ChatGPT 不同的是,它幻化出了一个信息错误的答案。如果用户假定克劳德有互联网连接而提问,就会得到一个看似正确的错误答案。谷歌巴德提供了正确的信息。
上下文处理
接下来,我们测试了这些模型处理大段文本的能力。我们以《圣经》为例,复制了从创世纪 1:1 到出埃及记 25:39 的所有文本(近 6.2 万字)。然后,我们根据文中提供的故事提出了一个非常具体的问题。
不出所料,唯一能提供答案的模型是克劳德。它花了大约 2 分钟来处理提示,但提供了准确的答案。我们使用了特定的标记,以确保它没有作弊,而是真正在分析文本,事实证明它完成了任务。
非语言能力
。
最后,我们要求模型处理一些数学任务。人工智能 LLM 其实并不是为处理数学任务而设计的,而带有 GPT-4 的 ChatGPT Plus 可能是三个模型中最好的选择,因为它有代码解释器。不过,我们对这三个模型进行了测试,要求它们为一个试图清偿信用卡债务的人制定还款计划。我们还要求这些模型排列出哪些卡应该使用,哪些卡应该避免使用。
克劳德提供了最全面的计划答案。不过,它犯了一个错误,建议我们优先使用年利率最高的信用卡消费。
ChatGPT的代码解释器提供了一个答案,我们在其中一张卡上多付了钱,如果有人在其他卡上有欠款,这个答案就不太有用了。
GPT 3.5 没有提供准确的结果,要求我们支付比实际可用资金更多的钱。
巴德很一般。它走的是安全路线,没有提供任何数字,基本上描述了所谓的 “债务雪崩法”。
优势和劣势
克劳德 2:
ChatGPT:
谷歌的 Bard:
结论
现在,人工智能龙8国际娱乐城和聊天机器人领域有了更多的选择,人们不一定非要成为 ChatGPT 的粉丝,也不一定非要进入谷歌专用阵营。
如果你犹豫是否要花 20 美元购买 ChatGPT Plus,可以考虑使用 Claude。它提供的功能与 GPT-4 相当,输出结果可能优于免费 ChatGPT 中的 GPT-3.5,对大多数用户来说,它是比 Google Bard 更好的选择。Claude 的另一项功能是能够分析 PDF 和带有多种扩展名的文件。您只需将文件拖放到程序中即可,与 GPT Plus 订阅中的付费插件类似。因此,在决定付费购买 ChatGPT 4 之前,不妨试试 Claude。它有可能为你省下一些钱。
不过,每个选项都有优缺点,因此每个机器人都更适合特定需求。Claude 可以处理大量数据,但对于需要实时数据的任务来说,它可能不是最佳选择。ChatGPT 更具创造性,非常适合需要特定语言支持的任务(如果你愿意付费,它的插件商店也非常不错)。另一方面,Bard 更注重事实、准确性,并能利用其互联网连接,但可能不是执行创意任务的最佳选择。
最后,为什么要选一个?你不需要决定哪一个更好,你可以全部使用它们。