Home » 克劳德 2 发布–Anthropic 的人工智能聊天机器人与 ChatGPT 和 Google Bard 相比如何?

克劳德 2 发布–Anthropic 的人工智能聊天机器人与 ChatGPT 和 Google Bard 相比如何?

by Patricia

由前 OpenAI 研究人员创办的人工智能公司 Anthropic 发布了其升级版聊天机器人 Claude 2,将目光直指 ChatGPT 和 Google Bard 等竞争对手。

在克劳德首次亮相仅五个月后,它的后继者就拥有了更长的回复时间、细致入微的推理和卓越的性能,在 GRE 阅读和写作考试中取得了令人印象深刻的成绩。

Claude 2 被誉为人工智能的 “强者”,能够在一次提示中消化多达 100,000 个词块,大约相当于 75,000 个单词。与 Claude 之前的 9000 个词组限制相比,这是一个巨大的飞跃,它带来了一个独特的优势:人工智能能够以更符合语境、更完善的方式提供回复。

通过标准化测试评估,新模型在法律、数学和编码等多个领域都取得了长足进步。据 Anthropic 称,克劳德 2 在律师资格考试的选择题部分取得了 76.5% 的成绩(GPT-3.5 取得了 50.3% 的成绩),在 GRE 阅读和写作考试中取得了高于 90% 的研究生院申请者的成绩。克劳德 2 号还在 Codex HumanEval Python 编码测试中取得了 71.2% 的高分,在 GSM8k 小学数学问题中取得了 88.0% 的高分,显示了其先进的计算能力。

据 TCN 报道,Anthropic 的 Claude 具有独特的 “宪法 “设计,这是一套受《世界人权宣言》启发而制定的规则,使其能够在没有人类反馈的情况下自我完善,识别不当行为并调整自己的行为。

但是,与 ChatGPT 和谷歌的新 “巴德 “这两位 “山中霸主 “相比,它的表现又如何呢?让我们先来看看它们在规格上的优势。

价格:

  • ChatGPT: 对使用 GPT-3.5 版本的用户免费。如果想使用功能更强大的 GPT-4 版本,则必须每月支付 20 美元购买 ChatGPT Plus 版本。
  • 克劳德:免费
  • Bard: 免费

可用性:

  • ChatGPT:是三者中可用性最高的。
  • Bard:可用的国家比 ChatGPT 少。
  • Claude:在美国和英国暂时可用。

隐私:

  • ChatGPT: 让用户删除他们的互动。不支持通过 VPN 浏览。
  • Bard:有一个在 18 个月内自动删除互动的选项。不允许用户检索以前的互动。支持 VPN,这使得它几乎可以在世界任何地方使用,绕过了政治限制。
  • Claude:允许用户删除对话。支持 VPN 浏览。

支持的语言:

    支持的语言
    支持的语言:
    • ChatGPT: 支持 80 多种语言。
    • Bard:支持英语、日语和韩语。
    • Claude:支持多种广泛的语言,如英语、西班牙语、葡萄牙语、法语、普通话和德语等。如果它不能识别某种语言(或输入有许多语法错误),它会提供一个介绍性短语,然后用英语回答。

    语境处理:

    • ChatGPT: 免费版支持 7096 个上下文标记,ChatGPT Plus (GPT-4) 支持 8192 个标记。OpenAI 提供支持 32K 标记的版本,但 ChatGPT 不使用该版本。
    • Bard:支持 8196 个上下文令牌。
    • Claude:支持 100,000 个上下文标记–不是错别字。

    特征:

    • ChatGPT: 免费版没有附加功能。GPT Plus 提供插件商店、代码解释器和由 Microsoft Bing 支持的暂时停止的网页浏览功能。提供 API 支持。
    • Bard:聊天机器人仍处于试验阶段,但将提供插件商店和谷歌套件集成。提供有限的 API 访问权限。
    • Claude:该聊天机器人可添加到 Slack 中并处理不同任务,如总结线程、提供建议、头脑风暴等。提供 API 支持。

    提示之战: ChatGPT vs Bard vs Claude

    TCN使用相同的提示来比较三个聊天机器人获得的结果。

    理解外语

    首先,我们询问了一个常用西班牙语俚语的意思。事实证明,克劳德的解释更仔细、更准确,ChatGPT 提供了足够好的解释,但巴德拒绝回答,理由是它不会说西班牙语。不过,当我们把提示语从 “这是什么意思 “改为 “相当于什么英语 “时,它提供了比 ChatGPT 更好的回答,尽管没有克劳德 AI 的回答那么广泛。

    Reply provided by Claude 2.

    Reply provided by Claude 2.


    回复由 ChatGPT 提供。

    回复由 ChatGPT 提供。


    回复由 Google Bard 提供。

    回复由 Google Bard 提供。

    最新信息

    然后,我们询问了模型们比特币今天的价格。这不仅测试了网页浏览功能,还衡量了每款产品基于单个订单提供的信息量。

    ChatGPT 失败。它没有连接到互联网,因此无法提供最新信息。克劳德也没有互联网连接。然而,与 ChatGPT 不同的是,它幻化出了一个信息错误的答案。如果用户假定克劳德有互联网连接而提问,就会得到一个看似正确的错误答案。谷歌巴德提供了正确的信息。

    回复由 ChatGPT 提供。

    回复由 ChatGPT 提供。


    回复由 Claude 2 提供。

    回复由 Claude 2 提供。


    回复由 Google Bard 提供。

    回复由 Google Bard 提供。

    上下文处理

    接下来,我们测试了这些模型处理大段文本的能力。我们以《圣经》为例,复制了从创世纪 1:1 到出埃及记 25:39 的所有文本(近 6.2 万字)。然后,我们根据文中提供的故事提出了一个非常具体的问题。

    不出所料,唯一能提供答案的模型是克劳德。它花了大约 2 分钟来处理提示,但提供了准确的答案。我们使用了特定的标记,以确保它没有作弊,而是真正在分析文本,事实证明它完成了任务。

    Reply provided by Claude 2.

    Reply provided by Claude 2.

    非语言能力


    最后,我们要求模型处理一些数学任务。人工智能 LLM 其实并不是为处理数学任务而设计的,而带有 GPT-4 的 ChatGPT Plus 可能是三个模型中最好的选择,因为它有代码解释器。不过,我们对这三个模型进行了测试,要求它们为一个试图清偿信用卡债务的人制定还款计划。我们还要求这些模型排列出哪些卡应该使用,哪些卡应该避免使用。

    克劳德提供了最全面的计划答案。不过,它犯了一个错误,建议我们优先使用年利率最高的信用卡消费。

    reply provided by Claude 2.

    reply provided by Claude 2.


    ChatGPT的代码解释器提供了一个答案,我们在其中一张卡上多付了钱,如果有人在其他卡上有欠款,这个答案就不太有用了。

    由 ChatGPT 使用代码解释器提供的回复。

    由 ChatGPT 使用代码解释器提供的回复。


    GPT 3.5 没有提供准确的结果,要求我们支付比实际可用资金更多的钱。

    Reply provided by ChatGPT.

    Reply provided by ChatGPT.


    巴德很一般。它走的是安全路线,没有提供任何数字,基本上描述了所谓的 “债务雪崩法”。

    回复由 Google Bard 提供。

    回复由 Google Bard 提供。

    优势和劣势

    克劳德 2:

    • 优势:克劳德 2 处理多达 100,000 个代币的大型上下文的能力令人印象深刻。它在法律、数学和编码等多个领域表现出色,在标准化测试中获得高分。它可以在没有人类反馈的情况下自我改进和适应,并支持 VPN 浏览。聊天机器人还可以添加到 Slack 中进行任务处理,并提供 API 支持。
    • 缺点: 暂时只在美国和英国可用。Claude 2 缺乏互联网连接,如果被问及当前真实世界的数据,可能会提供错误信息。它可能会在复杂任务中出错,但听起来很有说服力。

    ChatGPT:

    • 优势:ChatGPT 是三种模式中可用性最强的,支持 80 多种语言。ChatGPT Plus 版本还提供 API 支持和插件商店。
    • 缺点: 与 Claude 2 相比,它的上下文处理能力有限。免费版不提供额外功能,与付费版相比功能更有限,质量也更差。它的网页浏览功能会暂时停止,无法提供实时数据。在某些复杂任务中,它可能会生成不恰当的结果。

    谷歌的 Bard:

    • 优势:Bard 支持 VPN 浏览。由于与互联网连接,它可以提供实时数据。Bard 还计划与 Google Suite 集成,并提供插件商店。
    • 劣势: 与 ChatGPT 相比,Bard 支持的语言较少。它的 API 访问受限,上下文处理能力也不如 Claude 2。在某些复杂任务中,Bard 的回复可能是通用的、无用的–如果用户希望降低产生幻觉的风险,这是一个合理的妥协。

    结论

    现在,人工智能龙8国际娱乐城和聊天机器人领域有了更多的选择,人们不一定非要成为 ChatGPT 的粉丝,也不一定非要进入谷歌专用阵营。

    如果你犹豫是否要花 20 美元购买 ChatGPT Plus,可以考虑使用 Claude。它提供的功能与 GPT-4 相当,输出结果可能优于免费 ChatGPT 中的 GPT-3.5,对大多数用户来说,它是比 Google Bard 更好的选择。Claude 的另一项功能是能够分析 PDF 和带有多种扩展名的文件。您只需将文件拖放到程序中即可,与 GPT Plus 订阅中的付费插件类似。因此,在决定付费购买 ChatGPT 4 之前,不妨试试 Claude。它有可能为你省下一些钱。

    不过,每个选项都有优缺点,因此每个机器人都更适合特定需求。Claude 可以处理大量数据,但对于需要实时数据的任务来说,它可能不是最佳选择。ChatGPT 更具创造性,非常适合需要特定语言支持的任务(如果你愿意付费,它的插件商店也非常不错)。另一方面,Bard 更注重事实、准确性,并能利用其互联网连接,但可能不是执行创意任务的最佳选择。

    最后,为什么要选一个?你不需要决定哪一个更好,你可以全部使用它们。

Related Posts

Leave a Comment