Home » 人们对开源人工智能产出的评价优于商业方案

人们对开源人工智能产出的评价优于商业方案

by Thomas

根据一项针对 10 万多名受访者的持续调查显示,与专有的商业工具相比,人工智能爱好者更喜欢使用开源工具。

Mistral AI 的开源模型 Mixtral 8x7B 的出现在人工智能领域产生了重大影响。它轻巧而强大,被 TCN 评为 2023 年最佳 LLM 之一。Mixtral 因其在各种基准测试中的出色表现而备受关注,尤其是 Chatbot Arena,它提供了一种独特的以人为中心的 LLM 评估方法。

Chatbot Arena 排行榜是一份众包榜单,它利用 13 万多名用户的投票来计算人工智能模型的 Elo 评级。与其他试图将结果标准化以便更加客观的方法相比,该竞技场选择了一种更加 “人性化 “的方法,要求人们在两个由不明 LLMS 提供的回复中盲目做出选择。按照某些标准,这些回答可能会显得非常规,但实际人类用户却可以凭直觉进行评估。

Mixtral 的地位令人印象深刻,超过了 Anthropíc 的 Claude 2.1、OpenAI 的 GPT-3.5(为免费版 ChatGPT 提供动力)和谷歌的 Gemini(一款多模态 LLM,被当作最强大的聊天机器人出售,以挑战 GPT-4 的统治地位)等行业巨头。

聊天机器人竞技场排名。Mistral AI 的 LLM 在榜单中排名第 6。图片: Huggingface

聊天机器人竞技场排名。Mistral AI 的 LLM 在榜单中排名第 6。图片: Huggingface


Mixtral的一个显著差异是,它是聊天机器人竞技场前十名中唯一的开源LLM。这一殊荣不仅仅是一个排名问题,它还代表了人工智能行业向更易用和社区驱动模式的重大转变。据 TCN 报道,Mistral AI 称其模型 “在大多数基准上都优于 LlaMA 2 70B,推理速度快 6 倍,在大多数标准基准上都与 GPT 3.5 相当或优于 GPT 3.5″,如 MMLU、Arc-C 或 GSM。

Mixtral 成功的秘诀在于其 “专家混合”(MoE)架构。这种技术采用了多个虚拟专家模型,每个模型都专注于不同的主题或领域。遇到问题时,Mixtral 会从其专家库中选择最相关的专家,从而获得更准确、更高效的输出。

“Mistral 在 LLM 最近发表的论文中解释说:”在每一层,对于每个标记,路由器网络都会选择其中的两个组(’专家’)来处理标记,并将它们的输出相加。”这种技术增加了模型的参数数量,同时控制了成本和延迟,因为模型只使用了每个令牌总参数集的一部分。”

此外,Mixtral 在多语言能力方面也很突出。该模型在法语、德语、西班牙语、意大利语和英语等语言中表现出色,展示了其多功能性和广泛的潜力。该模型采用 Apache 2.0 许可,具有开源性质,允许开发人员自由探索、修改和增强该模型,营造了一个协作和创新的环境。

Mixtral 的成功显然不仅仅是技术实力的问题,它标志着开源人工智能社区取得了一个微小但重要的胜利。也许,在不远的将来,问题将不再是哪个模型最先出现,或者哪个模型拥有更多的参数或语境能力,而是哪个模型真正与人们产生了共鸣。

Related Posts

Leave a Comment