OpenAI 升级 ChatGPT：人工智能聊天机器人现在可以 “看、听、说 “了

by Thomas 16 10 月, 2023

written by Thomas 16 10 月, 2023

OpenAI推出了备受期待的升级，使其广受欢迎的ChatGPT聊天机器人能够与图像和声音进行交互。此次发布标志着 OpenAI 向其人工通用智能的愿景迈出了重要一步，即能够感知和处理来自多种模式（而不仅仅是文本）的信息。

“我们开始在 ChatGPT 中推出新的语音和图像功能。它们提供了一种新的、更直观的界面类型，允许你进行语音对话或向 ChatGPT 展示你正在谈论的内容，”OpenAI 在其官方博客文章中说。

OpenAI表示，新的ChatGPT-Plus将包括由新颖的文本到语音模型驱动的语音聊天功能，该模型能够模仿人类的声音，而且由于与公司的图像生成模型集成，还能够讨论图像。这些新功能似乎是所谓的 GPT Vision（或 GPT-V，经常与理论上的 GPT-5 混淆）的一部分，也是 OpenAI 今年早些时候预告的增强型多模态版本 GPT-4 的关键组成部分。

在这次升级之前，OpenAI 刚刚发布了其迄今为止最先进的文本到图像生成器 DALL-E 3。DALL-E 3 的质量和准确性被早期测试者誉为 “疯狂”，它可以根据文本提示创建高保真图像，同时理解复杂的上下文和自然语言表达的概念。它将内置于 ChatGPT Plus 中，这是一项基于订阅的服务，提供由 GPT-4 支持的 ChatGPT。

整合 DALL-E 3 和对话式语音聊天功能标志着 OpenAI 正在推动人工智能助手的发展，使其能够像人类一样用多种感官感知世界。据该公司称 “语音和图像为您在生活中使用 ChatGPT 提供了更多方式。在旅行途中拍一张地标性建筑的照片，然后就它的有趣之处进行实时对话 “

。

微软通过与 OpenAI 集成推动人工智能竞赛

。

OpenAI最大的支持者–微软，也在加速将OpenAI先进的生成式人工智能功能整合到自己的消费产品中。在最近的秋季活动上，微软宣布利用 DALL-E 3（在微软改版的 Paint 等图像调整程序中）和 Copilot（OpenAI 的编程助手）等模型，对 Windows 11、Office 和必应搜索进行人工智能升级。

这与微软对 OpenAI 的 100 多亿美元投资不谋而合，因为微软的目标是在人工智能助手的竞争中处于领先地位。Copilot 将于 9 月 26 日在 Windows 11 中首次亮相，有望在微软的所有平台和设备上提供人工智能帮助。同时，Microsoft 365 Chat 将 OpenAI 的自然语言能力应用于自动化复杂的工作任务。

据TCN此前报道，微软表示，”Microsoft 365 Chat可以梳理你工作中的全部数据，包括电子邮件、会议、聊天、文档等，还有网络。”

迈向负责任的人工智能的谨慎步骤

然而，OpenAI敏锐地意识到，涉及视觉和语音生成的更强大的多模态人工智能系统存在潜在风险。冒名顶替、偏见和对视觉解读的依赖是人们关注的重点。

“OpenAI 的目标是构建安全、有益的 AGI，”该公司在公告中写道。”我们相信逐步提供我们的工具，这让我们能够随着时间的推移不断改进和完善风险缓解措施，同时也让大家为未来更强大的系统做好准备。”

此外，据 TCN 此前报道，OpenAI 正在组建一支红队，研究如何防止因不当使用其人工智能产品而造成的有害后果。首席执行官山姆-奥特曼（Sam Altman）也一直在世界各地游说，争取有利的立法。

OpenAI 表示，Plus 和 Enterprise 用户将在未来两周内使用这些新功能，并计划随后扩大对开发者的开放。谷歌也宣布了自己的革命性多模态 LLM–Gemini，人工智能行业的竞争才刚刚开始

。

OpenAI 升级 ChatGPT： 人工智能聊天机器人现在可以 “看、听、说 “了

微软通过与 OpenAI 集成推动人工智能竞赛

迈向负责任的人工智能的谨慎步骤

漫威蜘蛛侠 2》（PS5）： 你需要知道的一切

美国证券交易委员会反对 Coinbase 在 Celsius 破产分配计划中发挥作用

Related Posts