Home » OpenAI 升级 ChatGPT: 人工智能聊天机器人现在可以 “看、听、说 “了

OpenAI 升级 ChatGPT: 人工智能聊天机器人现在可以 “看、听、说 “了

by Thomas

OpenAI推出了备受期待的升级,使其广受欢迎的ChatGPT聊天机器人能够与图像和声音进行交互。此次发布标志着 OpenAI 向其人工通用智能的愿景迈出了重要一步,即能够感知和处理来自多种模式(而不仅仅是文本)的信息。

“我们开始在 ChatGPT 中推出新的语音和图像功能。它们提供了一种新的、更直观的界面类型,允许你进行语音对话或向 ChatGPT 展示你正在谈论的内容,”OpenAI 在其官方博客文章中说。

OpenAI表示,新的ChatGPT-Plus将包括由新颖的文本到语音模型驱动的语音聊天功能,该模型能够模仿人类的声音,而且由于与公司的图像生成模型集成,还能够讨论图像。这些新功能似乎是所谓的 GPT Vision(或 GPT-V,经常与理论上的 GPT-5 混淆)的一部分,也是 OpenAI 今年早些时候预告的增强型多模态版本 GPT-4 的关键组成部分。

在这次升级之前,OpenAI 刚刚发布了其迄今为止最先进的文本到图像生成器 DALL-E 3。DALL-E 3 的质量和准确性被早期测试者誉为 “疯狂”,它可以根据文本提示创建高保真图像,同时理解复杂的上下文和自然语言表达的概念。它将内置于 ChatGPT Plus 中,这是一项基于订阅的服务,提供由 GPT-4 支持的 ChatGPT。

整合 DALL-E 3 和对话式语音聊天功能标志着 OpenAI 正在推动人工智能助手的发展,使其能够像人类一样用多种感官感知世界。据该公司称 “语音和图像为您在生活中使用 ChatGPT 提供了更多方式。在旅行途中拍一张地标性建筑的照片,然后就它的有趣之处进行实时对话 “

微软通过与 OpenAI 集成推动人工智能竞赛


OpenAI最大的支持者–微软,也在加速将OpenAI先进的生成式人工智能功能整合到自己的消费产品中。在最近的秋季活动上,微软宣布利用 DALL-E 3(在微软改版的 Paint 等图像调整程序中)和 Copilot(OpenAI 的编程助手)等模型,对 Windows 11、Office 和必应搜索进行人工智能升级。

这与微软对 OpenAI 的 100 多亿美元投资不谋而合,因为微软的目标是在人工智能助手的竞争中处于领先地位。Copilot 将于 9 月 26 日在 Windows 11 中首次亮相,有望在微软的所有平台和设备上提供人工智能帮助。同时,Microsoft 365 Chat 将 OpenAI 的自然语言能力应用于自动化复杂的工作任务。

据TCN此前报道,微软表示,”Microsoft 365 Chat可以梳理你工作中的全部数据,包括电子邮件、会议、聊天、文档等,还有网络。”

迈向负责任的人工智能的谨慎步骤

然而,OpenAI敏锐地意识到,涉及视觉和语音生成的更强大的多模态人工智能系统存在潜在风险。冒名顶替、偏见和对视觉解读的依赖是人们关注的重点。

“OpenAI 的目标是构建安全、有益的 AGI,”该公司在公告中写道。”我们相信逐步提供我们的工具,这让我们能够随着时间的推移不断改进和完善风险缓解措施,同时也让大家为未来更强大的系统做好准备。”

此外,据 TCN 此前报道,OpenAI 正在组建一支红队,研究如何防止因不当使用其人工智能产品而造成的有害后果。首席执行官山姆-奥特曼(Sam Altman)也一直在世界各地游说,争取有利的立法。

OpenAI 表示,Plus 和 Enterprise 用户将在未来两周内使用这些新功能,并计划随后扩大对开发者的开放。谷歌也宣布了自己的革命性多模态 LLM–Gemini,人工智能行业的竞争才刚刚开始

Related Posts

Leave a Comment