GPT-4o:OpenAI 的最新 AI 模型彻底改变了 ChatGPT,现在免费向所有人开放

OpenAI最近宣布推出其最新的大型语言模型 GPT-4o。该公司声称,GPT-4o 代表该公司迄今为止生产的“速度最快、规模最大”的模型,它可能会提高 ChatGPT 的语言能力并使其变得更容易。OpenAI 之前最好的模型是 GPT-3,独占访问需要花钱,但有了 GPT-4o,所有用户都可以免费使用它。

什么是 GPT-4o?

GPT-4o,即“omni”的“o”,被认为是“增强人机交互的人工智能系统中最重要的突破”。此外,与所有以前的模型不同,它是多模式的,因为它可以以三种格式(文本、音频和图像)回复任何输入这三种格式的人。OpenAI 首席技术官 Mira Murati 在描述新模型时强调了它所代表的易用性方面的重大飞跃。

GPT-4o 通过文本和视觉进行交互。因此,它可以评估和讨论用户上传的截图、图片、论文或图表。据 OpenAI 称,新的ChatGPT模型将具有更广泛的记忆能力,并将从用户之间的过去互动中获益。

GPT-4o背后的技术

LLM 是大型语言模型,AI 聊天机器人就是基于此模型构建的。它们能够从大型数据集中学习。与之前的版本不同,之前的版本需要用户训练许多模型来完成许多任务,而 GPT-4o 是采用多模态开发的,这意味着单阶段设计是跨多种模态(文本、视觉和声音)开发的。

特性和能力

它快速高效,例如,对话时间只需 232 到 320 毫秒,相当于人类对话,并且随时可用。多语言支持也得到了扩展,能够使用除英语以外的其他语言。

可用性

文本和图像功能于 2021 年 2 月发布,用于在自动回复器中与 ChatGPT 模型聊天。继该工具的扩展版本 ChatGPT 之后,音频功能将于 2021 年 11 月推出,视频功能将于 2022 年 1 月在 GPT-4o 框架的大规模初始访问期间推出。

限制和安全问题

即使可以长期访问有限的音频输出,初始访问也将仅提供有限的功能和预设声音。这种务实的方法减少了需要用于安全性或使用情况评估的象限数量。OpenAI 已采取重大预防措施来评估包括网络安全、错误信息和偏见在内的风险。虽然目前评估 GPT-4o 在这些领域构成中等风险,但目前正在努力识别和减轻新出现的风险。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注