OpenAI 首席执行官 Sam Altman 表示,缺乏计算能力正在推迟公司产品的开发

在 Reddit AMA上,OpenAI 首席执行官 Sam Altman 承认,缺乏计算能力是阻碍公司按时出货产品的一个主要因素。

“所有这些模型都变得相当复杂,”他在回答 OpenAI 的下一代 AI 模型为何耗时这么长的问题时写道。“我们还面临许多限制和艰难的决定,即如何将计算分配给许多伟大的想法。”

许多 报道表明,OpenAI 一直在努力确保足够的计算基础设施来运行和训练其生成模型。就在本周,路透社援引消息人士的话称,OpenAI 数月来一直在与博通合作开发用于运行模型的 AI 芯片,该芯片最早可能在 2026 年问世。

Altman 表示,部分原因是由于容量紧张,OpenAI 为ChatGPT开发的听起来很逼真的对话功能“高级语音模式”不会很快实现 4 月份首次曝光的视觉功能。在 4 月份的新闻发布会上,OpenAI展示了在智能手机上运行的 ChatGPT 应用,该应用可以对手机摄像头视野范围内的视觉提示(例如某人所穿的衣服)做出反应。

《财富》杂志后来报道称,该演示匆忙推出,以转移人们对同周举行的谷歌 I/O 开发者大会的注意力。OpenAI 内部的许多人认为 GPT-4o 尚未准备好发布。值得注意的是,高级语音模式的纯语音版本被推迟了几个月。

在 AMA 中,Altman 表示 OpenAI 图像生成器DALL-E的下一个主要版本没有发布时间表。(“我们还没有发布计划,”他说。)与此同时, OpenAI 的视频生成工具Sora因“需要完善模型、确保安全/模拟/其他事项正确无误以及扩展计算能力”而受到阻碍,OpenAI 首席产品官 Kevin Weil 也参加了 AMA。

据报道,Sora 遭遇了技术挫折,与 Luma、Runway 和其他公司的竞争系统相比处于劣势。 据 The Information 报道,2 月份发布的原始系统需要 10 多分钟的处理时间才能制作出一段 1 分钟的视频剪辑。

10 月份,Sora 的联合负责人之一 Tim Brooks离职前往谷歌。

在 AMA 的后期,Altman 表示 OpenAI仍在考虑“有朝一日”允许在 ChatGPT 中发布“NSFW”内容(他写道:“我们完全相信要像对待成年人一样对待成年用户”,并且该公司的首要任务是改进其o1系列“推理”模型及其后续产品。OpenAI在本周于伦敦举行的 DevDay 会议上预览了即将在 o1 上推出的多项功能,包括图像理解。

奥尔特曼写道:“今年晚些时候我们会发布一些非常好的产品。不过,我们不会把它们称为 GPT-5。”

标签