效能更优ChatGPT-4o OpenAI推新模型「o1」

在不断演变的人工智慧(AI)领域,OpenAI再次突破极限,推出了新模型「o1」系列,包括「o1-preview」和「o1-mini」,值得注意的是,并非仅仅是语言模型的又一次更新,而是AI解决问题方式的根本性转变,就像是从死记硬背到真正理解问题的飞跃一样。

o1模型重点:推理先于回答

据报导,OpenAI表示,该模型利用强化学习进行训练,专注于解决复杂的推理问题,OpenAI指出,「o1会在回答问题前进行深思熟虑,并已经使用全新的最佳化演算法和专门为其量身定制的新训练资料集进行了训练。」尽管AI业界早已预测,OpenAI会推出名为「Strawberry」的新模型,但该公司仍未公开区分各个模型的具体特点。

重新命名彰显重大突破

OpenAI这次推出的新模型打破了以往的命名规则,抛弃了过去的ChatGPT-3、ChatGPT-3.5以及ChatGPT-4o命名惯例,该公司表示,「这对于解决复杂推理任务是一个显著的进步,带来AI能力的新层次,」为此他们才决定将计数重置回1,并将这一系列命名为「OpenAI o1」。

新模型强调「思维链」推理方式

OpenAI强调,这些新模型的关键特点是采用「链型思维」(chain-of-thought)推理方式,其会在提供最终答案前,逐步分段进行推理分析,不仅提高了回答的精确性,也减少了潜在的「越狱」技术风险,使系统有更多时间和步骤来检查其生成的结果,更容易被识别和阻止违规行为。

根据OpenAI的测试结果,该系列中最小的模型,在多个关键领域超越了顶级的GPT-4o,即使是在被认为有博士难度的挑战中也表现卓越。此外,公司还公开了内部测试结果,显示该模型在程式设计、微积分和数据分析等领域,相较于GPT-4o有显著改善,但在创意写作等创意任务的进步仍相对较小。

未来计画与更多功能扩展

OpenAI表示,未来将进一步扩展该模型的能力,包括增加网页搜寻功能和增强多模态互动功能等,并随时间调整以符合OpenAI的最低安全标准,同时也会加强对越狱的防范和模型自主问题。

分阶段发布,最小模型将免费提供

尽管ChatGPT Plus 和Team 用户已经可以使用o1-preview 和o1-mini,但部分用户表示,他们尚未看到该模型,因此可能是分段发布,而Enterprise 和Edu 用户将于下周开放,根据OpenAI,该模型的最小版本最终更是将「免费」提供,API的价格也相比OpenAI o1-preview便宜80%,但目前,用户每周仅有30次讯息限额,o1-mini则为50次,因此需谨慎选择使用的提示内容

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注