很抱歉,当前没有启用javascript,网站无法正常访问。请开启以便继续访问。OpenAI这次要open了,奥尔特曼所说的“开放权重模型”是什么?
OpenAI这次要open了,奥尔特曼所说的“开放权重模型”是什么?
2025.04.01 12:51 科创板日报 朱凌

《科创板日报》4月1日讯(编辑 朱凌)北京时间4月1日凌晨,OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)在社交媒体X平台宣布:OpenAI将在未来几个月内发布一个“强大的带有推理能力的全新开放权重(open-weight)模型”。

这是自2019年发布GPT-2以来,OpenAI时隔六年首次宣布新的开放模型计划。

回顾过往,OpenAI虽然以“开放”命名,但自从GPT-3开始,逐步转向封闭。尤其是ChatGPT问世后,OpenAI模型只能通过其自家平台或者微软Azure等合作伙伴访问或使用API接口。用户无法在自己的硬件上自行部署运行GPT-3、4、4o、4.5等,无法对它们进行修改或二次开发。

或许是随着DeepSeek等开放模型迅速崛起,OpenAI压力逐渐增大。

在今年2月1日的OpenAI o3-mini产品发布后,奥尔特曼公开承认DeepSeek削弱了OpenAI在AI领域的领先地位。

他认为,OpenAI在开源AI方面一直站在历史的错误一边,“我们需要想出一个不同的开源策略”。

并非完全开源模型

2月18日,奥尔特曼在X平台上发起对OpenAI下一个开源项目的民意调查:是做一个虽然体积小、但仍需要GPU运行的o3-mini级别模型,还是做一个适配手机的轻量模型?

投票结果偏向前者,这也预示了这次开放模型可能是o3-mini级别模型。但从奥尔特曼发起投票时的措辞来看,不会直接是o3-mini,而是一个与o3-mini类似,但有所不同的模型。

即便是开放模型,OpenAI依旧会保留一些“秘方”——例如模型训练数据、预训练细节或者关键架构组件等。换句话说,这是一个开放权重模型,但不是一个完全开源的模型。

事实上,由于AI模型不仅包括代码,还涉及数据、参数和权重等,开源模型的定义并不像开源软件般清晰,目前尚未形成统一定义。

Linux基金会提出的模型开放性框架(MOF)把开放模型分为了三个逐步扩展的层级——第三级“开放模型”、第二级“开放工具”和第一级“开放科学”。

DeepSeek、Qwen2.5等模型只通过了MOF第三级评估,第三级“开放模型”开放范围包括模型架构、模型参数(最终参数)、模型卡、数据卡、技术报告和评估结果,距离最开放的第一级“开放科学”仍有空间。

而OpenAI将发布的开放模型是否能达到第三级,目前还不得而知。

开放权重模型意味着什么?

奥尔特曼在X上表示,“我们希望与开发者深入探讨如何最大化发挥其作用,我们很高兴能将它打造为一个非常非常优秀的模型。”

他还透露,OpenAI将在旧金山、欧洲和亚太地区举办开发者活动,以收集反馈并提供早期原型试用机会。

奥尔特曼称,很期待看到开发人员的成果,以及大公司和政府如何使用它来运行自己的模型。

这似乎表明,这次开放模型主要针对开发人员、企业和政府,而不是个人用户。

开放模型可以本地部署,在特殊应用场景中具有更大的优势。企业和政府可以在自己的服务器上运行开放模型,无需连接外网或接入云端算力,在本地处理数据,利用特定领域的数据进行训练,能够保护隐私,还可以摆脱对OpenAI平台的依赖,避免云服务带来的延迟、安全和成本问题,同时提供紧急情况下的快速响应。

而且,开放模型可控性和可审计性增强,开发者可以深入理解模型运行机制,更容易调试和调整策略。

此外,开发者可以基于自有数据对模型进行开放模型微调,开发专属的垂直领域应用,构建衍生模型,甚至将其提炼为在智能手机等智能终端上就能单机运行起来的AI模型。

英伟达也推出了个人AI超级计算机,使企业和开发者能够以相对较低的成本运行开放模型。

不过,对于普通个人用户而言,能够流畅运行开放模型的硬件成本仍然较高,云端模型依然具有更高的实用性,尤其在面对复杂任务时,云端模型在算力和易用性方面仍拥有明显优势。

1.91W+特别声明:文章内容仅供参考,不构成投资建议。投资者据此操作风险自担。