OpenAI这次要open了，奥尔特曼所说的“开放权重模型”是什么？

《科创板日报》4月1日讯（编辑朱凌）北京时间4月1日凌晨，OpenAI首席执行官萨姆·奥尔特曼（Sam Altman）在社交媒体X平台宣布：OpenAI将在未来几个月内发布一个“强大的带有推理能力的全新开放权重（open-weight）模型”。

这是自2019年发布GPT-2以来，OpenAI时隔六年首次宣布新的开放模型计划。

回顾过往，OpenAI虽然以“开放”命名，但自从GPT-3开始，逐步转向封闭。尤其是ChatGPT问世后，OpenAI模型只能通过其自家平台或者微软Azure等合作伙伴访问或使用API接口。用户无法在自己的硬件上自行部署运行GPT-3、4、4o、4.5等，无法对它们进行修改或二次开发。

或许是随着DeepSeek等开放模型迅速崛起，OpenAI压力逐渐增大。

在今年2月1日的OpenAI o3-mini产品发布后，奥尔特曼公开承认DeepSeek削弱了OpenAI在AI领域的领先地位。

他认为，OpenAI在开源AI方面一直站在历史的错误一边，“我们需要想出一个不同的开源策略”。

并非完全开源模型

2月18日，奥尔特曼在X平台上发起对OpenAI下一个开源项目的民意调查：是做一个虽然体积小、但仍需要GPU运行的o3-mini级别模型，还是做一个适配手机的轻量模型？

投票结果偏向前者，这也预示了这次开放模型可能是o3-mini级别模型。但从奥尔特曼发起投票时的措辞来看，不会直接是o3-mini，而是一个与o3-mini类似，但有所不同的模型。

即便是开放模型，OpenAI依旧会保留一些“秘方”——例如模型训练数据、预训练细节或者关键架构组件等。换句话说，这是一个开放权重模型，但不是一个完全开源的模型。

事实上，由于AI模型不仅包括代码，还涉及数据、参数和权重等，开源模型的定义并不像开源软件般清晰，目前尚未形成统一定义。

Linux基金会提出的模型开放性框架（MOF）把开放模型分为了三个逐步扩展的层级——第三级“开放模型”、第二级“开放工具”和第一级“开放科学”。

DeepSeek、Qwen2.5等模型只通过了MOF第三级评估，第三级“开放模型”开放范围包括模型架构、模型参数（最终参数）、模型卡、数据卡、技术报告和评估结果，距离最开放的第一级“开放科学”仍有空间。

而OpenAI将发布的开放模型是否能达到第三级，目前还不得而知。

开放权重模型意味着什么？

奥尔特曼在X上表示，“我们希望与开发者深入探讨如何最大化发挥其作用，我们很高兴能将它打造为一个非常非常优秀的模型。”

他还透露，OpenAI将在旧金山、欧洲和亚太地区举办开发者活动，以收集反馈并提供早期原型试用机会。

奥尔特曼称，很期待看到开发人员的成果，以及大公司和政府如何使用它来运行自己的模型。

这似乎表明，这次开放模型主要针对开发人员、企业和政府，而不是个人用户。

开放模型可以本地部署，在特殊应用场景中具有更大的优势。企业和政府可以在自己的服务器上运行开放模型，无需连接外网或接入云端算力，在本地处理数据，利用特定领域的数据进行训练，能够保护隐私，还可以摆脱对OpenAI平台的依赖，避免云服务带来的延迟、安全和成本问题，同时提供紧急情况下的快速响应。

而且，开放模型可控性和可审计性增强，开发者可以深入理解模型运行机制，更容易调试和调整策略。

此外，开发者可以基于自有数据对模型进行开放模型微调，开发专属的垂直领域应用，构建衍生模型，甚至将其提炼为在智能手机等智能终端上就能单机运行起来的AI模型。

英伟达也推出了个人AI超级计算机，使企业和开发者能够以相对较低的成本运行开放模型。

不过，对于普通个人用户而言，能够流畅运行开放模型的硬件成本仍然较高，云端模型依然具有更高的实用性，尤其在面对复杂任务时，云端模型在算力和易用性方面仍拥有明显优势。