春节档AI唱主角！国产大模型密集更新机器人跳秧歌抢夺眼球

《科创板日报》1月29日讯（记者黄心怡）过年放大招！在春节期间中国的大模型技术迎来了一阵密集更新。

今日凌晨，阿里云通义千问超大规模的MoE模型Qwen2.5-Max 正式上线，Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新成果，预训练数据超过20万亿tokens。在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等基准测试中，Qwen2.5-Max整体表现优于DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o。

在新模型发布后，阿里巴巴美股大涨6.76%。而在前一日，通义千问还开源了全新的视觉模型Qwen2.5-VL，推出3B、7B和72B三个尺寸版本。新的Qwen2.5-VL能够更准确地解析图像内容，支持超1小时的视频理解，实现给指定朋友送祝福、电脑修图、手机订票等操作。

刚刚暴击美股的DeepSeek团队也在1月28日抛出了新模型，两款多模态框架—— Janus-Pro 和 JanusFlow。其中，Janus-Pro 是一款统一多模态理解与生成的创新框架，是Janus的升级版本，它在图像生成基准测试中的表现超越了 OpenAI 的 " 文生图 " 模型 DALL·E 3。并与之前的 Janus 系列一样选择了开源。

当下，国内外厂商在开闭源路线上各有侧重。比如OpenAI的GPT-4模型采用闭源模式，而Meta选择完全开源。其余大模型公司将模型“低配版”开源，更高参数量的模型闭源。

而DeepSeek和阿里云通义团队都是开源路线的坚持者。此次DeepSeek的成功也被认为是开源模型的胜利。

图灵奖得主、Meta 首席人工智能科学家 Yann LeCun此前表示，对于DeepSeek的成功，其正确的理解应该是：开源模型正在超越专有模型。

LeCun 表示，DeepSeek 之所以这次一鸣惊人，是因为他们从开放研究和开源（如 Meta 的 PyTorch 和 Llama）中获益。DeepSeek 提出了新想法，并在他人工作的基础上构建。因为他们的工作是公开发布和开源的，每个人都可以从中受益，这就是开放研究和开源的力量。

一位大模型青年学者对《科创板日报》记者表示，开源和闭源路线各有特色，但开源肯定更为促进行业发展。

云基础设施厂商有望受益于这次开源的胜利。这也是阿里云通义大模型坚持开源路线的原因之一。“通义的开源模型在中文世界的开发者使用广泛，当开发者使用阿里云的开源模型，需要把应用部署到线上的时候，就会自然而然地选用阿里云的服务。”阿里集团CEO吴泳铭曾表示。

除了基础模型的更新，春节期间，各色AI应用亦成为了厂商比拼的焦点。百度智能云曦灵数字人推出了“飞帖贺新春”微信小程序功能，上传1张自己的照片，即可快速生成数字人拜年视频。

阿里云则担任央视春晚云计算AI独家合作伙伴，为春晚直播提供了云基础设施和通义大模型AI技术支持。《在岁月里的花》、《方的言》、《难忘今宵》等歌曲的舞美画面均利用了通义万相的AI生成能力。

阿里云通义万相将舞台画面瞬间转化静态油画

宇树科技的人形机器人H1登上了春晚扭秧歌，无疑是当晚最吸睛的舞台之一。宇树科技方面介绍，其核心黑科技是AI驱动全身运动控制技术。作为全球首款能完成原地空翻的全尺寸电驱人形机器人，其最大关节扭矩能达到 360 N・m，还配备了360°全景深度感知技术。

宇树机器人彩排照片

宇树科技团队在春晚合影

今年也是央视第四次开展8K春晚直播， “8K超高清+三维菁彩声”公共信号全部采用国产装备完成制作。《科创板日报》获悉，科创板上市公司当虹科技为其提供了技术支持，通过“百城千屏”超高清传播平台，把8K画面，呈现在全国上百个城市、近千块公共大屏。据了解，三维菁彩声是我国具有自主知识产权的音频标准，已获得国际电信联盟（ITU）技术报告认可，成为与杜比AC-4等并列的音频标准。