《科创板日报》1月29日讯(记者 黄心怡)过年放大招!在春节期间中国的大模型技术迎来了一阵密集更新。
今日凌晨,阿里云通义千问超大规模的MoE模型Qwen2.5-Max 正式上线,Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新成果,预训练数据超过20万亿tokens。在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等基准测试中,Qwen2.5-Max整体表现优于DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o。
在新模型发布后,阿里巴巴美股大涨6.76%。而在前一日,通义千问还开源了全新的视觉模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本。新的Qwen2.5-VL能够更准确地解析图像内容,支持超1小时的视频理解,实现给指定朋友送祝福、电脑修图、手机订票等操作。
刚刚暴击美股的DeepSeek团队也在1月28日抛出了新模型,两款多模态框架—— Janus-Pro 和 JanusFlow。其中,Janus-Pro 是一款统一多模态理解与生成的创新框架,是Janus的升级版本,它在图像生成基准测试中的表现超越了 OpenAI 的 " 文生图 " 模型 DALL·E 3。并与之前的 Janus 系列一样选择了开源。
当下,国内外厂商在开闭源路线上各有侧重。比如OpenAI的GPT-4模型采用闭源模式,而Meta选择完全开源。其余大模型公司将模型“低配版”开源,更高参数量的模型闭源。
而DeepSeek和阿里云通义团队都是开源路线的坚持者。此次DeepSeek的成功也被认为是开源模型的胜利。
图灵奖得主、Meta 首席人工智能科学家 Yann LeCun此前表示,对于DeepSeek的成功,其正确的理解应该是:开源模型正在超越专有模型。
LeCun 表示,DeepSeek 之所以这次一鸣惊人,是因为他们从开放研究和开源(如 Meta 的 PyTorch 和 Llama)中获益。DeepSeek 提出了新想法,并在他人工作的基础上构建。因为他们的工作是公开发布和开源的,每个人都可以从中受益,这就是开放研究和开源的力量。
一位大模型青年学者对《科创板日报》记者表示,开源和闭源路线各有特色,但开源肯定更为促进行业发展。
云基础设施厂商有望受益于这次开源的胜利。这也是阿里云通义大模型坚持开源路线的原因之一。“通义的开源模型在中文世界的开发者使用广泛,当开发者使用阿里云的开源模型,需要把应用部署到线上的时候,就会自然而然地选用阿里云的服务。”阿里集团CEO吴泳铭曾表示。
除了基础模型的更新,春节期间,各色AI应用亦成为了厂商比拼的焦点。百度智能云曦灵数字人推出了“飞帖贺新春”微信小程序功能,上传1张自己的照片,即可快速生成数字人拜年视频。
阿里云则担任央视春晚云计算AI独家合作伙伴,为春晚直播提供了云基础设施和通义大模型AI技术支持。《在岁月里的花》、《方的言》、《难忘今宵》等歌曲的舞美画面均利用了通义万相的AI生成能力。
阿里云通义万相将舞台画面瞬间转化静态油画
宇树科技的人形机器人H1登上了春晚扭秧歌,无疑是当晚最吸睛的舞台之一。宇树科技方面介绍,其核心黑科技是AI驱动全身运动控制技术。作为全球首款能完成原地空翻的全尺寸电驱人形机器人,其最大关节扭矩能达到 360 N・m,还配备了360°全景深度感知技术。
宇树机器人彩排照片
宇树科技团队在春晚合影
今年也是央视第四次开展8K春晚直播, “8K超高清+三维菁彩声”公共信号全部采用国产装备完成制作。《科创板日报》获悉,科创板上市公司当虹科技为其提供了技术支持,通过“百城千屏”超高清传播平台,把8K画面,呈现在全国上百个城市、近千块公共大屏。据了解,三维菁彩声是我国具有自主知识产权的音频标准,已获得国际电信联盟(ITU)技术报告认可,成为与杜比AC-4等并列的音频标准。