岩芯数智RockAI：让大模型更像“人”|新质生产力看张江

发展“新质生产力”正成为我国推动高质量发展的内在要求和重要着力点。2月29日，中共中央政治局会议指出，今年经济工作要坚持稳中求进、以进促稳、先立后破。要大力推进现代化产业体系建设，加快发展新质生产力。

上海张江，作为中国科技创新的重要引擎，以其独特的创新生态和前沿技术，不断孕育出具有划时代意义的新质生产力。

为调研新质生产力的发展成果，张江科学城、财联社、《科创板日报》联合推出“新质生产力看张江”。我们深入一线采访：张江的企业如何创业创新，活力四射；张江的产业如何向“新”而行，提“质”而上。

本期专访企业：上海岩芯数智人工智能科技有限公司（下称：“RockAI”）

RockAI CEO刘凡平

《科创板日报》12月2日讯（记者张洋洋）在张江人工智能岛上，RockAI是岛内为数不多的从底层架构做起，直接切入大模型赛道的创业公司。但与绝大多数大模型公司们相比，这家初创企业又稍显另类——在技术路径上，其选择了非Transformer架构。

今年1月，RockAI推出了国内首个非Transformer架构、非Attention机制的大模型Yan1.0。9月，这家公司将其大模型迭代至具有多模态能力的Yan1.3模型，还实现了在手机、电脑、机器人、无人机，甚至树莓派等广泛设备端上的无损部署。

谈及走一条非主流的技术路径，RockAI CEO刘凡平坦言在早期外部并不理解为何我们选择了这样一条路。

相较于Transformer架构，非Transformer的Yan模型好处在于，能耗低、成本小、落地周期快。

有过连续创业经历的刘凡平，深刻理解商业的成本投入和价值产出，在现实的商业经营面前，他选择顶住压力，专注走非主流道路。一年多之后，当Yan模型的技术能力，以领先同行的进度，快速落地在如手机、AI PC的产品上的时候，刘凡平才确认，自己扛过来了。

“这趟去深圳，客户和合作伙伴塞了一堆东西给我们，都是在问，可不可以给他们的安卓手机、笔记本电脑都装上大模型。”刘凡平向《科创板日报》记者坦言，“现在的最大压力，反而是快速交付。”

RockAI是上海岩山科技股份有限公司旗下，致力于让世界上每一台设备都拥有自己智能的大模型企业。在这家公司坐落的张江人工智能岛3号楼，周边分布着百度、阿里、IBM、微软等科技巨头。大厂环绕，在刘凡平看来，对于RockAI而言是好事，因为这意味着产业链的集聚。

以百度、阿里和岩芯数智等为代表的大大小小的AI企业集聚于此，这周边已经形成了一个AI生态圈。AI浪潮加速推进，张江人工智能岛，也正成为上海发展人工智能产业高地的重要承载区。

▍让大模型更像“人”

在最近一次的开放日活动中，RockAI正式推出全新升级的Yan1.3大模型，并展示了其在无人机、机器人、PC、手机等各类终端设备上落地能力。

相较于1月份首发的Yan1.0只能处理自然语言，Yan1.3具备了多模态能力，可处理图文及语音等多模态信息，并实现了模型在更广泛设备端上的离线无损部署，普通电脑CPU上也能够流畅运行。

区别于当下多采用的云、边、端协同部署模式，Yan架构大模型能直接部署在设备端，且能够在较小的算力情况下实现较高的性能。

在接受《科创板日报》采访时，岩芯数智CEO刘凡平坦言，从行业叙事看，大部分人工智能从业者所置身的是一场“由OpenAI提出概念，Meta负责开源，国内市场专注应用”的技术接力赛。RockAI不想跟随。

算经济账，Transformer架构的Attention机制，算力耗费高、数据需求大，交付成本也高，成本难以覆盖客户的付费，不少中小型企业望而却步。他们因此在早期就放弃了基于Attention机制的Transformer架构大模型。

最近的面试，刘凡平说自己会经常问候选人一个问题：如果有一天你要离开这个世界，你希望在自己的墓志铭上写什么？

他称，对多数人而言，这是一个需要思考超过30秒甚至更长时间的问题，但是在Transformer机制下，大模型会马上输出答案。

“这是Transformer大模型与人类大脑工作机制的不同，人类回答输出的时间会根据问题的复杂程度变化，复杂问题求解时参与的神经元变多了，所以输出时间会变长。但现在的大模型在面对这个问题时，即使是很复杂的问题，它的输出速度是一样的。”

本质来说，刘凡平认为大模型应当模拟人脑的方式来工作，而不应该是Transformer架构大模型中那样无时间差别的输出。也是刘凡平和他的团队放弃Transformer架构，选择自研架构的一大原因。

刘凡平说RockAI的愿景，是让世界上每一台设备都拥有自己的智能，同时通过群体智能实现通用人工智能。他期望大模型更像人，自研的Yan模型，是群体智能单元大模型，它会则更注重模拟人脑的工作机制，通过多个智能单元的协作和交互，形成的集体智慧和决策能力，能够具备超越单元个体的能力。

在RockAI的规划中，群体智能的实现包括四个阶段：创新性基础架构、多元化硬件生态、自适应智能进化、协同化群体智能。目前，Yan1.3已经可以在广泛的设备上部署和应用，进入到了多元化硬件生态，下一阶段是自主学习。据刘凡平透露，Yan2.0计划在明年发布。

▍让AI落地端侧

刘凡平是中国科学技术大学计算机专业，科班出身，研究生生涯一半时间在微软度过，毕业后进入百度。从大厂出走后的第一次创业，就是搜索引擎，放在当下的生成式AI语境下，这就是ChatGPT的雏形版。

早期的求学和后来的工作经历，刘凡平一直与人工智能打交道。作为这个行业的连续创业者，他对完善的、能快速奏效的商业闭环，有着异乎常人的关注。这一方面是连续创业经验带来的条件反射，同时也是在烧钱的AI行业里避坑。

商业闭环对应的是应用落地。过去两年，大模型，尤其是基础模型的技术进步，日新月异，但其中也有不少质疑的声音，技术发展这么快，真正的落地应用在哪里？今年，行业的讨论集中在了大模型的应用上。

刘凡平告诉《科创板日报》记者，RockAI的策略是，快速推进Yan模型在更广泛的终端落地应用。

从行业发展方向来看，大模型落地设备端是一个明显的趋势。在设备端的场景，国内多个厂商已在抢占生态位，手机端目前最受市场关注，尤其是苹果AI的发布，带动了AI手机的资本热潮。

类似于手机的大范围应用，一个技术产品要触达最广泛的用户，需要靠设备，它可以是监控的设备，也可以是家里的设备，也可以是办公场景的设备，设备才是真正毛细血管，触达到千千万万的用户。

对于目前的市场竞争形势，刘凡平表示，硬件更新周期长，比如手机的更新是一年一次，这里就留下了足够长的时间窗口去和设备厂商做适配。且某个大模型的一旦占据了某个设备型号，其他厂商并不容易替换，要么就等下一次的新机型。硬件厂商选择供应商也十分谨慎，从实际落地上来说，设备更容易形成壁垒。

在近期的开放日现场，RockAI重点展出了Yan1.3在机器人、PC、手机、无人机等各类终端设备上的落地。例如，飞龙无人机能在设备端实时处理声音、图像及文字等模态信息，无需经由云端处理判定再发回设备端执行；胖虎机器人可在离线的情况下理解模糊指令，展现“七步成诗”、“咏春拳法”等；在PC上的迅兔智能助手可以在离线模式下听懂语音指令、看懂图片并快速搜图。

据刘凡平透露，目前RockAI已在机器人和AI PC、手机等产品上具备交付能力。

刘凡平认为，在AGI这个终极命题下，无论是云端还是端侧，都只是实现智能普惠及跃迁的一个载体。他始终坚信，只有真正提升每一台设备的自我学习能力，才能激发更高级别智能形态即群体智能的涌现。

▍离开又回到张江

刘凡平是后来带着独立创业的RockAI回到张江的。在此之前，他在当地的上市公司岩山科技履职。目前，RockAI已经是岩山科技独立的人工智能业务板块。

之所以继续回到张江发展，既有前东家的邀约，也有当地产业链的集聚效应吸引。

RockAI现在坐落于张江人工智能岛3号楼，周边分布着百度、阿里、IBM、微软等科技巨头。这附近，也是上海发展人工智能产业高地的重要承载区。

刘凡平表示，产业上的大厂环绕，一定程度上可以链接更多合作伙伴。RockAI目前被视为张江重点人工智能企业，当地政府也给予了诸多支持。今年元旦前后，RockAI就将搬入张江的大模型产业生态集聚区“模力社区”，这些场地，当地也给予了场地租金的优惠支持。

AI行业未来面临的星辰大海和公司当下快速的发展线轴，为刘凡平的创业增添不少信心。RockAI岩芯数智目前的团队规模约为50人，但交付跟不上，也困扰着他。

“其实现在我们也需要去扩大团队规模，尤其是市场团队、交付团队，这块的建设可能会投入更多，此外还会再在技术研发上继续做投入。”他说。