科创板话题：多模态模型

多模态模型

话题简介

多模态通常包含两个或者两个以上的模态形式，使用多模态数据能够使得事物呈现更加立体、全面，多模态研究成为当前研究重要方面，在情感分析、机器翻译、自然语言处理和生物医药前沿方向取得重大突破。

通义万相大模型发布文生视频能力

《科创板日报》19日讯，在云栖大会期间，通义万相大模型发布文生视频能力。同时，通义千问新一代开源模型Qwen2.5发布，涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型，总计上架100多个模型。（记者黄心怡）

多模态模型

09月19日 14:10 阅 7.53W+

Meta强势发布开源大模型Llama 3.1 英伟达也来助攻

①Meta发布开源大模型Llama 3.1，这是Meta目前为止规模最大的大语言模型，性能对标GPT-4o和Claude3.5；
②大模型开源和闭源优劣比较时有发生，随着Llama 3.1发布，二者获或迎来新一轮激斗；
③英伟达同期推出组合服务，为Llama 3.1助攻。

07月24日 11:48 来自科创板日报记者张洋洋阅 2.13W+

启明创投：3年内视频生成将全面爆发

《科创板日报》6日讯，今日，在2024世界人工智能大会(WAIC)上，启明创投发布了2024《生成式AI》报告预告，其中对多模态模型作出预测：将出现图像和文本的统一连续表示，并且基于此的图文联合扩散模型将达到GPT—10级别能力；3年内视频生成将全面爆发，结合3D能力，可控多视频生成将对影视、动画、短片的生成模式带来变革。（记者李明明）

07月06日 15:55 阅 9.13W+

AI“明星”选手巅峰对决！记者实测最新谷歌Gemini与GPT-4o|聚焦

①《科创板日报》记者实测发现谷歌Gemini 1.5 Pro在文本理解能力上优于GPT-4o，但在多模态理解方面，GPT-4o更胜一筹；
②前华为“天才少年”预测国内第一个端到端多模态大模型年底将到来。

05月17日 10:41 来自科创板日报记者朱凌阅 2.09W+

多模态AI概念震荡回升中胤时尚20CM涨停

财联社5月13日电，多模态AI概念震荡回升，中胤时尚、网达软件涨停，万兴科技、佳发教育、因赛集团、值得买等跟涨。消息面上，OpenAI在社交媒体X上宣布，将于5月13日上午10点（北京时间5月14日凌晨1点）在其官网上直播演示ChatGPT和GPT-4的更新。据硅谷科技媒体The Information报道，OpenAI正在开发具备音频和视觉理解能力的AI语音助手，最早可能会在5月13日的活动上预览。

多模态模型

05月13日 10:05 阅 7.51W+

对标Sora、“国产最强”视频大模型Vidu，真有那么强吗？

①生数科技在两个月内有如此提升已经是算法和工程能力上的突破，但在同等性能表现下追平Sora的1分钟时长，还有较长的一段路要走。
②目前，Vidu对外公布的时长上限是16秒，Sora最大时长则是1分钟。

04月28日 16:40 来自界面新闻伍洋宇阅 1.89W+

多模态AI概念持续走强三六零午后涨停

财联社4月11日电，多模态AI概念持续走强，三六零午后涨停，昆仑万维、值得买、引力传媒、华策影视等涨幅靠前。消息面上，近日，AIwatch.ai发布“全球AI产品增速黑马榜”，三六零两款AI产品进入前十，其中360AI搜索居榜首，3月访问量环比增加1677%。360苏打办公同时上榜，数据显示其3月访问量超WPS，据了解“苏打办公”将集成更多AI爆款应用，升级为360AI办公工具集。

多模态模型

04月11日 13:06 阅 7.89W+

大模型需要更多用武之地

财联社4月10日电，大模型的应用需要深入各行各业，解决实际问题。要拓宽其应用场景，加强大模型技术与产业的深度融合，推动产学研合作，解决技术合规性、安全性、数据质量等问题，助力大模型走向广阔市场空间。展望未来，期待看到更多具有开源精神的项目和创新生态社区涌现，推动技术的共享和发展，成为技术与产业结合的桥梁和纽带。 (经济日报)

04月10日 06:01 来自经济日报阅 7.65W+

复旦大学团队研发AI大模型助视障者“看见”世界

《科创板日报》2日讯，2日获悉，在复旦大学自然语言处理实验室(FudanNLP)师生的努力下，基于多模态大模型“复旦·眸思”(MouSi)为视障者量身打造的“听见世界”APP上线，将成为视障人士的生活助手与智能管家。2023年上半年，复旦大学自然语言处理实验室发布了开发MOSS对话式大型语言模型，被称为中国版的GPT，仅用半年时间多模态模型“眸思”问世。据介绍，“眸思”和基于文本的MOSS不同，它能够理解并识别图片内容，致力于成为视障者的一双“眸”。

03月02日 18:47 阅 7.82W+

国产视频大模型奋起直追 Pika、阿里同日发布“对口型”利器

①在AI视频生成领域，要让视频人物和声音完美同步，仍是一个巨大的挑战；
②EMO不仅可以生成任意时长的说话视频，还能生成人像整个头部都发生丰富变化的说话视频，表情、五官、姿势都会产生非常自然的变化；
③从技术方面来看，视频生成工具的底层模型及技术仍在优化，有望诞生更多后起之秀。

02月29日 17:27 来自科创板日报宋子乔阅 2.12W+

多模态AI概念股快速反弹国新文化涨停

财联社2月29日电，国新文化涨停，开普云、宣亚国际、因赛集团涨超5%，天娱数科、竞业达、汉王科技等跟涨。消息面上，字节跳动正在AI大模型领域秘密研发多个产品，其中包括多模态数字人产品以及AI生图、AI生视频产品等。

多模态模型

02月29日 09:40 阅 7.71W+

首部文生视频AI动画片开播时长7分钟、尽显中国特色效果如何？

①《千秋诗颂》由“央视听媒体大模型”制作，美术设计、动效生成和后期成片等各环节均由AI辅助制作；
②同等预算条件下，按照传统动画制作流程计算，《千秋诗颂》至少需要8个月时间，依托大模型后，制作周期缩短至4个月；
③对于古诗词的理解，不能单凭AI技术，打造优质中文语料库至关重要。

02月26日 20:30 来自科创板日报宋子乔阅 1.46W+

Sora与游戏互相成就？OpenAI：视频模型再造数字世界“大有可为”

①在大规模训练时，Sora已可以模拟数字世界，渲染出与《我的世界》游戏极其相似的HUD、高保真度渲染世界及游戏动态，还能控制玩家角色。
②英伟达高级研究科学家Jim Fan猜测，Sora不会明确调用UE5（虚幻引擎5），但有可能将UE5生成的文本、视频当做合成数据添加到训练集中。

02月19日 21:23 来自科创板日报郑远方阅 2.23W+

OpenAI首个文生视频模型Sora炸街！整个视频行业饭碗要被端了？业内人士：为时尚早

①OpenAI发布了首个文生视频模型Sora，可以用文字指令生成长达1分钟的高清视频。
②不少业内分析指出，这将对于广告业、电影预告片、短视频行业带来巨大的颠覆。也有从业者保持冷静：短期内的颠覆速度不一定那么快，更多地是借助新技术，激发更多人的创作力

02月17日 08:59 来自财联社记者黄心怡阅 2.48W+

奥特曼再放大招！OpenAI公布首个文生视频模型Sora，质量如何？

①Open AI对外公布文生视频模型Sora，其建立在过去对DALL-E和GPT模型的研究基础之上；
②Sora能够从文本说明中生成长达60秒的视频，并能够提供具有多个角色，特定类型的动作和详细的背景细节的场景；
③Sora还能在一个生成的视频中创建多个镜头。

02月16日 13:45 来自财联社唐叶天阅 2.95W+

多模态AI概念股异动反弹昆仑万维涨超10%

财联社2月6日电，昆仑万维涨超10%，云从科技、汤姆猫、软通动力涨超5%，三六零、视觉中国、中文在线、拓尔思等跟涨。消息面上，据外媒报道，谷歌表示，Gemini Pro是谷歌最大的人工智能(AI)模型之一，作为巴德(Bard)的升级版，现已向欧洲用户开放。通过Gemini，谷歌希望能与OpenAI的热门聊天机器人ChatGPT进行竞争。

多模态模型

02月06日 10:44 阅 6.97W+

多模态AI概念股午后拉升昆仑万维涨近10%

财联社1月23日电，昆仑万维涨近10%，科大讯飞、万兴科技涨超5%，三六零、拓尔思、云从科技、汤姆猫等跟涨。华金证券研报表示，24年初，荣耀和三星开启了新一年端侧AI竞赛，AIGC下沉端侧或将成为AI本年热点之一。端侧AI的蓬勃发展在硬件和生态端给予有力支撑，toC端内容创作门槛或将进一步降低，对硬件和算力强需求的游戏等产业或将迎来有力支撑。

多模态模型

01月23日 13:17 阅 8.03W+

多模态AI概念股走势低迷云从科技跌超7%

财联社12月26日电，云从科技跌超7%，昆仑万维、软通动力、天娱数科、新华网、宣亚国际等跌超5%。

多模态模型

12月26日 13:33 阅 7W+

首批大模型通过“国标”测试唯一A股龙头应声涨停机构：AI发展将提速

①全国首个官方“大模型标准符合性测试”结果公布，百度、腾讯、三六零、阿里云旗下大模型首批通过测试。
②《人工智能模型即服务（MaaS）参考架构》标准文件、《人工智能开源模型服务平台技术要求》已启动编制。
③券商认为，我国大模型的标准化正稳步推进，未来AI发展速度有望持续提升。

12月25日 12:01 来自科创板日报郑远方阅 2.34W+

Midjourney亮文生图杀器设计师、摄影师饭碗难保？下一步将是文生视频

①从零开始训练而成，整个开发周期长达九个月；
②在理解力以及光影、构图、材质、色彩等细节方面，V6远胜上一代产品；
③Midjourney平均每3个月更新一次，其未来的技术更新方向包括生成3D及视频。

12月23日 10:07 来自科创板日报阅 3.17W+

加载更多