Gemini引领多模态AI热潮,产业发展有望加速,苏州科达三连板
12月11日,多模态AI概念股继续活跃,苏州科达(603660.SH)三连板。截至当日中午收盘,因赛集团(300781.SZ)涨13.32%,苏州科达涨9.96%,宣亚国际(300612.SZ)涨9.7%。
消息面上,Google AI大模型Gemini近日发布,Gemini是Google到目前为止规模最大、能力最强的AI多模态模型,它将给整个广告营销行业带来巨大变化。
AI产业发展迎来里程碑
Gemini 1.0具有原生多模态的能力,能够处理视频、音频、图像、文本、代码等多种形式的内容,且性能优于现有的“拼接型”多模态大模型。
据谷歌介绍,Gemini不仅可以进行双模态之间的转换,也能处理需要进行多模态转换的复杂任务。
Gemini多模态大模型可以快速归纳并理解、操作不同类型的信息,包括文本、图像、音频、视频和代码等,这使得AI基础能力更具多样性。在智能营销领域,Gemini的推出将进一步优化用户体验并降低成本,诸如文本、图像、视频等都将进入到“能听会看”的时代。
多模态的意义在于,为AI应用带来更多的可能性,是通用人工智能发展的关键。
因此,Gemini上线是AI产业发展的里程碑事件,原生多模态AI有望拓展大模型的应用场景和边界。国盛证券分析称,Gemini的问世将为业界贡献大模型泛化能力的全新范式,推动AIGC加速向AI Agent的转变。
科技巨头争相发布多模态AI应用
除了谷歌,还有多家公司发布了多模态AI应用,包括Pika、阿里的Animate Anyone、字节跳动的Magic Animate、微软的GAIA等。
其中,Pika的多模态AI对标的是Runway Gen-2的AI视频生成平台;GAIA的AI工具可以使一张人物照片“张嘴说话”,并且带有音频。
此外,Meta也发布了AI工具Emu Video,可以根据文本和图像输入生成视频进行剪辑;Stable AI推出Stable Video Diffusion,能够从图像中生成高品质的视频剪辑;Runway在Gen-2中新增了Motion Brush动态笔刷功能,只要对着图像任意位置一刷,就能让静止的物体动起来;美图发布了AI视觉大模型Miracle Vision的4.0版本,新增AI设计和AI视频两大功能。
开源证券表示,科技巨头纷纷发布多模态AI应用,市场竞争日益激烈,同时驱动底层多模态大模型的能力不断突破,叠加GPTs等AI应用形式的出现,AI应用有望迎来快速增长期。
哪些细分领域值得关注?
中信证券表示,随着谷歌Gemini模型的发布,AI正式进入到多模态时代。从短期来说,Gemini将进一步提高市场对多模态模型的期待;从中长期来说,预计多模态模型的升级将进一步丰富使用场景,持续看好生成式AI对科技产业的长期影响,可以关注算力、算法、数据、应用等环节的优质厂商。
天风证券在研报中指出,随着ChatGPT通过升级迭代,以及Gemini展现出原生多模态能力,AI大模型浪潮已经进入到一个全新阶段,即从大语言模型转向多模态模型。近期,AI大模型、AI应用、算力等产业方向不断取得重要进展,可以重点关注AI产业方向的布局机会。
上述机构认为,AI和数字经济仍然是主线方向之一,未来需要重点关注光模块、算力租赁、PCB、GPT应用、数据要素、工业互联网等核心方向。
华泰证券则表示,AI将赋能营销行业生产力持续提升,行业增长空间有望提升。产业链公司可以保持关注,比如蓝色光标、易点天下、浙文互联、宣亚国际等。