业界
浙商证券:通用大模型以及产品型AI应用厂商有望深度受益于“大模型+MCP+A2A”生态
浙商证券发布研报称,近期,OpenAI推出o4-mini和满血版o3模型,工具使用能力提升有望实现模型在复杂场景下的任务处理,而谷歌发布一系列多模态模型更新,跨模态能力提升有望大幅延伸AI应用场景;在生态侧,近期国内外多家厂商宣布接入MCP协议,谷歌也推出A2A协议旨在构建多智能体协同应用生态,通用大模型以及产品型AI应用厂商有望深度受益。
浙商证券主要观点如下:
OpenAI推出o4-mini和满血版o3模型,多模态能力及智能水平大幅提升
o4-mini和o3是两款多模态模型,能同时处理文本、图像和音频,并且能作为Agent智能体自动调用网络、图像生成、代码解析等工具以及深度思考模式,工具使用能力的实现使得模型能够处理更加复杂的任务场景,而不仅仅局限于简单的文本生成。在可用性方面,除了ChatGPTPlus、Pro和Team用户可以调用模型外,满血o3和o4-mini也通过Chat Completions API和Responses API向开发者开放。ResponsesAPI支持推理摘要功能,能够在函数调用时保留推理标记以提升性能,并且很快将支持内置工具,包括网页、文件和代码解释器,以增强模型的推理能力。
谷歌发布一系列多模态模型更新,跨模态能力大幅提升
近期,谷歌在Google Cloud Next 25大会上发布一系列AI重大更新,跨模态能力再次实现大幅迭代,有望大幅拓展AI应用场景并满足用户不同需求,其中:
生成模型Veo2:现在Veo2模型支持P、关键帧生成、扩展画面、镜头控制等特性;音频理解与生成模型Chirp3:Chirp3提供了超过35种语言的自然逼线秒的短录音就生成非常逼真的自定义语音,并且可以区分音频中的说话人身份、提升音频转文本的易用性;音乐生成模型Lyria:可制作高保真音频,精准捕捉细微差别,并呈现丰富细腻的音乐作品,涵盖各种音乐类型,可帮助企业提升品牌体验并简化内容创作。图像生成模型Imagen3:模型提升了
MCP+A2A协议有望推动Agent应用生态繁荣,关注价值链投资机遇
MCP允许AI模型从业务工具、软件、数据库以及应用开发环境等
4月10日,谷歌在Google CloudNext 25大会上开源了首个标准智能体交互协议——Agent 2 Agent Protocol,A2A有望打破系统孤岛,对智能体的能力、跨平台、执行效率产生质的改变,支持Intuit、Mongo DB、Salesforce、SAP、Service Now和Workday等主流企业应用平台。在实际应用中,客户端Agent负责制定和传达任务,而远程Agent则根据这些任务采取行动,以提供正确的信息或执行相应的操作,同时Agent可以相互发送消息,使其能够更好地协同工作,共同完成复杂的任务。
该行认为,在大模型各方面性能加速迭代,叠加MCP和A2A等数据和执行层协议的完善和应用厂商的加入,AI智能体应用生态有望加速构建,关注通用大模型及产品型应用厂商的投资机遇:
Agent应用:科大讯飞、焦点科技、光云科技、税友股份、鼎捷数智、卓易信息、彩讯股份、迈富时、泛微网络;
AI垂类应用:金山办公、福昕软件、万兴科技、合合信息、昆仑万维、虹软科技、润达医疗、美图公司、商汤-W;