(相关资料图)
事件:
2023年4月10日-4月11日,商汤&阿里分别发布日日新&通义大模型。发布会上展示了各家大模型的核心能力,并对落地场景进行分类介绍。
点评:
“商量”语言大模型赋能多场景应用。SenceChat是商汤自研的中文自然语言训练大模型,具有1800亿参数和问答理解生成等全面的中文语言能力,支持超长文本的知识理解,在多轮对话中表现优秀,适用于文献助手、问诊和编程等垂直领域。该模型可以赋能专业知识领域,提升文献阅读理解效率,支持医疗、编程等细分场景应用。
垂直场景应用实现空间、人、物的生成、融合与交互。基于大模型体系,商汤在垂直场景中自研多款生成式AI应用,包括文生图应用“秒画”、数字人应用平台“如影”、智能3D场景生成平台“琼宇”和3D物品生成应用“格物”,赋能绘画、电商直播平台、城市及园区数字孪生、建筑设计、影视创作、文旅和家居设计等场景。
基于MaaS(Model-as-a-Service,大模型即服务)和算力基础设施的大模型体系已在多个行业及场景落地。通过自动化数据标注、大模型推理部署、大模型并行及增量训练、开放模型及AI开发工具链,日日新大模型体系能够在真正意义上实现大模型即服务。结合商汤人工智能计算中心(AIDC)的核心算力储备,能够支持20个千亿规模参数量的模型训练。目前,商汤7000余张GPU算力已对外服务8家大型客户进行大模型训练,包含科研机构、头部商业银行、头部游戏公司、头部互联网公司、明星创业公司等企业。
通义千问具备多模态能力,外部系统调用赋能多场景落地。除具备同类语言模型基本能力外,基于M6-OFA的通义千问能够实现文生图等多模态功能,在动态推理及对比分析上表现出色。此外,通过调用搜索引擎等外部API,通义大模型能够进一步提升生成内容的准确性和丰富性。
投资建议:我们认为,国内大模型在四月密集发布,从实际体验来看虽与海外有一定差距,但在部分功能上表现优异,未来通过与行业应用结合,经历不断训练与精调提升模型核心能力,国内大模型有望实现新的突破。建议关注基础算力设施:浪潮信息、中科曙光等;行业应用:金山办公、福昕软件、广联达、深信服、恒生电子等。
风险提示:大模型技术推进缓慢;商业落地不及预期的风险等。