环球观点：计算机行业行业事件点评：商汤&阿里大模型发布，多场景实现落地应用

2023-04-13 10:07:58 来源：研报中心

(相关资料图)

事件：

2023年4月10日-4月11日，商汤&阿里分别发布日日新&通义大模型。发布会上展示了各家大模型的核心能力，并对落地场景进行分类介绍。

点评：

“商量”语言大模型赋能多场景应用。SenceChat是商汤自研的中文自然语言训练大模型，具有1800亿参数和问答理解生成等全面的中文语言能力，支持超长文本的知识理解，在多轮对话中表现优秀，适用于文献助手、问诊和编程等垂直领域。该模型可以赋能专业知识领域，提升文献阅读理解效率，支持医疗、编程等细分场景应用。

垂直场景应用实现空间、人、物的生成、融合与交互。基于大模型体系，商汤在垂直场景中自研多款生成式AI应用，包括文生图应用“秒画”、数字人应用平台“如影”、智能3D场景生成平台“琼宇”和3D物品生成应用“格物”，赋能绘画、电商直播平台、城市及园区数字孪生、建筑设计、影视创作、文旅和家居设计等场景。

基于MaaS（Model-as-a-Service，大模型即服务）和算力基础设施的大模型体系已在多个行业及场景落地。通过自动化数据标注、大模型推理部署、大模型并行及增量训练、开放模型及AI开发工具链，日日新大模型体系能够在真正意义上实现大模型即服务。结合商汤人工智能计算中心（AIDC）的核心算力储备，能够支持20个千亿规模参数量的模型训练。目前，商汤7000余张GPU算力已对外服务8家大型客户进行大模型训练，包含科研机构、头部商业银行、头部游戏公司、头部互联网公司、明星创业公司等企业。

通义千问具备多模态能力，外部系统调用赋能多场景落地。除具备同类语言模型基本能力外，基于M6-OFA的通义千问能够实现文生图等多模态功能，在动态推理及对比分析上表现出色。此外，通过调用搜索引擎等外部API，通义大模型能够进一步提升生成内容的准确性和丰富性。

投资建议：我们认为，国内大模型在四月密集发布，从实际体验来看虽与海外有一定差距，但在部分功能上表现优异，未来通过与行业应用结合，经历不断训练与精调提升模型核心能力，国内大模型有望实现新的突破。建议关注基础算力设施：浪潮信息、中科曙光等；行业应用：金山办公、福昕软件、广联达、深信服、恒生电子等。

风险提示：大模型技术推进缓慢；商业落地不及预期的风险等。

关键词

环球观点：计算机行业行业事件点评：商汤&阿里大模型发布，多场景实现落地应用

为您推荐

最近更新

今日推荐

股票里持仓量怎么看？股票里的持仓量是什么

资讯

48小时频道点击排行