(资料图片)
高通、苹果、英特尔、Meta、微软、谷歌等龙头企业相继布局终端生成式AI:
随着大模型参数规模的迅速增大,参数规模迈入千亿级和万亿级时代,通用大模型性能优秀,但也带来更大的硬件投入和功耗。近期Meta、微软、谷歌、苹果、英特尔等科技龙头公司均加快部署生成式AI,并探索在手机、PC等终端的应用。高通在《混合AI白皮书》中提出,混合AI是AI规模化发展的必然趋势,混合AI是指终端和云端协同工作,在适当的场景和时间下分配AI计算的工作负载,模型训练在云端实现;根据模型复杂度,推理工作部分放在终端侧。能够带来成本、能耗、性能、隐私、安全和个性化优势,助力实现随时随地的智能计算。混合AI市场潜力巨大,有望在未来十年内为高通打开约7000亿美元市场。
高通混合AI进展:
高通深耕AI研发15余年,拥有领先的边缘侧AI布局,终端侧AI处理器产品矩阵丰富,以8550为代表的高性能产品已广泛应用于多个终端,但传统SOC不适合生成式AI。高通的混合AI工作致力于推进全栈AI策略,助力AI生态系统大规模快速商业化,具体工作如下:一是算法和模型开发,在不牺牲准确度的前提下提高效率。例如:基于Q-SRNet模型的算法、采用INT4量化的软件,以及支持INT4加速的第二代骁龙8硬件,与INT8相比,INT4性能和能效提高1.5倍至2倍。二是提升软件和模型效率。高通AI软件栈全面支持主流AI框架,比如TensorFlow、PyTorch、ONNX等,旨在为开发者实现一次开发,即可跨高通所有硬件运行AI负载。三是硬件加速。高通AI引擎采用异构计算架构,包括Hexagon处理器、高通AdrenoGPU和高通KryoCPU,通过异构计算,开发者和OEM厂商可以优化智能手机和其他边缘侧终端上的AI用户体验。高通SoC有望持续推陈出新,NPU性能提高,AI算力持续升维。据高通官网数据,骁龙8Gen1的AI算力为9INT8TOPs,骁龙8Gen2的AI算力相比上一代约提升了4.35倍,新一代骁龙8Gen3算力有望持续提升。终端有望运行100亿及以上参数的模型。
终端生成式AI带来的硬件变化及投资机遇:
混合AI或带来硬件终端的变化:1)在功耗允许情况下,终端SoC算力持续提升,端侧软硬件一体框架加速优化;2)模型参数的缓存量较大,DRAM配置需根据模型大小同步递增,有望带动存储产业加速从周期底部走出;3)未来的生成式AI软件安装包中有可能集成训练好的模型参数,NAND配置需相应提高;4)手机、PC等终端的推理计算能耗增加,对产品的散热要求提高;5)数据吞吐增加,总线通信模式或带宽改变。我们认为,近年来消费电子创新乏力,换机周期逐渐延长,智能手机、PC的出货量有所放缓,终端生成式AI应用有望为消费电子产业链注入新动能:搭载高端SoC的机型渗透率有望持续提升,DRAM和NAND等存储芯片单机用量增加,通信、散热等环节持续优化,智能手机和PC的换机周期有望缩短;生成式AI在自动驾驶/智能座舱、机器人、XR、AIoT等领域的应用也有望提速。建议重点关注手机、PC、自动驾驶/智能座舱、机器人、XR、AIoT等相关产业链投资机会。
风险提示:行业竞争加剧;相关技术进展不及预期;商业变现能力不及预期。
Copyright @ 2008-2017 www.gxff.cn All Rights Reserved 中国创新网 版权所有 关于我们 联系我们: 58 55 97 3 @qq.com 备案号:沪ICP备2022005074号-30