
高通分享终端侧AI赋能行业新机遇

在国际电信联盟成立160周年之际,由中国通信学会主办的“2025世界电信与信息社会日系列活动”于5月16日至17日在江西南昌举行。其中,“AI与行业大模型应用专题研讨”以“AI大模型赋能千行百业”为主题展开讨论。本次活动聚焦“运营商AI与行业大模型布局”和“行业大模型实践与应用”两大核心板块,汇聚政府机构、科研院所及行业领军企业,共同解读全球AI发展趋势与治理方向,深入探讨AI大模型的技术前沿及其在各行业的实际应用。
高通技术公司产品管理副总裁姜波在“AI与行业大模型应用专题研讨”上发表主题演讲。他指出,作为终端侧AI领域的领导者,高通凭借领先的终端侧AI软硬件技术、广泛的边缘业务布局以及开放的生态合作,把握AI向推理时代迈进的重要机遇,推动AI在边缘及终端侧的繁荣发展,加速AI技术与产业深度融合,助力千行百业实现数字化转型,为产业发展注入全新动能。
以下是演讲内容全文:
各位嘉宾大家下午好!我是高通公司姜波。非常荣幸能够在国际电信联盟成立160周年之际,与大家相聚在南昌,共同探讨终端侧AI推理创新如何推动智能产业迎来全新发展机遇,并加速各行业对AI的规模化集成及用户体验的重塑。
今年年初,DeepSeek的推出引发了对AI模型训练方式的深刻变革,验证了AI即将从大规模训练向大规模推理转变的趋势。这一趋势将催生全新的终端侧推理计算创新周期。尽管模型训练仍将在云端进行,但模型推理正逐步向终端侧转移。
AI模型训练成本的降低与开源合作相结合,使得更多开发者和组织能够开发高质量模型,小模型逐渐接近前沿大模型的质量。虽然有人认为模型规模缩小会导致性能下降,但实际上,2024年以来推出的众多先进小模型已展现出卓越性能,甚至超越一年前仅能在云端运行的大模型。例如,DeepSeek R1、Meta Llama、IBM Granite和Mistral Ministral等主流模型系列均已推出小模型版本,并在特定任务中表现出色。
蒸馏技术是开发高效小模型的关键,它能够在保持准确性的同时实现知识的转移。以DeepSeek为例,在其发布的一周内,就出现了多种新的蒸馏模型,如通义千问和Llama蒸馏模型。经过蒸馏的Llama模型性能显著提升,而DeepSeek的Qwen-7B蒸馏模型的性能已与去年最先进的GPT-4云端模型相当。
根据Epoch AI的数据,2024年发布的大规模AI模型中,超过75%的参数规模在千亿以下。量化、压缩和剪枝等技术有助于缩小模型规模,使模型更高效地部署在智能手机、PC和汽车等终端设备上。这些优化不仅降低了功耗,还提升了推理速度和内存利用率。
随着高质量小模型数量持续增加,边缘及终端侧AI开发者在开发应用和智能体方面拥有更多选择。从全球范围来看,既有Llama、Mistral、Phi等开源模型,也有百川、Gemini Nano、通义千问等闭源模型。不同地区也在积极发展各自的特色模型,传统计算机视觉和物体检测领域所用模型在特定场景下依然不可或缺。
当前,各类设备(包括手机、汽车、PC、XR和工业物联网设备)在支持的模型参数规模方面展现出不同的能力。结合AI模型质量的不断提升,终端侧AI将具备更丰富的功能,如支持更长上下文、提供个性化体验、实现多模态交互和处理并发模型,这将极大地推动终端侧AI应用的创新与繁荣。
据预测,2025年中国新一代AI手机市场出货量将达到1.18亿台,占整个市场的40.7%;AI PC市场出货占比预计将从2024年的13%上升至37%。
作为终端侧AI的领导者,高通在人工智能领域已有超过15年的投入,拥有行业领先的硬件和软件解决方案,覆盖广泛终端,并具备卓越的异构计算能力、领先的软件优化和能效表现。此外,高通在全球范围内拥有数十亿用户设备的终端侧布局,涵盖智能手机、PC、汽车、XR和边缘网络设备等领域,同时与众多生态合作伙伴共同推动AI技术创新与应用。
2024年,高通与腾讯混元合作,基于骁龙8至尊版移动平台,共同推动腾讯混元大模型7B和3B版本的终端侧部署。这不仅为腾讯混元大模型提供了技术支持,还通过终端侧AI加速产品创新并有效降低运营成本。
在硬件方面,高通长期致力于开发定制CPU、NPU、GPU和低功耗子系统,拥有封装技术和热设计专长,构成行业领先的SoC产品基础。通过异构计算系统,高通帮助开发者调用硬件核心组件(如Oryon CPU、Adreno GPU、Hexagon NPU和高通传感器中枢)进行AI加速,满足即时性、图像处理和持续任务等多种需求。
在软件工具支持方面,高通推出了AI软件栈,支持端到端的模型部署与优化工作,兼容主流AI框架、runtime和操作系统。例如,高通AI软件栈支持ONNX、TensorFlow、PyTorch等主流框架,以及ONNX Runtime、Direct ML和TFLite等常用runtime。此外,高通AI引擎Direct为开发者提供自研runtime,调用硬件模块加速AI用例。为了更好地服务开发者,高通还推出了AI Hub,帮助开发者选择平台、开发模型并部署应用。
高通还推出了智能体AI规划器,作为AI软件栈的重要组成部分,位于应用与AI框架及runtime之间,为终端侧所有AI功能提供协调规划,赋能下一代智能体AI体验。
简而言之,这是一个端到端的解决方案,涵盖自然语言理解、意图分发和域服务调动等多个阶段。通过智能体AI规划器,用户可以简化技术使用方法,预测需求,并主动执行复杂工作流程,从而改变传统应用交互方式。
随着AI在终端侧的广泛应用,以应用为中心的体验正在发生深刻变革。通过自然语言、图像、视频与手势的交互方式,AI智能体能够预测用户需求并主动执行任务,成为新的用户界面(UI)。这种变革不仅影响单个应用,还将重新定义零售、餐饮等行业的客户体验逻辑。
今年,高通迎来成立40周年、深耕中国市场30年的重要里程碑。过去30年,高通一直与中国移动生态系统企业保持紧密合作。目前,高通正携手更广泛的合作伙伴,充分利用端侧AI的优势,共同把握产业发展机遇。
在智能手机领域,小米、荣耀、OPPO、vivo等厂商均已推出搭载骁龙8至尊版移动平台的旗舰产品,支持丰富的生成式AI用例。在PC领域,预计到2026年将有超过100款搭载骁龙X系列计算平台的产品发布或开发中,覆盖华硕、宏碁、戴尔、HP、联想和荣耀等品牌。同时,高通与腾讯会议、有道、爱奇艺、字节跳动等ISV合作伙伴协作,为开发者提供工具和支持,把握AI PC行业发展新机遇。在汽车领域,理想、小鹏等中国车厂已基于高通第四代骁龙座舱平台发布车端大模型功能。
站在新的起点上,高通将持续加强在可扩展硬件和软件方面的投入,通过与模型厂商的紧密合作,赋能开发者在终端侧加速采用AI智能体和应用,让AI更加触手可及,推动AI技术在千行百业的应用。
[1] IDC:2025年中国智能手机市场十大洞察
[2] Canalys:预计大中华区AI PC渗透率2024年达13%,2025年达37%
还没有评论,来说两句吧...