芯原超低能耗NPU可为移动端大语言模型推理提供超40 TOPS算力

具备高能效比的架构,广泛适用于智慧手机和AI PC等终端设备

2025年6月9日,中国上海--芯原股份(芯原,股票代码:688521.SH)今日宣布其超低能耗且高性能的神经网络处理器(NPU)IP现已支持在移动端进行大语言模型(LLM)推理,AI算力可扩展至40 TOPS以上。该高能效NPU架构专为满足移动平台日益增长的生成式AI需求而设计,不仅能够为AI PC等终端设备提供强劲算力支持,而且能够应对智慧手机等移动终端对低能耗更为严苛的挑战。

芯原的超低能耗NPU IP具备高度可配置、可扩展的架构,支持混合精度计算、稀疏化优化和并行处理。其设计融合了高效的内存管理与稀疏感知加速技术,显著降低计算负载与延迟,确保AI处理流畅、响应迅速。该NPU支持数百种AI算法,如AI降噪(AI-NR)和AI超分(AI-SR)等,并兼容Stable Diffusion和LLaMA-7B等主流AI模型。同时,该NPU IP还可与芯原其他处理器IP无缝集成,实现异构计算,助力SoC设计者打造满足多元化应用需求的AI解决方案。

此外,芯原的超低能耗NPU IP还支持TensorFlow Lite、ONNX和PyTorch等主流AI框架,可加速客户在不同AI应用场景中的部署进程并简化集成工作。

“智能手机等移动设备正逐步演变为个人AI服务器。随着生成式AI(AIGC)和多模态大语言模型技术的快速发展,市场对AI算力的需求呈指数级增长,并已成为移动产品的关键差异化要素。”芯原首席战略官、执行副总裁、IP事业部总经理戴伟进表示,“在支持高强度AI计算负载的过程中,能耗控制是最关键的挑战之一。芯原持续深耕面向智慧手机和AI PC的超低能耗的NPU研发,并通过与主流SoC合作伙伴的紧密协作,见证了该技术在新一代智慧手机和AI PC中实现量产。”

关于芯原

芯原微电子(上海)股份有限公司(芯原股份,688521.SH)是一家依托自主半导体IP,为客户提供平台化、全方位、一站式芯片定制服务和半导体IP授权服务的企业。

公司拥有自主可控的图形处理器IP(GPU IP)、神经网络处理器IP(NPU IP)、视频处理器IP(VPU IP)、数字信号处理器IP(DSP IP)、图像信号处理器IP(ISP IP)和显示处理器IP(Display Processing IP)这六类处理器IP,以及1,600多个数模混合IP和射频IP。

基于自有的IP,公司已拥有丰富的面向人工智能(AI)应用的软硬件芯片定制平台解决方案,涵盖如智能手表、AR/VR眼镜等始终在线(Always-on)的轻量化空间计算设备,AI PC、AI手机、智慧汽车、机器人等高效率端侧计算设备,以及数据中心/服务器等高性能云侧计算设备。

为顺应大算力需求所推动的SoC(系统级芯片)向SiP(系统级封装)发展的趋势,芯原正在以“IP芯片化(IP as a Chiplet)”、“芯片平台化(Chiplet as a Platform)”和“平台生态化(Platform as an Ecosystem)”理念为行动指导方针,从接口IP、Chiplet芯片架构、先进封装技术、面向AIGC和智慧出行的解决方案等方面入手,持续推进公司Chiplet技术、项目的研发和产业化。

基于公司独有的芯片设计平台即服务(Silicon Platform as a Service, SiPaaS)经营模式,目前公司主营业务的应用领域广泛包括消费电子、汽车电子、计算机及周边、工业、数据处理、物联网等,主要客户包括芯片设计公司、IDM、系统厂商、大型互联网公司、云服务提供商等。

芯原成立于2001年,总部位于中国上海,在全球设有8个设计研发中心,以及11个销售和客户支持办事处,目前员工已超过2,000人。

×
Semiconductor IP