芯原超低能耗NPU可为移动端大语言模型推理提供超40 TOPS算力

具备高能效比的架构，广泛适用于智慧手机和AI PC等终端设备

2025年6月9日，中国上海--芯原股份（芯原，股票代码：688521.SH）今日宣布其超低能耗且高性能的神经网络处理器（NPU）IP现已支持在移动端进行大语言模型（LLM）推理，AI算力可扩展至40 TOPS以上。该高能效NPU架构专为满足移动平台日益增长的生成式AI需求而设计，不仅能够为AI PC等终端设备提供强劲算力支持，而且能够应对智慧手机等移动终端对低能耗更为严苛的挑战。

芯原的超低能耗NPU IP具备高度可配置、可扩展的架构，支持混合精度计算、稀疏化优化和并行处理。其设计融合了高效的内存管理与稀疏感知加速技术，显著降低计算负载与延迟，确保AI处理流畅、响应迅速。该NPU支持数百种AI算法，如AI降噪（AI-NR）和AI超分（AI-SR）等，并兼容Stable Diffusion和LLaMA-7B等主流AI模型。同时，该NPU IP还可与芯原其他处理器IP无缝集成，实现异构计算，助力SoC设计者打造满足多元化应用需求的AI解决方案。

此外，芯原的超低能耗NPU IP还支持TensorFlow Lite、ONNX和PyTorch等主流AI框架，可加速客户在不同AI应用场景中的部署进程并简化集成工作。

“智能手机等移动设备正逐步演变为个人AI服务器。随着生成式AI（AIGC）和多模态大语言模型技术的快速发展，市场对AI算力的需求呈指数级增长，并已成为移动产品的关键差异化要素。”芯原首席战略官、执行副总裁、IP事业部总经理戴伟进表示，“在支持高强度AI计算负载的过程中，能耗控制是最关键的挑战之一。芯原持续深耕面向智慧手机和AI PC的超低能耗的NPU研发，并通过与主流SoC合作伙伴的紧密协作，见证了该技术在新一代智慧手机和AI PC中实现量产。”

关于芯原

芯原微电子（上海）股份有限公司（芯原股份，688521.SH）是一家依托自主半导体IP，为客户提供平台化、全方位、一站式芯片定制服务和半导体IP授权服务的企业。

公司拥有自主可控的图形处理器IP（GPU IP）、神经网络处理器IP（NPU IP）、视频处理器IP（VPU IP）、数字信号处理器IP（DSP IP）、图像信号处理器IP（ISP IP）和显示处理器IP（Display Processing IP）这六类处理器IP，以及1,600多个数模混合IP和射频IP。

基于自有的IP，公司已拥有丰富的面向人工智能（AI）应用的软硬件芯片定制平台解决方案，涵盖如智能手表、AR/VR眼镜等始终在线（Always-on）的轻量化空间计算设备，AI PC、AI手机、智慧汽车、机器人等高效率端侧计算设备，以及数据中心/服务器等高性能云侧计算设备。

为顺应大算力需求所推动的SoC（系统级芯片）向SiP（系统级封装）发展的趋势，芯原正在以“IP芯片化（IP as a Chiplet）”、“芯片平台化（Chiplet as a Platform）”和“平台生态化（Platform as an Ecosystem）”理念为行动指导方针，从接口IP、Chiplet芯片架构、先进封装技术、面向AIGC和智慧出行的解决方案等方面入手，持续推进公司Chiplet技术、项目的研发和产业化。

基于公司独有的芯片设计平台即服务（Silicon Platform as a Service, SiPaaS）经营模式，目前公司主营业务的应用领域广泛包括消费电子、汽车电子、计算机及周边、工业、数据处理、物联网等，主要客户包括芯片设计公司、IDM、系统厂商、大型互联网公司、云服务提供商等。

芯原成立于2001年，总部位于中国上海，在全球设有8个设计研发中心，以及11个销售和客户支持办事处，目前员工已超过2,000人。

NPU IP Selector

芯原超低能耗NPU可为移动端大语言模型推理提供超40 TOPS算力

具备高能效比的架构，广泛适用于智慧手机和AI PC等终端设备

关于芯原

Related Semiconductor IP

Related News

Latest News

芯原超低能耗NPU可为移动端大语言模型推理提供超40 TOPS算力

具备高能效比的架构，广泛适用于智慧手机和AI PC等终端设备

关于芯原

Subscribe to the Semi IP Hub Newsletter

Related Semiconductor IP

Related News

Latest News