瑞萨:面向嵌入式部署的神经网络优化:模型压缩深度解析

Release time:2026-03-13
author:AMEYA360
source:瑞萨
reading:414

  01 为什么需要神经网络模型压缩?

  神经网络已经成为解决复杂机器学习问题的强大工具。然而,这种能力往往伴随着模型规模和计算复杂度的增加。当输入维度较大(例如长时序窗口、高分辨率特征空间)时,模型需要更多参数、每次推理需要更多算术运算,使其难以部署在嵌入式硬件上。

  对于嵌入式系统而言,资源极其有限。内存空间受限,因此在桌面或云平台上轻松运行的模型可能无法放入芯片内的闪存。此外,较高的运算量(MACs/FLOPs)和推理延迟要求往往超出低功耗MCU或边缘设备所能承受的范围。

  我们要解决的核心挑战是:如何在保持模型性能的前提下,大幅压缩神经网络模型,降低模型大小、推理时间和计算成本,从而实现其在资源受限的嵌入式系统上的部署。

  我们要解决的核心挑战是:如何在保持模型性能的前提下,大幅压缩神经网络模型,降低模型大小、推理时间和计算成本,从而实现其在资源受限的嵌入式系统上的部署。

  02 神经网络模型压缩是如何工作的?

  神经网络模型往往比实际需要的更大。在训练和验证之前,我们很难准确判断架构规模是否合理。模型压缩的目标就是识别模型中的冗余和未充分利用的权重并将其移除。

  我们使用专有的数学方法来寻找并压缩这些冗余,对网络进行重新整理,使其更加简洁、小巧和高效。同时,我们会严格控制精度损失,确保不会丢弃过多关键信息。

  03 实例:紧急尖叫声检测

  (Emergency Scream Detection)

  为了更直观地解释这一挑战,我们以“紧急尖叫声检测(ESD)”演示为例。ESD系统是一种机器学习模型,用于区分求救尖叫声和其他环境声音。该任务是一个二分类问题:Scream vs Not Scream。

  模型使用Google’s Audioset database公共数据集中的音频信号进行训练。训练数据集规模大且多样化,而验证数据集由团队采集的小规模现场录音构成。模型在训练集的k-fold验证中表现中等,但在新的现场数据上表现非常好。

  基线模型性能:

  我们使用基于全连接层的神经网络,并以STFT频谱图作为输入特征。该模型取得了最佳效果,达到:

  k-fold验证精度:82%

  现场数据测试精度:98%

  从性能角度看,该模型表现优秀。然而,它有一个关键问题:

  ROM占用:552kB

  该大小超过目标嵌入式平台(Voice RA6E1)的内存限制,导致无法部署。

  压缩模型性能:

  为了解决这一问题,我们应用了Renesas为嵌入式部署优化的专有神经网络压缩技术。

  压缩结果非常显著:

  模型大小从552kB降至117kB(减少约79%)

  k-fold验证精度保持82%

  现场测试精度保持98%

  MAC从129,68降至21,001(降低83%)

  也就是说,在几乎不影响模型性能的前提下,显著减少了模型规模和计算成本。

  图1–5展示了该对比的详细信息。图1显示AI Explore™的对比结果;图2和图3的混淆矩阵确认精度保持一致;图4和图5的红框部分(Flash Parameters)展示了模型大小和复杂度的核心差异,该数值反映了实际编译后部署的模型,比Explore页面上的估算更准确。

  04 更多成功案例

  表1汇总了其他示例模型的结果——其中,资产移动跟踪模型使用加速度计数据来识别设备或包裹的搬运与移动状态;吸尘器地面类型检测模型通过电机信号判断清扫对象的地面材质;电机启动负载检测模型能够在开环控制下快速判断电机的启动负载,从而帮助控制器实现节能优化。

  从这些实验结果可以看到,模型在压缩后的准确率基本得以保持。两个项目在压缩前后完全没有精度损失(紧急尖叫检测:98%→98%,电机启动负载:99%→99%),其余两个项目的变化也仅为1%的轻微下降(资产移动:92%→91%,吸尘器地面类型:96%→95%)。

  在保持精度几乎不变的同时,模型体积显著减小。尤其是较大的基线模型,ROM使用量减少超过75%。同时,MAC(Multiply-Accumulate)运算量也呈现同等幅度的下降,与ROM节省情况高度一致。

瑞萨:面向嵌入式部署的神经网络优化:模型压缩深度解析

  Table 1: Comparison of baseline and compressed models

  05 使用Reality AI Tools®进行模型压缩

  在Reality AI Tools®中,对神经网络模型进行压缩、重新训练、使用新数据进行测试以及部署到目标板上,都非常简单。事实上,在AI Explore™阶段,工具会自动完成模型压缩——你甚至不需要额外关注这一步骤。

  下面是一段精简的流程说明,展示你将会看到的主要步骤。

  (1) 首先,在Data→Curate模块中创建你的训练集和测试集。

  (2) 在AI Explore™页面中训练模型,并探索不同的特征空间与决策结构。点击“Start Explore”后,系统会自动训练和测试多种模型,并根据性能对它们进行排序。在Explore的结果中,你会同时看到部分模型的基线版本与压缩版本。当某个基线模型在不降低准确率的情况下可以进一步缩小体积时,工具会自动生成其压缩版本。压缩模型会使用一个特殊符号标记(如图7中红色箭头所示)。相反,没有该符号的则是未压缩的原始基线模型。

  一旦你确定了需要进一步评估与部署的模型,可以从该模型创建一个Base Tool,以便继续开展后续工作。此时,压缩后的模型即可用于重新训练、测试、优化以及部署,使用方式与原始基线模型完全一致。

  对于用户来说,使用压缩模型是完全透明的。它在系统中会像其他任何Trained Tool模型一样工作,不需要额外步骤或特殊处理。

  (3) 你可以在Test&Optimize→Try New Data区域测试压缩后的模型。选择压缩版本的Trained Tool模型以及所需的测试数据集,然后运行Accuracy Test(准确率测试),即可评估该模型在未见过的数据上的表现。

  (4) 部署同样非常简单。在验证压缩模型并确认其性能符合预期后,你可以进入Deploy→Embedded完成部署流程。选择已经训练好的压缩模型,并根据目标嵌入式系统的约束条件创建新的部署包。随后,下载生成的可导出模型包,并将其部署到目标硬件板上。与Reality AI Tools®中其他模型的部署方式完全一致,使用压缩模型无需任何额外步骤或特殊处理。

  结论

  在部署机器学习模型时,仅有高准确率还远远不够。模型还必须满足严格的内存预算,并在资源受限的环境中高效运行。我们先进的神经网络模型压缩技术,使开发阶段的高性能模型能够轻松过渡为可部署于边缘设备的轻量化AI解决方案。

瑞萨:面向嵌入式部署的神经网络优化:模型压缩深度解析


("Note: The information presented in this article is gathered from the internet and is provided as a reference for educational purposes. It does not signify the endorsement or standpoint of our website. If you find any content that violates copyright or intellectual property rights, please inform us for prompt removal.")

Online messageinquiry

reading
智能烹饪:CUCKOO携手瑞萨电子推出AI电磁炉灶
  二十余年来,CUCKOO在韩国一直是“完美米饭”的代名词。其公司前身是1978年成立的Sung-kwang Electronics,早年以OEM供应商身份运营,直至1998年推出CUCKOO品牌。自面世以来,CUCKOO压力电饭煲在韩国市场占有率一直稳居榜首。如今,CUCKOO不仅是韩国销量领先的电饭煲品牌,更已成长为全球知名的家电企业,产品线涵盖净水器、空气净化器、吸尘器以及各类厨房电器。  现在,CUCKOO将其在精准烹饪领域积累的经验与热忱,倾注于一款全新旗舰产品:搭载人工智能(AI)技术的电磁炉。该产品具备“智能聆听”功能,可自动识别并防止汤汁沸溢,兼顾安全与干净。这款电磁炉由CUCKOO携手瑞萨电子(Renesas)合作,依托瑞萨Reality AI技术共同开发,不仅面向韩国家庭,也致力于满足全球用户对高效、安全厨房体验的需求。  从电饭煲标杆到智能电磁烹饪先锋  CUCKOO凭借对细节的执着追求而声名远扬:精准的压力曲线、精心调校的加热程序,以及针对不同稻米品种和地域口味优化的烹饪算法。这种对细节的追逐助力该公司在本土市场取得领先优势,并成功拓展至约30个国家,包括中国、马来西亚、新加坡和美国,业务逐年稳步增长。  CUCKOO对精准烹饪的热忱,自然延伸至电磁灶具领域。自21世纪中期以来,CUCKOO便凭借其在电磁感应加热(IH)方面的技术专长,开发出能直接对炊具供电,实现快速、精准加热的电磁炉灶和组合灶具。  与燃气灶使用明火,可直观控制火候却会释放室内污染物不同,电磁烹饪依靠电磁感应原理,使其加热更快速、更安全、更高效——能量转换率达90%,而燃气灶通常仅为40%。  “电炉灶是另一种选择。其能效为70%,但采用辐射式线圈,表面加热速度缓慢。”Yoon Ho Lee, Laboratory Chief Director of Engineering, Cuckoo表示,“而感应技术配合专用磁性锅具,可瞬间调节温度并快速冷却。”  CUCKOO的IH灶具独具特色:设有混合加热区,结合电磁感应与辐射式“聚光”元件;采用专利平衡控制技术,确保锅具内外受热均匀;并搭载超高温控制技术,支持最大功率持续运行一小时,满足爆炒或煎烤等高温烹饪需求。  然而,即便具备这些优势,  用户仍长期面临一个顽固难题:溢锅。  溢锅问题及其重要性  传统电磁炉灶虽然能在极短时间内将水烧开,但这种高温同样容易使汤、炖菜和淀粉类食物沸腾溢出,不仅弄脏厨房,更对儿童和老年人构成安全隐患。美国卫生研究院2025年开展了一项研究,对韩国多家老年生活中心300余名65岁以上人群进行调查,结果显示,厨房相关的烧伤和火灾已成为居家伤害的第三大成因。  目前,市面上的烹饪灶具大多依靠简易定时器或温度阈值警报来应对溢锅风险。迄今为止,尚无任何可靠技术能够准确区分“剧烈但可控的沸腾”和“即将喷涌而出的溢锅状态”。  CUCKOO决心开发一款更智能的灶具——能够实时检测溢锅状态并自动干预,让用户无需时刻守在锅边。这意味着需要为灶具赋予“听觉”和“判断力”。  检测溢锅看似简单,但背后的工程挑战却不容小觑。沸腾产生的声音特征会受到灶具材质、容器的形状和大小、食物容量、食材种类,以及抽油烟机等其它厨房环境噪音的干扰。  Reality AI与RA6E1:边缘端TinyML应用  为应对这些复杂变量,CUCKOO的工程师研究出一套可训练的AI解决方案,无需依赖云端服务器即可管理台面灶具。这也促成了CUCKOO与瑞萨的合作——自2008年起,瑞萨便一直为CUCKOO的IH电饭煲提供核心计算芯片及技术支持。  瑞萨的Reality AI与RA6E1微控制器(MCU)构成了该解决方案的基础。Reality AI软件工具包提供基于非视觉传感器数据(如声音和振动)的TinyML与边缘AI模型,可高效部署于瑞萨MCU平台。  CUCKOO团队与瑞萨工程师及当地合作伙伴Koshida Korea紧密协作,从各类锅具、食谱和厨房场景中收集大量传感器数据,进而训练出多个专用AI模型,用于识别不同锅具与烹饪条件下的沸腾模式。  “Reality AI可自动为机器学习应用匹配最优传感器组合,CUCKOO借助它构建特定场景模型。”Lee先生谈到,“瑞萨将这些模型部署在RA6E1 MCU上,由其运行边缘AI溢锅判断逻辑,在保持极低功耗的同时实现极快的响应。”  经过在各种环境和使用条件下的多次测试与评估,系统通过结合辅助AI模块与主模块进一步提升了性能。除RA6E1外,瑞萨RX130 MCU负责管理核心电磁感应加热控制回路,利用AI信息进行精细功率调节,确保安全运行。iW1825 AC/DC控制器则为电子设备提供高效、可靠的电源。  “通过持续的数据收集、软件优化和调校,并结合CUCKOO自身的电磁感应(IH)控制技术,该系统的防溢锅检测准确率超过90%。”Lee先生说,“这让烹饪者能够安心离开灶台去处理其他食材,无需担心突然发生溢锅事故。”  未来AI厨房一瞥  CUCKOO首款AI电磁炉已于2025年末投入量产,更多型号也将陆续推出。初期产品主要面向韩国市场,后续逐步将这项技术拓展至全系列灶具,并最终推向全球市场。  展望未来,CUCKOO与瑞萨将溢出检测视为一系列技术迭代的起点。相同的Reality AI框架还可借助声音、振动和功率曲线,识别特定菜品和份量,并自动优化加热曲线,以烹制完美的面条、炖菜或煎炸料理,其应用也可拓展至其它家电。  “五年内,CUCKOO计划推出能识别正在烹饪的食材,并自动匹配食谱和加热曲线的电磁炉,让智能灶具真正成为烹饪助手。”Lee先生表示。  从韩国领先的电饭煲品牌,到如今推出AI电磁炉,CUCKOO始终致力于提升用户日常烹饪体验。携手合作伙伴瑞萨,CUCKOO正将布谷鸟钟般的精准与现代AI的智慧,带入全球千家万户的厨房之中。
2026-04-02 10:17 reading:215
瑞萨电子丨从分散到集中:RH850/U2C如何定义下一代底盘控制核心
  近日,由ATC汽车技术平台主办的“2026第五届ATC汽车软件与安全技术周”在上海圆满举办。  技术周同期召开“2026第十届汽车ISO26262功能安全开发与应用技术峰会”和“2026第四届汽车嵌入式软件技术峰会”, 汇聚汽车电子相关领域的优秀专家,探讨智驾功能安全、底盘功能安全、新能源功能安全及SOTIF、AUTOSAR、嵌入式软件、电子架构等多个领域的最新研究成果和实践经验。瑞萨电子受邀参加,瑞萨汽车电子技术高级经理詹毅在峰会中发表了《从分散到集中——RH850/U2C定义下一代“大底盘”的控制核心》主题演讲,围绕下一代电子电气架构的发展趋势,深入解析了底盘区域控制器的技术演进,并重点介绍了瑞萨RH850/U2C系列MCU在区域架构中的核心定位与技术优势。  瑞萨汽车电子技术高级经理 詹毅  区域架构兴起,底盘控制走向集中  随着汽车电子电气架构从分布式向集中式演进,区域控制器正成为整车功能整合的关键节点。不同主机厂根据自身技术路线和挑战,正加速向区域架构转型。在这一趋势下,底盘系统也从多个独立的ECU(如ESC、EPS、悬架、EPB等)走向融合,由底盘区域控制器统一负责纵向(驱动/制动)、横向(转向)和垂向(悬架)的协同控制。  在区域架构中,底盘区域控制器承担着传感器信号采集、复杂算法运算、多执行器控制等任务,同时需集成以太网、CAN-FD/CAN-XL、LIN等多种通信接口,并具备高安全等级和低功耗待机能力。瑞萨电子推出的RH850/U2C系列微控制器,正是面向这一需求设计的高性能解决方案。  RH850/U2C:  专为区域控制打造的高性能MCU  RH850/U2C系列定位于RH850/U2x家族的中高性能层级,专为区域控制器、底盘与安全应用打造。其核心特性体现在以下几个方面:  性能与可扩展性:采用瑞萨自研G4KH内核,主频达320MHz,支持双核锁步配置,最高可提供1500 DMIPS的计算能力。产品覆盖2MB至8MB的代码闪存,SRAM最高达1.5MB,并支持双Bank闪存实现无中断的OTA升级。  安全与可靠性:符合ISO 26262 ASIL-D功能安全等级,内置硬件安全模块HSM,支持Evita-Full安全标准及中国商用密码算法,满足ISO 21434网络安全要求。  连接性:集成了千兆以太网TSN、10Mbps以太网T1S、CAN-XL、FlexRay、SENT、PSI5等接口,同时保留传统CAN-FD、LIN、SPI、I2C等,充分兼容新旧两代通信需求。  低功耗设计:采用28nm工艺,支持Deep STOP模式,可在不唤醒CPU的情况下由低功耗采样器监测外部输入,大幅降低待机功耗。  典型应用场景:  制动、线控制动与电机控制  面向实际应用,RH850/U2C展现了强大的实战能力:  车辆稳定控制:集成SENT、PSI5等传感器接口,结合高精度12-bit SAR ADC(采样率1Msps)和丰富定时器资源,可同时控制多个电磁阀与电机,实现精确的车轮制动调节。  电子机械制动(线控制动):针对EMB系统,利用专用定时器TSG3/GTM实现高精度BLDC电机控制,结合位置传感器与电流反馈,完成制动卡钳的精确夹紧。  通用电机控制:支持多达三个独立12-bit ADC,每个配备4路同步采样保持,配合GTM高级定时器,适用于各类底盘域中的电机驱动场景。  软件生态:  完整AUTOSAR支持与开发工具  瑞萨为RH850/U2C提供了完善的软件与开发支持,包括符合AUTOSAR Classic标准的MCAL(ASIL-D认证)、HSM安全软件低层驱动示例代码,并支持Hypervisor、RTOS、虚拟平台等,同时与主流合作伙伴共同提供完整AUTOSAR栈。  开发工具方面,瑞萨推出了RH850/U2C Starter Kit开发套件,包含评估板、E2仿真器、Green Hills Multi及CS+开发环境试用许可证,帮助工程师快速启动项目。  定义下一代底盘控制核心  随着整车架构向区域化、集中化演进,底盘控制器的复杂度与集成度不断提升。瑞萨RH850/U2C系列凭借其高性能多核架构、功能安全与信息安全融合、丰富的高速与低速接口,以及可扩展的存储与封装选项,为下一代底盘区域控制器提供了坚实的技术基础。  无论是传统的车辆稳定控制,还是新兴的线控制动、电控悬架,RH850/U2C都能以统一的平台支持多样化的应用需求,帮助客户缩短开发周期,降低系统成本,同时满足未来汽车对安全、实时性和可升级性的严苛要求。
2026-04-01 09:39 reading:246
喜报 | 聚力航行,智链新程——瑞萨电子荣获航盛集团“优秀伙伴奖”
瑞萨电子丨高性能视觉AI系统:赋能下一代实时目标检测
  随着机器人、自动驾驶和智慧城市等领域的快速发展,对实时数据处理与决策的需求日益迫切。传统基于云的AI处理存在延迟高、依赖持续网络连接等问题,难以满足关键应用的实时性要求。  瑞萨RZ/V系列嵌入式AI处理器,正是为应对这一挑战而生。该系列处理器旨在本地处理数据,减少延迟、降低功耗、提升效率与隐私安全。其中,高端视觉AI微处理器RZ/V2H融合了专有的DRP-AI3加速器与高性能实时处理器,成为机器人实时目标检测的理想硬件平台。  解决方案核心  嵌入式AI处理器  作为一款高端视觉AI MPU,RZ/V2H专为嵌入式边缘处理设计。它集成专用DRP-AI3加速器、四核Arm® Cortex®-A55应用处理器和双核Cortex®-R8实时处理器,并搭载动态可重构处理器(DRP)加速OpenCV等图像处理算法。  该芯片提供PCIe®、USB 3.2与千兆以太网接口,以低功耗实现高性能AI推理与实时控制,是自主机器人、机器视觉等工厂自动化应用的理想选择。  高效电源管理  实现系统精准供电  为确保视觉AI系统的高性能与低功耗运行,其电源管理方案采用了精准、高效的多级供电设计。  此方案的核心是多通道PMIC RAA215300,它专为32位和64位MCU和MPU应用设计,提供9路供电输出,并内置实时时钟等关键模块,专为系统级模块(SOM)优化,能有效支持各种内存接口,另外,其扩频技术有助于降低电磁干扰。  系统采用分级降压策略,对于主处理器及大电流负载,RAA211250同步降压稳压器提供宽输入电压范围(4.5V至30V)和高达5A的持续输出,其可编程开关频率和多种工作模式(PWM/PFM)实现了效率与动态响应的最佳平衡,并减少外部元件数量和BOM成本。  对于中低电流的板载电源轨,则使用ISL80031A(3A输出)和ISL80015(2A输出)等高效、紧凑的同步降压转换器。它们工作于1MHz或2MHz高频,允许使用微型电感器,显著节省PCB空间,同时提供出色的瞬态响应。  为高性能AI处理核心供电的是DA9141四相降压DC/DC转换器。它能驱动高达40A的负载,专为低电压、大电流的处理器内核设计。其多相架构不仅提升了电流输出能力,也优化了热性能和电压纹波,是保障算力稳定释放的关键。  整个电源架构通过器件的高度集成与内部补偿设计,最大限度地减少了外部元件数量,在提供精准、稳定、多路供电的同时,实现了优化的系统成本与电路板面积。  时钟与无线连接  提供精准时序与高速无线通信  为确保系统稳定高效运行,该系统采用5L35023 VersaClock® 3S可编程时钟发生器。其三个独立可编程PLL可生成多达五个时钟信号,内置智能省电与过冲抑制技术,并通过I²C接口灵活配置。  同时,系统还集成了支持Wi-Fi 6的CL8040芯片与DA14531低功耗蓝牙模块。提供高速、稳定的双频无线连接与近场通信能力,全面满足机器人对实时响应与网络接入的需求。  CL8040是一款高度集成的Wi-Fi 6单芯片解决方案,将两个支持4T4R架构的并行双频无线电集成于11mm×11mm封装内,提供高达3Gbps的聚合速率。该芯片内置双MAC/PHY、CPU及存储器,无需外置内存,并通过双通道PCIe 3.0接口与主机连接,为紧凑型设备提供了高性能、低成本的无线连接方案。  DA14531 SmartBond TINY™模块基于全球最小、功耗最低的蓝牙5.1 SoC,是高度集成的低功耗蓝牙解决方案。该模块通过全球认证,仅需单电源即可构建蓝牙应用,搭配集成天线与易用软件,能最大化简化开发流程,显著降低物联网设备的开发成本与上市时间。  系统核心优势  高性能与实时性完美呈现  该高性能视觉AI系统的核心优势体现在四个方面:  性能与实时性:单芯片集成强大的DRP-AI3加速器与Cortex-R8®实时处理器,实现了从感知、决策到控制的毫秒级闭环响应,彻底消除了传统多芯片架构的通信延迟。  能效:通过多层优化的电源管理架构,显著降低了整体功耗,为移动机器人等设备提供了持久的续航能力。  开发便利性:系统提供预先训练的模型与完整的SDK,大幅降低了AI应用开发的技术门槛与时间成本。  该方案通过创新的边缘AI处理,有效解决了延迟、安全与功耗的关键挑战,其灵活可重构的架构与高度集成的设计,为下一代智能设备的普及与智能化升级奠定了坚实的技术基础。
2026-03-27 13:02 reading:405
  • Week of hot material
  • Material in short supply seckilling
model brand Quote
CDZVT2R20B ROHM Semiconductor
RB751G-40T2R ROHM Semiconductor
TL431ACLPR Texas Instruments
BD71847AMWV-E2 ROHM Semiconductor
MC33074DR2G onsemi
model brand To snap up
TPS63050YFFR Texas Instruments
IPZ40N04S5L4R8ATMA1 Infineon Technologies
ESR03EZPJ151 ROHM Semiconductor
STM32F429IGT6 STMicroelectronics
BP3621 ROHM Semiconductor
BU33JA2MNVX-CTL ROHM Semiconductor
Hot labels
ROHM
IC
Averlogic
Intel
Samsung
IoT
AI
Sensor
Chip
About us

Qr code of ameya360 official account

Identify TWO-DIMENSIONAL code, you can pay attention to

AMEYA360 weixin Service Account AMEYA360 weixin Service Account
AMEYA360 mall (www.ameya360.com) was launched in 2011. Now there are more than 3,500 high-quality suppliers, including 6 million product model data, and more than 1 million component stocks for purchase. Products cover MCU+ memory + power chip +IGBT+MOS tube + op amp + RF Bluetooth + sensor + resistor capacitance inductor + connector and other fields. main business of platform covers spot sales of electronic components, BOM distribution and product supporting materials, providing one-stop purchasing and sales services for our customers.

Please enter the verification code in the image below:

verification code