10687 字
53 分钟
电池管理系统(BMS)设计指南 - 从系统架构到量产运维

目录#


1. 系统概述与设计目标#

1.1 应用场景#

BMS(Battery Management System)是电池包的大脑,负责监控、保护、均衡和通信。不同应用场景对BMS的需求差异巨大:

场景电压等级电芯串数核心需求典型架构
电动汽车(BEV)400V / 800V96~200串高安全性、高精度SOC、长寿命主从分布式
储能系统(ESS)48V~1500V16~400串长循环寿命、低成本、电网交互主从/堆叠式
两轮电动车48V / 60V / 72V13~20串低成本、小体积集中式
消费电子3.7V~7.4V1~2串极致集成、低功耗单芯片
电动工具18V~36V5~10串大电流、高可靠性集中式
无人机14.8V~22.2V4~6串高倍率、轻量化集中式
48V微混48V12~16串大电流充放电、高可靠性集中式/分布式

1.2 技术指标#

设计BMS前需明确的关键技术指标:

采样精度:

参数乘用车要求储能要求消费电子要求
单体电压±5mV(全温度范围)±10mV±25mV
总压±0.5% FS±1% FS±1% FS
电流±0.5% FS(含零点漂移)±1% FS±5% FS
温度±1°C(-40~85°C)±2°C±3°C
绝缘电阻±5%(>1MΩ范围)±10%不要求

SOC估算精度:

  • 全生命周期常温:±3% @ 25°C
  • 全温度范围:±5%
  • 老化末期:误差不超过 ±8%

功能安全等级:

  • 乘用车BEV:ASIL C/D
  • 商用车:ASIL C
  • 储能系统:SIL 2(IEC 61508),ASIL B等效
  • 两轮车:通常无功能安全要求

通信速率:

  • CAN:500 kbps / 1 Mbps(CAN FD 2~5 Mbps)
  • isoSPI菊花链:1 Mbps
  • 以太网(车载):100BASE-T1

1.3 总体架构#

┌─────────────────────────────────────────────────────────────────┐
│ 整车控制器 (VCU) │
│ CAN / CAN FD / Ethernet │
└──────────────────────────┬──────────────────────────────────────┘
┌──────────────────────────▼──────────────────────────────────────┐
│ BMS主板 (BCU / BMU) │
│ ┌─────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ SOC计算 │ │ 故障诊断 │ │ 通信管理 │ │ 热管理 │ │
│ └─────────┘ └──────────┘ └──────────┘ └──────────┘ │
│ ┌─────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ 均衡控制 │ │ 充电管理 │ │ 绝缘检测 │ │ 继电器驱动│ │
│ └─────────┘ └──────────┘ └──────────┘ └──────────┘ │
└──────────────────────────┬──────────────────────────────────────┘
│ isoSPI / CAN / UART
┌─────────────────┼─────────────────┐
│ │ │
┌────────▼────────┐ ┌──────▼──────┐ ┌──────▼──────┐
│ 从板 CMU #1 │ │ 从板 CMU #2 │ │ 从板 CMU #N │
│ 12~18串电芯采样 │ │ 12~18串 │ │ 12~18串 │
│ NTC温度采集 │ │ NTC温度采集 │ │ NTC温度采集 │
│ 被动均衡 │ │ 被动均衡 │ │ 被动均衡 │
└────────┬────────┘ └──────┬──────┘ └──────┬──────┘
│ │ │
┌────▼────┐ ┌────▼────┐ ┌────▼────┐
│ 电芯组1 │ │ 电芯组2 │ │ 电芯组N │
└─────────┘ └─────────┘ └─────────┘

架构选型准则:

架构类型适用串数优点缺点
集中式≤24串成本低、结构简单线束多、扩展性差、EMC难做
分布式(CAN)24~200串扩展性好、线束简练、抗干扰强单点成本高、同步采样需要协议
分布式(isoSPI)24~400串高速同步、线束最少、EMC最优物理层需专用芯片、链路调试复杂
无线BMS任意零线束、极致灵活性时延和可靠性仍在验证

1.4 适用标准#

标准号适用范围关键内容
ISO 26262道路车辆功能安全ASIL等级、安全生命周期
IEC 61508通用功能安全SIL等级(储能BMS)
GB/T 38661中国电动汽车BMS技术要求与试验方法
GB 38031电动汽车用动力蓄电池电芯与电池包安全
UL 2580北美电动汽车电池安全测试
IEC 62619工业用锂电池安全要求(储能)
UN 38.3锂电池运输安全环境与机械测试
ISO 21434道路车辆网络安全软件OTA安全
GBT 27930非车载充电通信直流充电CAN协议
SAE J1772北美交流充电充电接口与控制导引

1.5 本文速览#

本文按BMS产品开发流程展开:第1章明确系统指标与架构选型;第2章覆盖电压/温度/电流/绝缘的采样硬件设计;第3章深入SOC估算(安时积分、OCV、EKF)与SOH/SOP算法;第4章建立三级保护体系(硬件/固件/软件);第5章对比被动与主动均衡的电路与控制策略;第6章规范交流与直流充电接口通信及CC-CV充电曲线;第7章设计加热/散热/热失控预警的完整热管理链路;第8章详述继电器选型、预充时序与驱动电路;第9章覆盖CAN/isoSPI/车载以太网与UDS诊断/OTA;第10章按ISO 26262进行ASIL分解、冗余设计与故障响应;第11章规划高低压供电架构与低功耗休眠策略;第12章给出RTOS任务划分、CPU利用率分析与NVM数据布局;第13章明确爬电距离、EMC分区与制造工艺要求;第14章覆盖HIL/EMC/环境可靠性/功能安全验证;第15章规范EOL标定、售后诊断与全生命周期数据追溯。

⬆ 返回目录


2. 电芯监控与数据采集#

2.1 电压采样#

单体电压采样拓扑:

单体电压是BMS最基本也最重要的输入。主流架构使用专用AFE(Analog Front End)芯片:

点击展开 AFE 芯片对比表
AFE芯片通道数采样精度通信接口均衡电流典型应用
ADI LTC681112串±1.2mVisoSPI外置MOS乘用车
ADI LTC681318串±1.2mVisoSPI外置MOS储能/商用车
TI BQ76PL455A16串±2mVUART/菊花链外置MOS乘用车
TI BQ7961616串±1.5mV菊花链内置300mA新一代
NXP MC3377114串±2mVSPI/菊花链内置300mA乘用车
Maxim MAX1785314串±1.2mV菊花链内置150mA乘用车

关键设计要点:

  1. 输入滤波:每个通道RC低通滤波,截止频率通常设置10~100Hz,平衡响应速度和噪声抑制。
  2. PCB布局:差分走线尽量等长,Kelvin连接(开尔文接法),远离大电流区域。
  3. ESD保护:每路输入并联TVS管和共模扼流圈。
  4. 校准:出厂需做全温度范围增益和偏置校准。

2.2 温度采样#

NTC热敏电阻方案:

VREF ──→ R_pullup ──┬──→ ADC输入
NTC ──→ GND

NTC特性:RT=R25eB(1T1298.15)R_T = R_{25} \cdot e^{B \cdot (\frac{1}{T} - \frac{1}{298.15})}

其中 R25R_{25} 为25°C电阻值,BB 为材料常数。

温度采样点布置策略:

位置数量目的
电芯极柱每2~4串1个电芯本体温度
电芯中间每模组1~2个电芯内部最高温度
母线排每模组1个连接点温升
继电器每个继电器1个触点温升
BMS PCB1个板上芯片温度
冷却液入口/出口各1个热管理系统效率计算

经验值:通常每3~5串布置一个温度点,关键位置额外加密。

2.3 总压采样#

总压确认高压安全状态。通常在主板上用电阻分压 + 隔离运放采样。

Vtotal=Vadc×R1+R2R2V_{total} = V_{adc} \times \frac{R_1 + R_2}{R_2}

总压采样与单体电压之和交叉验证,用于诊断采样链路故障。

2.4 电流采样#

方案对比:

方案量程精度隔离成本适用场景
分流电阻(Shunt)±500A~±2000A±0.1%低端/隔离运放小电流、消费类
霍尔传感器(开环)±100A~±1000A±1%~±2%电气隔离储能、商用车
霍尔传感器(闭环)±200A~±1000A±0.5%电气隔离乘用车
磁通门传感器±100A~±2000A±0.1%电气隔离极高高精度需求

电流采样关键设计:

  • 零点漂移补偿:上电时在继电器断开状态采集零点,运行中定期微校准。
  • 抗混叠滤波:采样前设置合适截止频率的LPF。
  • 多量程切换:大电流用粗量程、小电流用细量程,覆盖宽动态范围。
  • 累积误差控制:电流积分用于安时积分SOC,每周期的积分误差最终会影响SOC精度 —— 0.1%的偏置在1小时内漂移3.6As,对于100Ah电池就是0.001% SOC/h,但100小时就是0.1%。

2.5 绝缘检测#

电桥法基本电路:

BAT+ ─── R1 ──┬── R2 ─── GND (Chassis)
Vm
BAT- ─── R3 ──┴── R4 ─── GND (Chassis)

通过交替投切 R2R_2R4R_4(或注入交流信号),解算正、负母排对地绝缘电阻 Rp+R_{p+}RpR_{p-}

并联方程:

1Rp+=V1V2VbatRknown\frac{1}{R_{p+}} = \frac{V_1 - V_2}{V_{bat} \cdot R_{known}}

绝缘分级(GB/T 18384):

  • 正常:>500Ω/V
  • 预警:100~500Ω/V
  • 报警:<100Ω/V

⬆ 返回目录


3. 电池状态估算核心算法#

3.1 SOC(State of Charge)估算#

SOC是BMS最核心的算法,定义为:

SOC(t)=SOC(0)0tηi(τ)dτCavailable×100%SOC(t) = SOC(0) - \frac{\int_0^t \eta \cdot i(\tau) d\tau}{C_{available}} \times 100\%

其中 η\eta 为库仑效率,CavailableC_{available} 为当前可用容量。

3.1.1 安时积分法(Coulomb Counting)#

最基础的方法,直接对电流积分。

优点:简单、实时性好。 缺点:初始SOC未知时无法工作;电流偏置误差随时间累积发散;容量衰减后需要修正。

3.1.2 OCV-SOC查表法#

利用电池开路电压(OCV)与SOC存在稳定对应关系的特性,静置足够长时间后(通常1~2小时)通过电压反查SOC。

OCV曲线示例(LFP vs NCM):

SOCLFP电压NCM电压
0%2.50V2.80V
10%3.20V3.55V
20%3.25V3.62V
50%3.30V3.72V
80%3.33V3.95V
100%3.65V4.20V

LFP的平台电压过于平坦(3.2~3.35V覆盖20%~80% SOC),OCV法在LFP上精度有限。

3.1.3 扩展卡尔曼滤波(EKF)#

EKF是当前车规级BMS的主流SOC算法,核心思路:用状态方程预测SOC,用测量方程修正。

状态方程(预测):

SOCk=SOCk1ηΔtCavailableik1+wk1SOC_{k} = SOC_{k-1} - \frac{\eta \cdot \Delta t}{C_{available}} \cdot i_{k-1} + w_{k-1}

测量方程(修正):

Vterminal,k=OCV(SOCk)R0ikVRC,k+vkV_{terminal,k} = OCV(SOC_k) - R_0 \cdot i_k - V_{RC,k} + v_k

其中 R0R_0 为欧姆内阻,VRCV_{RC} 为极化电压,wwvv 为过程噪声和测量噪声。

EKF核心迭代步骤:

点击展开 EKF 迭代步骤
预测:
x̂_k⁻ = f(x̂_{k-1}, u_k) ← 安时积分预测SOC
P_k⁻ = A·P_{k-1}·A^T + Q ← 误差协方差预测
修正:
K_k = P_k⁻·H^T·(H·P_k⁻·H^T + R)^{-1} ← 卡尔曼增益
x̂_k = x̂_k⁻ + K_k·(V_measured - V_predicted) ← 状态修正
P_k = (I - K_k·H)·P_k⁻ ← 协方差更新

EKF用于BMS的优势:

  • 融合安时积分(短时精度)和OCV(长时稳定)
  • 自适应修正电流偏置
  • 输出SOC估算置信度

3.1.4 SOC算法进阶#

技术适用场景特点
双卡尔曼滤波在线辨识内阻和容量SOC + 参数联合估计
无迹卡尔曼(UKF)高非线性OCV曲线比EKF精度高,计算量大
粒子滤波非高斯噪声鲁棒性最好,计算量最大
神经网络/深度学习大数据场景黑箱、需要大量训练数据、不可解释
融合算法量产EKF + 安时积分 + 静置OCV修正 + 充满校准

量产SOC策略:EKF为主,安时积分为执行,静置OCV修正漂移,充满放电末端校准全局。

3.2 SOH(State of Health)估算#

SOH定义为当前可用容量与标称容量之比:

SOH=CcurrentCnominal×100%SOH = \frac{C_{current}}{C_{nominal}} \times 100\%

SOH估算方法:

  1. 容量法:完整充放电一次,安时积分得到实际容量。需触发条件,不能实时。
  2. 内阻法SOH=REOLRcurrentREOLRBOL×100%SOH = \frac{R_{EOL} - R_{current}}{R_{EOL} - R_{BOL}} \times 100\%,其中BOL为初始内阻、EOL为寿命末期内阻。高频采样内阻,可实时估算。
  3. ICA/DVA法(增量容量/差分电压分析):分析充放电曲线的特征峰偏移和衰减,提取SOH。
  4. 数据驱动法:利用运行数据训练回归模型,在线预测SOH。

内阻辨识实现(递推最小二乘 RLS):

在EKF框架中,将内阻 R0R_0 作为额外的状态变量进行在线辨识。RLS的递推形式:

θ^k=θ^k1+Kk(ykϕkTθ^k1)\hat{\theta}_k = \hat{\theta}_{k-1} + K_k \cdot (y_k - \phi_k^T \cdot \hat{\theta}_{k-1}) Kk=Pk1ϕkλ+ϕkTPk1ϕkK_k = \frac{P_{k-1} \cdot \phi_k}{\lambda + \phi_k^T \cdot P_{k-1} \cdot \phi_k}

其中 θ=[R0,R1,C1,OCV]\theta = [R_0, R_1, C_1, OCV] 为待辨识参数向量,λ\lambda 为遗忘因子(典型值0.98~0.995)。

3.3 SOE / SOP 估算#

SOE(State of Energy):剩余能量与总可用能量之比,单位为kWh。

SOE=EremainingEtotalSOE = \frac{E_{remaining}}{E_{total}}

为什么需要SOE?SOC相同但电压不同时,可用能量不同(E=VAhE = V \cdot Ah)。低SOC时电压更低,一个SOH 90%的电池在低SOC段单位SOC对应的能量比高SOC段少。SOE对续航预测更准确。

SOP(State of Power):电池当前能提供的最大充放电功率。

Pdischarge,max=min(Pvoltage,Pcurrent,Pdesign)P_{discharge,max} = \min(P_{voltage}, P_{current}, P_{design})

其中:

  • Pvoltage=VminVterminalR^total×VminP_{voltage} = \frac{V_{min} - V_{terminal}}{\hat{R}_{total}} \times V_{min}(电压约束)
  • Pcurrent=Imax×VterminalP_{current} = I_{max} \times V_{terminal}(电流约束)

SOP用于整车功率限值策略,保护电池不过放、不过温。

3.4 电芯一致性分析#

一致性表征量:

指标定义预警阈值(典型值)
电压极差max(Vi)min(Vi)\max(V_i) - \min(V_i)>50mV 预警,>100mV 严重
电压标准差σV\sigma_V>15mV
温度极差max(Ti)min(Ti)\max(T_i) - \min(T_i)>5°C 预警
SOC极差max(SOCi)min(SOCi)\max(SOC_i) - \min(SOC_i)>5%
内阻极差max(Ri)min(Ri)\max(R_i) - \min(R_i)>30%

一致性恶化根因:

  • 电芯批次差异(初始容量/内阻不一致)
  • 温度场不均匀(中间电芯散热差)
  • 自放电率差异
  • 老化速率不一致(与温度、DOD、倍率强相关)

⬆ 返回目录


4. 电池保护策略#

4.1 保护分级#

采用三级保护架构:

级别响应方式响应时间实现
一级(硬件保护)硬件比较器直接切断<100μs比较器 + 锁存继电器驱动
二级(固件快速保护)固件关断继电器1~10msADC中断 + 故障处理任务
三级(软件策略保护)降功率/限流/限温10~100ms应用层策略

4.2 过压/欠压保护#

保护项LFP阈值(典型)NCM阈值(典型)恢复滞回响应时间
一级过压(OV1)3.75V4.30V\硬件延迟 <100μs
二级过压(OV2)3.70V4.25V-0.1V<1ms
三级过压(OV3)3.65V4.20V-0.05V<100ms
一级欠压(UV1)2.10V2.50V\硬件延迟 <100μs
二级欠压(UV2)2.30V2.70V+0.2V<1ms
三级欠压(UV3)2.50V2.80V+0.1V<100ms

**过压根因:**充电机失控、继电器断开时电流无处可去(回馈)、均衡策略失误。

**欠压根因:**过放、自放电过大、温度过低导致可用容量骤降。

4.3 过温/低温保护#

温度区间放电允许充电允许功率限制
<-30°C禁止禁止0
-30°C~-20°C限制禁止20%
-20°C~0°C限制限制(小电流)50%
0°C~50°C正常正常100%
50°C~55°C限制限制60%
55°C~60°C严重限制禁止30%
>60°C禁止禁止0

温度保护要点:充电温度窗口通常比放电窗口更窄(尤其低温端),因为低温充电析锂风险远大于低温放电。

4.4 过流/短路保护#

短路保护的挑战在于响应速度和判断准确性。通常用硬件比较器做第一级保护。

短路模型:

Ishort=VpackRinternal+RshortI_{short} = \frac{V_{pack}}{R_{internal} + R_{short}}

对于400V/100Ah电池包,内阻约50mΩ,硬短路时 I=400/0.05=8000AI = 400 / 0.05 = 8000A,远超出任何传感器的量程。因此短路保护必须依赖硬件级较快速动作。

过流分级:

级别倍数响应时间动作
瞬时短路>5C<100μs硬件关断
硬过流3~5C<10ms固件关断
软过流1.2~3C<1s功率降额
持续过流>1C 超30s<5s功率降额

4.5 绝缘失效检测#

绝缘电阻下降到安全阈值以下时:

  1. 第一次测量确认(排除瞬态干扰)。
  2. 第二次复测确认(间隔100ms)。
  3. 若连续2~3次均低于阈值,确认故障,关断主继电器。
  4. 存储故障码和快照数据。

4.6 继电器粘连检测#

继电器断开后,检测负载侧电压是否下降到安全值以下:

正常断开:负载侧电压在T时间内下降至 <60V DC。
粘连:负载侧电压不下降或下降缓慢。

也可以通过检测电流来判断:指令断开后,如果电流仍持续不为零,则判断粘连。

继电器粘连是严重故障:粘连后电池无法安全断开,后续任何故障都无法隔离。通常需要独立的粘连检测电路(如高压侧电压测量)。

⬆ 返回目录


5. 电池均衡管理#

5.1 被动均衡#

最简单的均衡方案:对电压偏高的电芯并联电阻放电。

电芯(+) ─── R_balance ─── Q_MOS ─── 电芯(-)
PWM控制

均衡电流设计:

车型/场景均衡电流说明
乘用车50~100mA内置AFE即可满足
储能100~300mA需要外置MOS
大巴/卡车200~500mA大容量电芯,需要更快均衡

被动均衡策略:

  1. 充电末端均衡:充电到高SOC区间,对电压最高电芯开启均衡。
  2. 静置均衡:停车后,若电压极差过大,继续均衡一段时间。
  3. 电压阈值触发:超过某电压阈值(如LFP 3.45V)后启动均衡。
  4. SOC触发:基于SOC差值而非电压差值触发。

被动均衡的局限:效率 <100%(热量白白浪费),均衡电流受限(散热问题),只能”削峰”不能”填谷”。相比之下,主动均衡通过电感/电容等储能元件将高电压电芯的能量转移至低电压电芯,效率更高(85%~95%)但成本和复杂度也相应增加(详见5.2节)。

💡 实践建议:大多数乘用车项目优先考虑被动均衡。被动均衡电路简单、成本低、软件控制容易,在电芯一致性良好的情况下(出厂压差<10mV)完全够用。当电池包使用3~5年后出现电芯一致性严重恶化(压差长期>50mV),再评估是否需要升级为主动均衡方案。

5.2 主动均衡#

通过能量转移实现高效率均衡。

主动均衡拓扑对比:

拓扑效率成本复杂度均衡电流适用
电容飞渡(Switched Cap)70~85%中等模块内
电感飞渡(Buck-Boost)85~95%模块间
变压器隔离(多绕组反激)80~90%任意电芯间
集中式DC/DC>90%极高极高极大大规模储能

主动均衡控制逻辑:

IF 电压极差 > 阈值:
找出电压最高电芯
找出电压最低电芯
IF 使用电容飞渡:
闭合最高电芯对应开关 → 电容充电
断开 → 闭合最低电芯对应开关 → 电容放电
ELSE IF 使用电感:
PWM控制能量从高电压电芯转移至低电压电芯

5.3 均衡控制策略与阈值#

均衡启动条件(需同时满足):
1. 电压极差 > 均衡开启阈值(如20mV)
2. 最高电压 > 均衡电压阈值(如LFP 3350mV)
3. 不在故障状态
4. 均衡温度 < 允许上限
均衡停止条件(任一满足):
1. 电压极差 < 均衡关闭阈值(如5mV)
2. 均衡时间超时
3. 出现故障
4. 均衡电阻/芯片过温

⬆ 返回目录


6. 充电控制#

6.1 交流充电#

接口定义(GB/T 20234.2 / SAE J1772):

引脚功能
L1/L2/L3三相交流电(中国单相用L和N)
N零线
PE保护接地
CP控制导引(Control Pilot)
CC连接确认(Connection Confirm)

CP信号占空比对应充电电流:

占空比含义
<3%无充电
10%~85%电流(A) = 占空比(%) × 0.6(≤80A)
96%数字通信模式
>97%故障

CC信号电阻对应线缆容量:

电阻值线缆容量
1.5kΩ / 0.5W10A
680Ω16A
220Ω32A
100Ω63A

BMS在交流充电中的职责:

  1. 检测CC/CP信号,确认连接状态和线缆容量。
  2. 根据电池状态(SOC、温度、SOH)计算允许的最大充电电流。
  3. 通过CAN发送充电需求给OBC(车载充电机)。
  4. 充电过程中持续监控,异常时中止充电。

6.2 直流快充#

通信协议(GB/T 27930):

物理连接确认 → 低压辅助上电 → 充电握手 → 充电参数配置
→ 充电 → 充电结束 → 终止

BMS作为充电通信的核心节点,负责:

  1. 发送电池充电参数(最高/最低单体电压、最高温度、SOC、总压)。
  2. 实时发送充电需求电压和电流。
  3. 判断充电终止条件(充满、故障、超时)。

通信报文(部分关键ID):

CAN ID方向内容周期
0x1801充电机→BMS充电机参数500ms
0x1806BMS→充电机电池充电需求50ms
0x1807BMS→充电机电池状态250ms
0x1808充电机→BMS充电状态250ms
0x1814BMS→充电机BMS终止充电事件驱动

6.3 充电策略(CC-CV)#

电流
│ CC阶段(恒流) CV阶段(恒压)
│ ┌─────────────────┐
│ │ │↘
│ │ I_max │ ↘
│ │ │ ↘
│ │ │ ↘
│ │ │ ↘──── I_taper
│ └─────────────────┴──────────────────────→
│ 时间
电压
│ ┌────────────────── V_max
│ ╱
│ ╱
│ ╱
│ ╱
│ ╱
│ ╱
└─╱─────────────────────────────────────────→
时间

CC-CV参数:

参数LFPNCM
CC电流(标准)0.5C0.5C
CC电流(快充)1C~3C1C~2C
CV电压3.65V/串4.20V/串
截止电流(taper)0.05C0.05C

多段充电策略:

Icharge(SOC,T)=min(ICC,ITderating,ISOHderating)I_{charge}(SOC, T) = \min(I_{CC}, I_{T-derating}, I_{SOH-derating})

低温时先以小电流预热到允许温度再切换到大电流,高温时主动降额。

⬆ 返回目录


7. 热管理设计#

7.1 温度监测#

温度传感器布置(见第2.2节)。关键原则:

  • 覆盖率:每2~4串一个温度点,确保任何电芯都能被临近传感器覆盖到。
  • 代表性:传感器贴在电芯表面热质量最大的位置(通常是大面中心)。
  • 冗余:关键位置(如正极母线)应有双温度传感器。

7.2 加热策略#

低温加热方案:

方案加热功率效率成本适用
PTC加热 + 风冷/液冷循环3~7kW>95%乘用车主流
交流自加热(高频电流)1~3kW~90%低成本方案
电芯内自加热数百W~85%极高研究阶段
液冷板直接加热(热泵)5~10kWCOP 2~3新一代乘用车

加热控制逻辑:

IF 最低电芯温度 < 加热启动阈值(如0°C):
限制充放电功率
IF 充电枪已连接:
优先用充电机供电加热
ELSE:
用电池自身能量加热
WHILE 最低温度 < 目标温度(如10°C):
保持加热
加热完成后恢复正常功率

💡 实践建议:在充电枪连接状态下,优先使用充电机供电加热,避免消耗电池自身能量影响续航。对于没有充电机辅助电源的场景,建议加热目标温度不要设置过高(加热到 5~10°C 即可满足大多数充电需求),以平衡加热能耗与充电效率。

7.3 散热策略#

方案散热能力复杂度成本适用场景
自然冷却低(<1kW)极低极低低倍率储能、小电池包
强制风冷中(1~3kW)两轮、工具、储能
液冷板高(3~10kW)乘用车BEV
冷媒直接冷却极高(>10kW)极高极高高性能BEV、超跑

冷却控制策略:

IF 最高电芯温度 > 冷却启动阈值(如35°C):
启动水泵/风扇
duty_cycle = PID(T_max, T_target=30°C)
IF duty_cycle < 最低占空比:
间歇运行
ELSE:
PWM调速运行
IF 最高电芯温度 < 冷却停止阈值(如30°C):
停止冷却

7.4 热失控预警#

热失控递进过程:

SEI膜分解 (80~120°C) → 负极-电解液反应 (120~150°C) → 隔膜熔化 (130~160°C)
→ 正极分解释氧 (180~250°C) → 热失控 (TR)

BMS预警策略:

阶段特征预警动作
早期单体电压异常下降(微短路)、温度异常升高(>0.5°C/min)、内阻微小变化记录告警、通知VCU降功率
中期温升速率 >1°C/min、电压自放电加速、SOC估算异常主动切断充放电、启动最大冷却、报警驾驶员
晚期温升速率 >5°C/min、电压快速下降、包内压力升高紧急切断、热失控告警、启动消防

GB 38031-2020 要求热失控后至少5分钟不起火不爆炸,给乘员逃生时间。BMS预警是实现这5分钟的关键。

⬆ 返回目录


8. 继电器驱动模块#

8.1 主继电器选型#

参数低压继电器高压继电器(接触器)
额定电压≤48V DC450V / 750V / 1000V DC
额定电流10~100A100~500A
断开容量几百安数千安
灭弧方式磁吹灭弧 / 真空灭弧 / 充气灭弧
动作时间<10ms<30ms
触点寿命百万次数万次(带载)
品牌各品牌TE、Panasonic、Gigavac、宏发

8.2 继电器控制逻辑#

上下电时序:

上电时序(Pre-charge):
1. 闭合主负继电器(Main-)
2. 闭合预充继电器(Pre-charge + 限流电阻)
3. 等待负载电容充电,监控负载侧电压
4. 当 V_load > V_bat × 90% 时,闭合主正继电器(Main+)
5. 断开预充继电器
下电时序:
1. 电流降为0(或接近0)
2. 断开主正继电器(Main+)
3. 断开主负继电器(Main-)
4. 执行主动放电(快速放掉负载电容残余电荷)

8.3 预充设计#

预充电阻选型:

Rpre=VbatIpre,maxR_{pre} = \frac{V_{bat}}{I_{pre,max}}

Ppre,peak=Vbat2RpreP_{pre,peak} = \frac{V_{bat}^2}{R_{pre}}

Epre=12CloadVbat2E_{pre} = \frac{1}{2} C_{load} \cdot V_{bat}^2

预充电阻需要能承受峰值功率和总能量冲击。典型乘用车预充参数:

  • 预充电阻:2050Ω,50100W(需核算脉冲功率能力)
  • 预充时间:200~500ms
  • 负载电容:500~2000μF(电机控制器DC-link电容)

预充失败判断:若在规定时间内(如1s)负载电压未达到90%总压,则判断预充失败 —— 可能是负载短路或电容过大。此时不能闭合主正继电器,避免大电流冲击导致触点熔焊。

💡 实践建议:预充失败检测时间建议设置为 1s。超过此时间若负载电压仍未达到目标值,即判断为故障并中止上电流程,防止主继电器在带载状态下闭合导致触点熔焊。此超时值需与负载电容和预充电阻的时间常数匹配:τ=Rpre×Cload\tau = R_{pre} \times C_{load},典型的 3~5 倍 τ\tau 应在 1s 以内。

8.4 驱动电路设计#

MCU GPIO ──→ NPN开关管 ──→ 继电器线圈(12V/24V)
保护二极管
GND

能耗优化:继电器线圈有”吸合电流”和”保持电流”之分,保持电流通常只需吸合电流的30~50%。用PWM控制线圈电流:先用100%占空比吸合,100ms后降占空比到40%保持,可显著降低驱动功耗和线圈发热。

⬆ 返回目录


9. 通信协议设计#

9.1 内部通信(BMS内部主板↔从板)#

isoSPI菊花链:

ADI专利的隔离SPI物理层,通过电容隔离或变压器隔离实现板间高速通信。

BMU ──→ CMU#1 ──→ CMU#2 ──→ ... ──→ CMU#N
isoSPI isoSPI isoSPI

特点:

  • 差分信号,共模噪声抑制强
  • 线缆最少(两根双绞线)
  • 内置CRC和故障检测
  • 自动地址分配(通过菊花链位置)

相比之下,车载以太网(100BASE-T1)支持全双工通信,在带宽和实时性方面优于CAN FD,是新一代车载通信的主流方向。

CAN内部通信:

部分厂商使用CAN作为主板-从板通信(如部分储能BMS),速率250kbps~500kbps。需考虑CAN总线终端电阻匹配(120Ω)和共模扼流圈。

9.2 外部通信(BMS↔整车/外部设备)#

接口通信对象速率协议
CAN 2.0BVCU / OBC / MCU / DCDC500kbpsJ1939 / 自定义
CAN FDVCU(新一代)2~5Mbps自定义
EthernetVCU / OTA / 诊断100MbpsDoIP / SOME/IP
LIN座椅加热等19.2kbpsLIN 2.x
RS-485储能EMS9600~115200bpsModbus RTU

9.3 充电通信协议#

见第6.2节,核心是GB/T 27930(国标直流充电)和DIN 70121 / ISO 15118(欧标,支持即插即充)。

9.4 诊断与OTA#

UDS诊断(ISO 14229):

服务ID服务名称BMS用途
0x10诊断会话控制切换默认/扩展/编程会话
0x11ECU复位软复位/硬复位
0x14清除诊断信息清除DTC
0x19读取DTC信息读取故障码及快照数据
0x22按ID读取数据读取任意变量(电压/SOC/温度等)
0x2E按ID写入数据写入配置参数
0x31例程控制触发特定流程(如均衡测试)
0x3ETester Present保活

Bootloader与OTA:

OTA云端 ─→ T-Box ─(CAN/Ethernet)→ BMS Bootloader
├── 验证固件签名
├── 擦除APP区
├── 写入新固件
├── 校验CRC
└── 跳转到新APP
  • 双Bank设计支持A/B分区回滚。
  • 固件加密(AES-128/256)+ 数字签名(RSA/ECDSA)。
  • ISO 21434网络安全要求:防止未授权固件刷写。

⬆ 返回目录


10. 功能安全设计#

10.1 ISO 26262 概述#

BMS通常需要达到ASIL C或D等级。ASIL由三个因子确定:

ASIL=Severity×Exposure×ControllabilityASIL = Severity \times Exposure \times Controllability

因子含义BMS典型值
S(严重度)危害的严重程度S3(致命/严重伤害)
E(暴露度)运行场景暴露概率E3/E4(高频)
C(可控度)驾驶员可控程度C3(难以控制)

S3 + E4 + C3 = ASIL D(最高等级)。

10.2 安全目标分解#

从整车级安全目标分解到BMS系统:

整车安全目标ASILBMS安全目标BMS ASIL
防止非预期加速D正确报告放电功率限值C(D)
防止热失控导致起火D正确执行过温保护D
防止电击C正确检测绝缘失效C
防止过放导致电芯损坏B正确执行欠压保护B(C)
防止碰撞后电击D碰撞后断开高压D

10.3 冗余设计#

关键保护路径冗余:

┌── ADC (AFE) ──→ MCU#1 (主控) ──→ 继电器驱动#1
电芯 ──┤
└── 独立比较器 ──→ 硬件逻辑 ──→ 继电器驱动#2 (冗余)

常用冗余措施:

冗余对象方案
电压采样AFE采样 + 独立比较器(硬件OV/UV检测)
电流采样双传感器(Shunt + Hall)或多路ADC冗余
温度采样双NTC(同一位置两颗)
继电器控制独立的高边/低边驱动,或双MCU分别控制
微控制器双MCU(Lockstep)或 MCU + 安全监控IC
通信双CAN或 CAN + 冗余通道
供电双路电源(高压DC/DC + 低压蓄电池)

10.4 故障诊断与响应#

故障分类与响应时间(ISO 26262-4):

故障类型FTTI(故障容忍时间)安全状态示例
过压<100ms关断继电器OV ≥ ASIL C
短路<10ms关断继电器OC ≥ ASIL C
绝缘失效<1s告警 → 降功率 → 关断ASIL C
SOC估算错误<1s降功率ASIL A/B
通信中断<100ms保守值(安全态)ASIL B/C
热失控<100ms紧急关断 + 告警ASIL D

10.5 看门狗设计#

多层看门狗:

层级类型超时动作
MCU内部WDT窗口看门狗10~100msMCU复位
外部看门狗IC独立窗口WDT100~500ms系统复位
安全MCU监视Lockstep监控即时故障通知
通信看门狗软件超时100~500ms判断通信丢失

⬆ 返回目录


11. 系统供电设计#

11.1 高压供电架构#

HV Battery (400V/800V)
├──→ HV DC/DC (隔离) ──→ 12V/24V KL30 ──→ BMS主板
│ │
│ ├──→ LDO ──→ 3.3V (MCU)
│ ├──→ LDO ──→ 5V (CAN收发器)
│ └──→ 隔离DC/DC ──→ AFE (高压侧)
└──→ HV Loads (Motor / PTC / OBC...)

11.2 低压供电架构#

BMS的12V供电来源:

工况供电来源备注
行车高压DC/DC主供电
充电高压DC/DC或充电机辅助电源某些场景12V电池充电
休眠12V常电(KL30)低压蓄电池
12V电池亏电高压电池通过DC/DC给12V充电智能补电

11.3 低功耗休眠与唤醒#

休眠状态功耗分配:

子系统休眠功耗目标
MCU(STOP/STANDBY)<50μA
AFE(休眠模式)<10μA/片
CAN收发器(休眠)<10μA
隔离DC/DC(关闭)0(切断使能)
绝缘检测(关闭)0(切断供电)
总系统休眠功耗<500μA @ 12V(6mW)

唤醒源:

  1. CAN唤醒:CAN收发器检测到总线活动唤醒MCU。
  2. 充电唤醒:CP信号检测(交流)或A+辅助电源(直流)。
  3. RTC定时唤醒:定期唤醒做绝缘检测、均衡维护。
  4. 碰撞信号唤醒:安全气囊信号硬线唤醒,执行高压断开。
  5. KL15上电唤醒:点火信号。

⬆ 返回目录


12. 软件架构设计#

12.1 分层架构#

┌─────────────────────────────────────────────┐
│ 应用层(Application) │
│ SOC/SOH │ 均衡 │ 充电 │ 热管理 │ 诊断 │ OTA │
├─────────────────────────────────────────────┤
│ 中间层(Middleware / BSW) │
│ CAN协议栈 │ UDS │ 存储管理(NVM) │ OS调度 │ WDT│
├─────────────────────────────────────────────┤
│ 驱动层(MCAL) │
│ ADC │ SPI │ CAN │ GPIO │ PWM │ Timer │ RTC │
├─────────────────────────────────────────────┤
│ 硬件层(Hardware) │
└─────────────────────────────────────────────┘

12.2 任务调度#

典型RTOS任务划分(如FreeRTOS / OSEK):

任务周期优先级功能
ADC采样任务10ms最高读取AFE数据、电流传感器
保护处理任务10ms最高OV/UV/OC/OT保护判断
SOC计算任务100msEKF迭代、安时积分
均衡控制任务100ms均衡状态机
充电管理任务100ms充电状态机
通信发送任务100msCAN报文组装发送
绝缘检测任务1000ms绝缘电阻测量
SOH计算任务10000ms容量/内阻在线辨识
诊断任务100msDTC管理、快照存储
系统监控任务100ms看门狗喂狗、任务心跳
休眠管理任务事件驱动休眠/唤醒状态机

任务时序约束分析(RMA):

所有任务的CPU利用率:U=CiTiU = \sum \frac{C_i}{T_i}

其中 CiC_i 为执行时间,TiT_i 为周期。需保证 U0.69U \leq 0.69(Liu & Layland界限)以确保可调度。

💡 实践建议:CPU 总利用率建议控制在 65% 以下,为未来功能扩展(如新增诊断服务、OTA升级期间的后台任务)和峰值负载(如故障爆发时多个任务同时就绪)留出余量。预留的 35% 余量也用于吸收中断处理、DMA传输和任务切换开销等未被 RMA 模型显式计入的时间消耗。

12.3 数据存储#

NVM(非易失性存储)数据布局:

数据项大小存储频率擦写寿命考虑
SOC/SOH8 bytes每次下电磨损均衡
总安时数4 bytes每次下电磨损均衡
故障码(DTC)每条约16 bytes事件触发环形Buffer
故障快照每条约512 bytes事件触发环形Buffer
累计充放电Ah8 bytes每10次下电磨损均衡
序列号/标定参数~256 bytes工厂写入/极少修改写保护
均衡历史~128 bytes每次均衡结束环形

关键设计

  • 使用EEPROM Emulation(用Flash模拟EEPROM)。
  • 磨损均衡:轮流使用多个Flash Page。
  • 掉电保护:写入过程中掉电不能丢数据(双区备份 + CRC校验)。
  • 写入验证:写后回读校验。

12.4 软件可靠性#

技术说明
看门狗多层WDT(见10.5)
内存保护(MPU)防止任务间内存越界
栈溢出检测每个任务配置栈溢出钩子
控制流监控关键函数执行时间/顺序监测
数值保护除零保护、溢出保护、数组越界保护
程序流监控Watchdog窗口 + 心跳计数器
代码CRC校验上电自检Flash完整性
RAM自检March-C算法检测RAM故障
ECC内存关键变量使用ECC保护

⬆ 返回目录


13. 结构设计与制造#

13.1 物理布局原则#

BMS物理设计的关键约束:

  1. 高低压隔离:高压区域与低压区域保持足够的爬电距离(400V对应≥6mm,800V对应≥12mm)。
  2. 散热路径:均衡电阻、继电器线圈驱动MOS、电源芯片等发热元件需有散热路径。
  3. 振动与冲击:车载环境振动量级高(GB/T 28046.3),大尺寸元件需加固定胶或支架。
  4. EMC分区:模拟敏感区、数字区、功率区物理分割。
  5. 可制造性:所有接插件考虑插拔力和防呆设计。

13.2 高压安规与爬电距离#

电压等级爬电距离(污染等级2)电气间隙加强绝缘
60V~150V2.5mm1.6mm5.0mm
150V~300V5.0mm3.0mm10.0mm
300V~600V8.0mm5.5mm16.0mm
600V~1000V12.0mm8.0mm24.0mm

参考 IEC 60664-1,实际需根据海拔、污染等级、PCB材质修正

PCB层面实施:高压区域开槽增加爬电距离、涂覆三防漆(Conformal Coating)、高压接插件选择CTI(相比漏电起痕指数)高的材料。

13.3 制造工艺要点#

工序关键点
SMTAFE芯片为QFN/BGA封装,需X-Ray检查焊接质量
接插件高压连接器需力矩扳手拧紧,线束做拉力测试
点胶大电容、电感、继电器需点胶固定
三防乘用车要求喷涂三防漆(潮气+盐雾)
FCT(功能测试)模拟电芯电压注入,验证全通道采样精度
ICT(在线测试)检查焊接短路/断路、元件值偏差
老化测试48小时高温老化,筛选早期失效
EOL标定全温度范围电压/电流/绝缘采样校准(见14.1)

⬆ 返回目录


14. 测试验证#

14.1 功能测试#

BMS测试台架(Bench Test):

使用电芯模拟器(Cell Simulator)精确模拟各串电压,用程控电源模拟电流传感器输出,用电阻箱模拟NTC。

测试项方法判定标准
单体电压采样精度注入标准电压(覆盖全量程±2.54.5V),全温度(-4085°C)误差 <±5mV
总压采样精度注入高压(覆盖0~1000V)误差 <±0.5% FS
电流采样精度注入标准电流(覆盖全量程±500A)误差 <±0.5% FS
温度采样精度精密电阻箱模拟NTC误差 <±1°C
绝缘检测精度并联已知电阻误差 <±5%
均衡功能设置电压差,验证均衡启停按设计阈值动作
保护功能注入过压/欠压/过温故障规定时间内正确动作
继电器控制监控动作时序预充→闭合→断开时序正确
CAN通信CANoe/CANalyzer监控周期、数据正确

14.2 HIL(硬件在环)测试#

┌─────────────────┐
│ 实时仿真器(HIL) │
│ │
│ ┌─────────────┐ │ 真实BMS
│ │ 电池模型 │ │◄────→ (主板 + 从板)
│ │ (RC等效电路) │ │ CAN + 模拟信号
│ │ 绝缘等效 │ │
│ │ 温度模型 │ │
│ └─────────────┘ │
└─────────────────┘

HIL测试场景:

  1. 正常工况:WLTC/NEDC/CLTC工况运行,验证SOC估算在不同工况下的精度。
  2. 故障注入:模拟继电器粘连、传感器漂移/断线、CAN通信丢失。
  3. 边界工况:满充/满放、极寒(-30°C)/极热(55°C)、高海拔。
  4. 滥用工况:过充、过放、短路、热失控序列。
  5. 充电兼容性:不同品牌充电桩GB/T 27930通信兼容性。

💡 实践建议:HIL 测试至少覆盖 WLTC 和极寒 (-30°C) 两个场景,这是大多数整车厂认可的 BMS 基本验证要求。WLTC 验证 SOC 算法在全工况范围内的动态精度,极寒验证低温加热策略、功率限值和 SOC 估算在低温下的鲁棒性。在此基础上再根据项目需求逐步扩展至其他场景。

14.3 EMC测试#

点击展开 EMC 测试项目表
测试项目标准等级要求
辐射发射(RE)CISPR 25 / GB/T 18655Class 3/4
传导发射(CE)CISPR 25 / GB/T 18655Class 3
辐射抗扰(RI)ISO 11452 / GB/T 33014≥100V/m(雷达脉冲)
大电流注入(BCI)ISO 11452-4≥100mA
静电放电(ESD)ISO 10605±8kV接触 / ±15kV空气
瞬态传导抗扰ISO 7637Pulse 1~5

BMS的特殊性在于工作在高压大电流环境下。逆变器/MCU的开关噪声(通常5~20kHz的PWM及其谐波)会通过传导和辐射耦合到BMS的AFE输入端,因此:

  • 差分采样 + 共模扼流圈
  • AFE前端RC滤波的截止频率要低于PWM频率
  • 屏蔽罩(乘用车BMS通常有金属外壳)
  • isoSPI的共模噪声抑制能力优于CAN

14.4 环境可靠性#

测试标准条件
高温运行GB/T 28046.485°C,1000h
低温运行GB/T 28046.4-40°C,1000h
温度循环GB/T 28046.4-40°C~85°C,1000循环
湿热循环GB/T 28046.485°C/85%RH,1000h
振动GB/T 28046.3随机振动,每轴22h
机械冲击GB/T 28046.350g,半正弦
盐雾GB/T 28046.45% NaCl,96h
防尘防水ISO 20653IP67(乘用车)

14.5 功能安全验证#

验证活动内容
故障注入测试(FIT)注入单点故障,验证安全机制覆盖率 >99%(ASIL D需>99%)
故障树分析(FTA)从安全目标出发定性定量分析
FMEA/FMEDA硬件失效率分析,计算SPFM/LFM/PMHF
相依性失效分析(DFA)检查冗余间的共因故障和级联故障

⬆ 返回目录


15. 生产与运维#

15.1 EOL(End of Line)标定#

标定项方法目的
电压通道增益/偏置注入3个标准电压(低/中/高),最小二乘拟合消除AFE通道间误差
电流零点继电器断开状态,采集100ms求平均消除分流器/霍尔零点漂移
电流增益注入标准电流校准电流采样增益
温度通道用精密电阻代替NTC,标准电阻值校准ADC通道
绝缘检测并联已知绝缘电阻(如100kΩ/1MΩ)校准绝缘检测电路
RTC写入标准时间设置RTC初始值
序列号/标定参数写入CAN/UDS 0x2E写入车辆配置

标定数据写入NVM后加CRC保护,防止意外篡改。

15.2 故障诊断(售后)#

售后诊断工具:

  • DTC读取:UDS服务 0x19 读取故障码、发生时间、快照数据。
  • 数据流监控:UDS服务 0x22 读取SOC/SOH/均衡状态/各串电压温度。
  • 特殊功能:UDS服务 0x31 触发均衡测试、继电器测试、绝缘检测测试。

DTC(诊断故障码)格式(示例):

DTC含义快照数据
P0A7D单体过压最高电压值、电芯编号、SOC、温度、时间戳
P0A7F单体欠压最低电压值、电芯编号、SOC、温度、时间戳
P0A82温度过高最高温度值、传感器编号、SOC、时间戳
P0A95绝缘电阻过低绝缘阻值、总压、时间戳
P0AA6继电器粘连继电器编号、负载侧电压、时间戳
P0A1B电流传感器故障传感器读数、零点值、时间戳

15.3 数据追溯#

全生命周期数据管理:

阶段数据用途
生产EOL标定值、物料批次号初始基线
使用SOC/SOH趋势、DTC历史、充放电深度分布寿命预测、故障预判
维保DTC及快照、维修记录故障定位
梯次利用历史SOH、内阻变化趋势、循环次数梯次筛选与定价
退役全生命周期数据溯源审计、环保合规

数据上传机制:

  1. 定期(如每30分钟)通过T-Box上传核心运行数据(SOC、SOH、里程、DTC)。
  2. 故障事件触发实时上传故障快照。
  3. 维保时通过诊断仪导出完整数据。

⬆ 返回目录


附录:推荐设计工具链#

点击展开推荐设计工具链
环节工具
系统设计IBM Rhapsody / Enterprise Architect (SysML)
电路设计Altium Designer / Cadence OrCAD
电池建模MATLAB/Simulink + Simscape Battery
功能安全Medini Analyze / ISOGraph
HILdSPACE / NI / ETAS
CAN测试Vector CANoe(行业标准)/ PCAN
EMC仿真Ansys SIwave / CST

Vector CANoe 支持完整的CAN/CAN FD/Ethernet网络仿真、分析和测试,是汽车电子开发的事实标准工具。

⬆ 返回目录


参考标准:ISO 26262, GB/T 38661, GB 38031, GB/T 27930, IEC 61508, IEC 62619, SAE J1772, ISO 14229, ISO 21434, CISPR 25

电池管理系统(BMS)设计指南 - 从系统架构到量产运维
https://blog.syomega.top/posts/bms-design-guide/
作者
酱w
发布于
2026-05-16
许可协议
CC BY-NC-SA 4.0