不确定性分析：为什么要做？SD 与 ER 是什么意思？

By - xu
Posted on 2026年2月1日
Posted in 未分类

不确定性分析：为什么要做？SD 与 ER 是什么意思？

面向小白的一篇科普，结合“隧道掌子面轮廓分割与超欠挖检测”这类深度学习应用场景，解释论文里常见的不确定性分析，以及为什么要研究 SD 与 ER 的关系。

Table of Contents

1. 先说结论：不确定性分析到底想解决什么问题？

深度学习模型往往会给你一个“看起来很确定”的输出（例如：分割轮廓、面积数值），但在真实工程现场，数据可能很复杂：

光照不均、粉尘/水雾、遮挡、爆破痕迹导致纹理混乱
相机角度变化、距离变化
现场数据分布与训练数据不一致（分布漂移）

这时会出现一个很关键的工程问题：

同样是模型输出的一个结果，这次结果到底靠不靠谱？

不确定性分析（Uncertainty Analysis）就是为了给“每一次预测”配一个“风险/可信度”指标，从而支持工程决策，例如：

不确定性低：自动通过，直接用于计算面积/超欠挖
不确定性高：触发人工复核、重拍、或重新测量

换句话说：
精度评估回答“模型平均表现如何”；
不确定性分析回答“模型这一次输出可不可信”。

2. 论文里用的 MC Dropout 是什么？（为什么能估计不确定性）

MC Dropout（Monte Carlo Dropout）是一种常用的“近似贝叶斯”思路：
在推理（预测）阶段也保留 Dropout 的随机性，让模型对同一张图像“算很多次”。

每一次前向传播（forward）都会因为 Dropout 的随机屏蔽而略有不同
于是你会得到一组预测结果，而不是单个结果
这组结果“波动有多大”，就可以用来衡量模型的“不确定程度”

直觉非常重要：

如果模型对同一张图算 10 次，结果几乎都一样 → 模型很“自信”
如果算 10 次，结果差异很大 → 模型在“犹豫”，风险更高

3. SD 是什么？（预测标准差：模型“犹豫程度”）

在 MC Dropout 下，对同一个样本做 (T) 次预测，会得到：

第 (t) 次预测值：(\hat{y}^{(t)})
(T) 次预测的平均值：(y)

SD（Standard Deviation，标准差）用来描述这 (T) 次预测的离散程度：

[ SD=\sqrt{\frac{1}{T-1}\sum_{t=1}^{T}\left(\hat{y}^{(t)}-y\right)^2} ]

你可以把 SD 理解成：

SD 小：模型每次算出来都差不多 → 更稳定、更自信
SD 大：模型每次算出来差异大 → 更不确定、更需要警惕

在工程部署中，SD 可以作为“是否需要人工复核”的触发指标。

4. ER 是什么？（平均预测误差：模型“真实错了多少”）

ER 用来衡量模型预测与人工标注真值之间的误差大小。论文里写法是相对误差：

人工标注真值：(y_{gt})
(T) 次预测平均值：(y)

[ ER=\frac{y-y{gt}}{y{gt}} ]

直觉理解：

ER 小：这次预测确实比较准
ER 大：这次预测偏差更大

一个很关键的现实点：

在真实部署（工地现场）时，你通常没有 (y_{gt})（没有人工真值），所以 ER 算不出来。

这就是下一节“为什么要研究 SD 与 ER 的关系”的核心原因。

5. 为什么要研究 SD 与 ER 的关系？

因为在实际使用时：

你想知道“这次预测错没错、错多少”（这对应 ER）
但你没有真值 (y_{gt})，所以 ER 无法实时计算
你能实时拿到的是 MC Dropout 产生的波动指标（也就是 SD）

因此必须回答一个验证问题：

SD 能不能代表真实误差 ER？
换句话说：模型“越犹豫”（SD 越大），是否真的“越容易错”（ER 越大）？

如果实验验证表明：

SD 越大，ER 越大（正相关）

那么就说明：SD 可以当作“风险指示器”。工程上就能做出可执行的策略：

设定阈值或分位数（例如 SD 位于最高 20%）
高 SD 的样本进入“人工复核/重采集”流程
低 SD 的样本自动进入面积换算与超欠挖判定

这就是论文里把样本按 SD 分组（如 Low/Mid/High 20%）并比较平均 ER 的意义：
不是为了“再算一次精度”，而是为了证明 SD 这把“尺子”量得准不准。

6. 给小白的“最短记忆版”

不确定性分析：回答“这次结果靠谱吗？”
MC Dropout：同一张图算很多次，用波动来量化不确定性
SD：预测波动大小（模型犹豫程度）
ER：相对误差大小（真实错了多少）
验证 SD 与 ER 的关系：因为现场没有真值，ER 算不出；想用 SD 来替代“风险判断”

7. 你可以直接在博客里用的示例表述

我们不仅关心模型平均分割精度有多高，也关心在现场每一张图像上，这次预测是否可靠。为此引入 MC Dropout，在推理阶段对同一图像进行多次随机前向传播，计算预测结果的标准差 SD 作为不确定性指标。进一步通过实验验证 SD 与真实误差 ER 呈正相关：SD 越大，误差越大。因此在工程部署中，可将高 SD 样本作为人工复核或重采集的触发条件，实现分级质量控制并降低误判风险。

xublog

近期文章

近期评论

不确定性分析：为什么要做？SD 与 ER 是什么意思？

1. 先说结论：不确定性分析到底想解决什么问题？

2. 论文里用的 MC Dropout 是什么？（为什么能估计不确定性）

3. SD 是什么？（预测标准差：模型“犹豫程度”）

4. ER 是什么？（平均预测误差：模型“真实错了多少”）

5. 为什么要研究 SD 与 ER 的关系？

6. 给小白的“最短记忆版”

7. 你可以直接在博客里用的示例表述

Previous Article

Next Article

发表回复取消回复

xublog

近期文章

近期评论

不确定性分析：为什么要做？SD 与 ER 是什么意思？

1. 先说结论：不确定性分析到底想解决什么问题？

2. 论文里用的 MC Dropout 是什么？（为什么能估计不确定性）

3. SD 是什么？（预测标准差：模型“犹豫程度”）

4. ER 是什么？（平均预测误差：模型“真实错了多少”）

5. 为什么要研究 SD 与 ER 的关系？

6. 给小白的“最短记忆版”

7. 你可以直接在博客里用的示例表述

Previous Article

Next Article

发表回复 取消回复

发表回复取消回复