SEMNR：为什么我不再相信“Clean”图像（并把Metrics当作护栏）

发布: 1周前 (2025年12月17日 GMT+8 14:49)

9 min read

Source: Dev.to

这项工作是在一次密集的 Applied Materials 与 Extra‑Tech 训练营中完成的，挑战远远超出了选择“正确”去噪模型的范围。

我要感谢来自 Applied Materials 的我的导师 Roman Kris 和 Mor Baram，感谢他们的技术指导、关键问题以及对实用、生产级思维的持续推动；同时也感谢来自 Extra‑Tech 的 Shmuel Fine 和 Sara Shimon 在整个过程中的支持和教学。

为什么在 SEM 去噪中“干净”不够

在传统图像处理领域，clean（干净）是一种赞美。
在半导体 SEM 去噪中，clean 往往是一个谎言。

去噪器的显而易见的目标是去除噪声，但在科学和工业成像中，真正的目标是 保留证据。导体的微观边缘、硅表面的细微纹理，或是微小缺陷——这些信号承载着关键意义。

去噪器可以轻易让图像在肉眼看来更悦目，却在不知不觉中抹去改变整个分析结果的细节。

构建 SEMNR 让我得到一次深刻的教训：标准的评估方法是一种陷阱。我不需要一个可以炫耀的排行榜；我需要的是工程层面的安全护栏。下面是我如何从追求高分转向为我的数据构建 信任画像 的过程。

高分 vs. 高信任

中间的图像 PSNR 分数更高，却模糊了晶圆线的关键边缘。右侧的图像（SEMNR）保留了锐利的结构和原始纹理，即使看起来不那么“干净”。

定义我绝不放弃的东西

在训练任何模型之前，我明确界定了自己绝不放弃的目标。指标的选择不再是被动接受默认工具，而是一次主动的工程决策。

我发现，激进的降噪往往直接与结构保留相冲突：

奖励平滑度的指标（例如标准 PSNR）会主动鼓励 过度平滑。模型会为了降低像素误差而学习模糊纹理，以获得更高分数。
忽视纹理的指标 本质上允许模型幻觉出不存在的细节——更糟的是，抹去对质量控制至关重要的真实缺陷。

为验证这一点，我对 SEM 样本进行了“压力测试”（人工模糊、过度锐化以及添加伪影），并观察哪些指标能标记出问题。结果极度不一致：PSNR 常常提升，却使图像在分析上变得更无用。这立刻让我否定了“单一英雄数字”的想法。

堆栈：侧重配置文件而非单一分数

相较于追求唯一的完美数值，我构建了一个 度量配置文件——一个 QA 工具箱，其中每个度量都有其特定的工作描述。

度量配置文件概览

目标是最大化图表的整体面积，而非单个峰值。请注意，提高 PSNR（保真度）往往会直接牺牲纹理真实感（DISTS）。

度量	角色	捕获内容
PSNR	锚点	像素级保真度（原始像素值与参考图像的接近程度）。作为基线，但绝不能单独依赖。
SSIM	结构工程师	保持宏观结构（例如接触孔、通孔）的完整性。
FSIM	边缘守护者	材料之间的锐利过渡；标记模糊边缘——对 SEM 至关重要。
DISTS	纹理专家	基于深度学习的纹理真实感；防止出现“塑料”感并保留自然颗粒。
CNR	务实派	实际的对比噪声可检测性；判断计算机视觉算法是否仍能识别缺陷。

当指标不一致时 – 寻找调试信号

最有价值的工程洞察出现在 指标不一致 时。我学会将这些冲突解读为模型行为的不同调试信号：

PSNR ⬆️ / FSIM ⬇️ – 过度平滑：模型在积极去噪的同时抹掉了高频边缘信息。
SSIM 稳定 / DISTS ⬇️ – 纹理漂移：整体结构尚可，但表面失去了真实的材质特征。
PSNR ⬆️ / CNR ⬇️ – 对比度丢失：像素值更接近真实值，但局部对比度下降，使特征更难辨认。

冲突解决流程图

我用来标记失败并指导调试决策的流程图。

要点

单一指标 ≠ 真相 – 依赖单个数值（例如 PSNR）可能掩盖关键的退化。
构建评估画像 – 结合互补的指标，以捕捉保真度、结构、边缘保留、纹理以及实际可检测性。
倾听冲突 – 指标之间的不一致是最有信息量的信号；它们直接指示模型引入的伪影类型。
信任胜于分数 – 在科学成像中，目标是可信的现实再现，而不是高分却误导的图像。

如果你正在使用 SEM 或其他任何科学成像流程，考虑采用多指标信任画像。这将帮助你避免“干净”图像的虚假安慰，因为它们可能已经悄然失去了你所需的证据。

结语：从美观转向可信

在 SEMNR 中，这一过程把我的指导性问题从 “这张图像干净吗？” 改为 “这张图像可信吗？”

通过构建一个使用特定度量作为防护栏来防止特定失效（如边缘模糊）的评估堆栈，我把模型演进从一场美学竞赛转变为工程安全系统。

在科学和工业数据的世界里，我的工作不是美化现实，而是以最小的干预揭示它。有时，这意味着保留一点自然的 “噪声”——只为确保真相仍然保留在图像中。

差别体现在微观细节：对结构边缘缺陷的放大。
左图：标准模型在去除噪声的同时也抹掉了缺陷。
右图（SEMNR）：噪声被清除，但关键缺陷被清晰保留。

SEMNR：为什么我不再相信“Clean”图像（并把Metrics当作护栏）

为什么在 SEM 去噪中“干净”不够

高分 vs. 高信任

定义我绝不放弃的东西

堆栈：侧重配置文件而非单一分数

度量配置文件概览

当指标不一致时 – 寻找调试信号

冲突解决流程图

要点

结语：从美观转向可信

相关文章

用构建真实项目取代手机成瘾

仓库利用的权威指南

CinemaSins：18分钟内揭露《Red One》的一切错误

摄取1亿次心跳：在不破产的情况下扩展可穿戴技术