SEMNR:为什么我不再相信“Clean”图像(并把Metrics当作护栏)

发布: (2025年12月17日 GMT+8 14:49)
9 min read
原文: Dev.to

Source: Dev.to

这项工作是在一次密集的 Applied Materials 与 Extra‑Tech 训练营中完成的,挑战远远超出了选择“正确”去噪模型的范围。

我要感谢来自 Applied Materials 的我的导师 Roman KrisMor Baram,感谢他们的技术指导、关键问题以及对实用、生产级思维的持续推动;同时也感谢来自 Extra‑Tech 的 Shmuel FineSara Shimon 在整个过程中的支持和教学。

为什么在 SEM 去噪中“干净”不够

在传统图像处理领域,clean(干净)是一种赞美。
在半导体 SEM 去噪中,clean 往往是一个谎言。

去噪器的显而易见的目标是去除噪声,但在科学和工业成像中,真正的目标是 保留证据。导体的微观边缘、硅表面的细微纹理,或是微小缺陷——这些信号承载着关键意义。

去噪器可以轻易让图像在肉眼看来更悦目,却在不知不觉中抹去改变整个分析结果的细节。

构建 SEMNR 让我得到一次深刻的教训:标准的评估方法是一种陷阱。我不需要一个可以炫耀的排行榜;我需要的是工程层面的安全护栏。下面是我如何从追求高分转向为我的数据构建 信任画像 的过程。

高分 vs. 高信任

高分 vs. 高信任:中间的图像 PSNR 分数更高,但模糊了晶圆线的关键边缘。

中间的图像 PSNR 分数更高,却模糊了晶圆线的关键边缘。右侧的图像(SEMNR)保留了锐利的结构和原始纹理,即使看起来不那么“干净”。

定义我绝不放弃的东西

在训练任何模型之前,我明确界定了自己绝不放弃的目标。指标的选择不再是被动接受默认工具,而是一次主动的工程决策。

我发现,激进的降噪往往直接与结构保留相冲突:

  • 奖励平滑度的指标(例如标准 PSNR)会主动鼓励 过度平滑。模型会为了降低像素误差而学习模糊纹理,以获得更高分数。
  • 忽视纹理的指标 本质上允许模型 幻觉 出不存在的细节——更糟的是,抹去对质量控制至关重要的真实缺陷。

为验证这一点,我对 SEM 样本进行了“压力测试”(人工模糊、过度锐化以及添加伪影),并观察哪些指标能标记出问题。结果极度不一致:PSNR 常常提升,却使图像在分析上变得更无用。这立刻让我否定了“单一英雄数字”的想法。

堆栈:侧重配置文件而非单一分数

相较于追求唯一的完美数值,我构建了一个 度量配置文件——一个 QA 工具箱,其中每个度量都有其特定的工作描述。

度量配置文件概览

微妙的平衡:目标是最大化图表的整体面积,而非单个峰值。

目标是最大化图表的整体面积,而非单个峰值。请注意,提高 PSNR(保真度)往往会直接牺牲纹理真实感(DISTS)。

度量角色捕获内容
PSNR锚点像素级保真度(原始像素值与参考图像的接近程度)。作为基线,但绝不能单独依赖。
SSIM结构工程师保持宏观结构(例如接触孔、通孔)的完整性。
FSIM边缘守护者材料之间的锐利过渡;标记模糊边缘——对 SEM 至关重要。
DISTS纹理专家基于深度学习的纹理真实感;防止出现“塑料”感并保留自然颗粒。
CNR务实派实际的对比噪声可检测性;判断计算机视觉算法是否仍能识别缺陷。

当指标不一致时 – 寻找调试信号

最有价值的工程洞察出现在 指标不一致 时。我学会将这些冲突解读为模型行为的不同调试信号:

  • PSNR ⬆️ / FSIM ⬇️过度平滑:模型在积极去噪的同时抹掉了高频边缘信息。
  • SSIM 稳定 / DISTS ⬇️纹理漂移:整体结构尚可,但表面失去了真实的材质特征。
  • PSNR ⬆️ / CNR ⬇️对比度丢失:像素值更接近真实值,但局部对比度下降,使特征更难辨认。

冲突解决流程图

The logic behind the scenes: The flowchart I used to flag failures.

我用来标记失败并指导调试决策的流程图。

要点

  1. 单一指标 ≠ 真相 – 依赖单个数值(例如 PSNR)可能掩盖关键的退化。
  2. 构建评估画像 – 结合互补的指标,以捕捉保真度、结构、边缘保留、纹理以及实际可检测性。
  3. 倾听冲突 – 指标之间的不一致是最有信息量的信号;它们直接指示模型引入的伪影类型。
  4. 信任胜于分数 – 在科学成像中,目标是可信的现实再现,而不是高分却误导的图像。

如果你正在使用 SEM 或其他任何科学成像流程,考虑采用多指标信任画像。这将帮助你避免“干净”图像的虚假安慰,因为它们可能已经悄然失去了你所需的证据。

结语:从美观转向可信

SEMNR 中,这一过程把我的指导性问题从 “这张图像干净吗?” 改为 “这张图像可信吗?”

通过构建一个使用特定度量作为防护栏来防止特定失效(如边缘模糊)的评估堆栈,我把模型演进从一场美学竞赛转变为工程安全系统。

在科学和工业数据的世界里,我的工作不是美化现实,而是以最小的干预揭示它。有时,这意味着保留一点自然的 “噪声”——只为确保真相仍然保留在图像中。

差别体现在微观细节:对缺陷的放大。

差别体现在微观细节:对结构边缘缺陷的放大。
左图:标准模型在去除噪声的同时也抹掉了缺陷。
右图(SEMNR):噪声被清除,但关键缺陷被清晰保留。

Back to Blog

相关文章

阅读更多 »

仓库利用的权威指南

引言 仓库本质上只是一个 3‑D 盒子。利用率只是衡量你实际使用了该盒子多少的指标。虽然物流 c...