抵抗机器之眼：对 AI 与数据所有权的思考

发布: 3天前 (2026年2月25日 GMT+8 05:08)

8 分钟阅读

Source: Dev.to

《抵抗机器之眼：关于 AI 与数据所有权的思考》封面图

Introduction

AI 既是创造者也是消费者。对于像我这样深度关注这些不断演进系统的益处与风险的人来说，这种二元性不容忽视。一方面，AI 补充创意，加速生产力，并提供人类历史前所未有的洞见。另一方面，AI 是贪婪的消费者，它把每一个公开的想法、图像和像素都视作潜在的改进资源——是它的改进，而不是我们的。

当想法不仅被分享，而是被消费、重新利用并脱离原始意图时，会发生什么？这并不是与不可避免的进步作斗争，而是邀请我们思考边界应当设在哪里。

当今的 AI 系统是数字生态系统的参与者。为了满足它们构建模型的欲望，它们会消耗一切：推文、截图、模糊的状态更新、未完成的草图、随手开的玩笑——任何能够提升预测和复制能力的内容。这些系统不会征求许可；大多数情况下，它们甚至不承认最初创作这些内容的人类。

作为一名希望在这一过程中制造摩擦的人，我探索了主动削弱 AI 消费的方式。其中一种方法源自视觉模糊化原理，旨在在 OCR（光学字符识别）层面干扰 AI 阅读器，降低其重建连贯文本片段的能力。

核心思想依赖于 激进的动态分割。想象一下永远不会完全“定格”的文字——它们脉动、移动，甚至会瞬间自行解体。虽然人眼拥有惊人的“填补空白”与解读运动的能力，机器却难以应对这种变化。

h43z 的初始概念聚焦于动感文字——字符不断运动以干扰机器视觉。这点点燃了我的灵感，但我走了一条不同的路线：将字符拆分为独立闪烁的部分片段。分块方法是我通过实验摸索出来的。

实现基于 JavaScript，使用 Canvas 分析每个字符的像素并以各种方式碎片化——径向切片、同心环、对角条纹、随机分布。每个碎块在随机间隔闪烁。结果是：人类可以阅读的文字，却让机器难以轻易解析。

我对 Tesseract 等 OCR 库以及甚至与 LLM 相关的流水线进行了测试。更简单的系统完全失效。现代的实时/视频 API 虽然有时还能恢复，但也暴露了该方法的潜力与局限。

为何有效： 它利用了人类与机器感知之间的差距。我们擅长在近似和运动中获取信息，而机器期待干净、静态的数据。每一次碎片化的闪烁都引入了混沌，挑战了机器对信息外观的固有假设。

技术无法成为对技术过度扩张问题的自给自足的解决方案。一个关键的限制是，动态分段虽然在小规模上有效，但其生成计算成本高，对需要长篇文本可读性的系统来说不切实际。

此外，这还提出了一个实际问题：有多少人会主动选择混淆他们的内容？为了扩大此类努力并使抵抗常态化，工具需要无缝、几乎对作者不可见。一个在保持人类可读性的同时动态应用分段的浏览器扩展——未来的目标——可能弥合这一鸿沟。

这项技术探索同样强调了更深层的哲学问题。通过参与与 AI 的猫捉老鼠游戏，我们是在解决问题，还是在助长其竞争性升级？尽管抵抗的行为让人感到满足，但值得思考：当防御机器的努力与推动它们前进的创新变得难以区分时，会发生什么？

AI 揭示了我们已经让渡了多少——隐私、所有权，甚至有时是为人类而非系统创造的乐趣。但能动性仍然是深植于人类的。也许这才是关键的收获：这并不是关于支配，而是关于选择哪些仍然属于我们。

动态细分显然不是灵丹妙药。它并不能终结 AI 的过度消费，但它为抵抗提供了另一种工具。我的实验 …

制造摩擦——打破 AI 必须拥有其所见一切的预期。其核心是希望通过小而有意的行为，开启关于在 AI 驱动的文化中人类所有权的更大讨论。

随着实验的持续，控制与参与之间的张力依然存在。要使技术与思维同时稳定，我们需要一些既不消除创造力，又能庆祝并保护其不完美性的边界。

致 h43z，其 kinetic‑text 概念是最初激发我对该问题思考的灵感。虽然他们的方法侧重于字符移动，但它促使我探索本文记录的块化和部分分割方法。