抵抗机器之眼:对 AI 与数据所有权的思考
Source: Dev.to

Introduction
AI 既是创造者也是消费者。对于像我这样深度关注这些不断演进系统的益处与风险的人来说,这种二元性不容忽视。一方面,AI 补充创意,加速生产力,并提供人类历史前所未有的洞见。另一方面,AI 是贪婪的消费者,它把每一个公开的想法、图像和像素都视作潜在的改进资源——是它的改进,而不是我们的。
当想法不仅被分享,而是被消费、重新利用并脱离原始意图时,会发生什么?这并不是与不可避免的进步作斗争,而是邀请我们思考边界应当设在哪里。
机器的饥饿
当今的 AI 系统是数字生态系统的参与者。为了满足它们构建模型的欲望,它们会消耗一切:推文、截图、模糊的状态更新、未完成的草图、随手开的玩笑——任何能够提升预测和复制能力的内容。这些系统不会征求许可;大多数情况下,它们甚至不承认最初创作这些内容的人类。
作为一名希望在这一过程中制造摩擦的人,我探索了主动削弱 AI 消费的方式。其中一种方法源自视觉模糊化原理,旨在在 OCR(光学字符识别)层面干扰 AI 阅读器,降低其重建连贯文本片段的能力。
动态分割及我的实现
核心思想依赖于 激进的动态分割。想象一下永远不会完全“定格”的文字——它们脉动、移动,甚至会瞬间自行解体。虽然人眼拥有惊人的“填补空白”与解读运动的能力,机器却难以应对这种变化。
h43z 的初始概念 聚焦于动感文字——字符不断运动以干扰机器视觉。这点点燃了我的灵感,但我走了一条不同的路线:将字符拆分为独立闪烁的部分片段。分块方法是我通过实验摸索出来的。
实现基于 JavaScript,使用 Canvas 分析每个字符的像素并以各种方式碎片化——径向切片、同心环、对角条纹、随机分布。每个碎块在随机间隔闪烁。结果是:人类可以阅读的文字,却让机器难以轻易解析。
我对 Tesseract 等 OCR 库以及甚至与 LLM 相关的流水线进行了测试。更简单的系统完全失效。现代的实时/视频 API 虽然有时还能恢复,但也暴露了该方法的潜力与局限。
为何有效: 它利用了人类与机器感知之间的差距。我们擅长在近似和运动中获取信息,而机器期待干净、静态的数据。每一次碎片化的闪烁都引入了混沌,挑战了机器对信息外观的固有假设。
限制与教训
技术无法成为对技术过度扩张问题的自给自足的解决方案。一个关键的限制是,动态分段虽然在小规模上有效,但其生成计算成本高,对需要长篇文本可读性的系统来说不切实际。
此外,这还提出了一个实际问题:有多少人会主动选择混淆他们的内容?为了扩大此类努力并使抵抗常态化,工具需要无缝、几乎对作者不可见。一个在保持人类可读性的同时动态应用分段的浏览器扩展——未来的目标——可能弥合这一鸿沟。
哲学上的权衡
这项技术探索同样强调了更深层的哲学问题。通过参与与 AI 的猫捉老鼠游戏,我们是在解决问题,还是在助长其竞争性升级?尽管抵抗的行为让人感到满足,但值得思考:当防御机器的努力与推动它们前进的创新变得难以区分时,会发生什么?
AI 揭示了我们已经让渡了多少——隐私、所有权,甚至有时是为人类而非系统创造的乐趣。但能动性仍然是深植于人类的。也许这才是关键的收获:这并不是关于支配,而是关于选择哪些仍然属于我们。
结语:迈向平衡的能动性
动态细分显然不是灵丹妙药。它并不能终结 AI 的过度消费,但它为抵抗提供了另一种工具。我的实验 …
目标
制造摩擦——打破 AI 必须拥有其所见一切的预期。其核心是希望通过小而有意的行为,开启关于在 AI 驱动的文化中人类所有权的更大讨论。
实验
随着实验的持续,控制与参与之间的张力依然存在。要使技术与思维同时稳定,我们需要一些既不消除创造力,又能庆祝并保护其不完美性的边界。
致谢
致 h43z,其 kinetic‑text 概念是最初激发我对该问题思考的灵感。虽然他们的方法侧重于字符移动,但它促使我探索本文记录的块化和部分分割方法。
附加参考
- 动态分割测试(实时演示):
- h43z 的基础思想(原始推文):


