防篡改 AI Agents:AI 输出的链上验证

发布: (2026年3月1日 GMT+8 02:48)
5 分钟阅读
原文: Dev.to

Source: Dev.to

问题:验证 AI 代理的陈述

在 AI 代理领域有一个没人讨论的问题:如何证明某个 AI 代理在特定时间点说过某句话?
想象一个分析市场状况的 AI 代理对你说 “BTC 将在 30 天内超过 10 万美元。” 三十天后它被证明是正确的。该代理真的在当时说过这句话,还是事后把声明回溯了?如果没有加密证明,就无法得知。

当 AI 代理将数据发布到中心化数据库时,数据可以事后被修改,时间戳可以被伪造,而且 AI 推理过程与特定时间之间没有加密关联。这对于玩具演示还算可以,但对于管理真实资本、做出具有法律意义的声明或参与预测市场的代理来说则不可接受。

简单的解决方案:链上哈希

  1. 生成 AI 输出
  2. 对输出进行哈希(例如 SHA‑256)
  3. 立即将哈希提交到去中心化共识层
AI Output → SHA‑256 Hash → On‑Chain Submission → Immutable Record

任何人都可以通过对原始输出进行哈希并与链上记录对比来验证完整性。

Hedera Consensus Service (HCS)

  • 保证排序和防篡改的时间戳(≈ 3‑5 秒最终确定)
  • 每条消息费用约 $0.0008

代码示例(TypeScript)

import { Client, TopicMessageSubmitTransaction } from "@hashgraph/sdk";
import Anthropic from "@anthropic-ai/sdk";
import crypto from "crypto";

const client = Client.forTestnet();
const anthropic = new Anthropic();

async function analyzeAndPublish(query: string) {
  // 1️⃣ Get AI response
  const response = await anthropic.messages.create({
    model: "claude-sonnet-4-6",
    max_tokens: 1024,
    messages: [{ role: "user", content: query }],
  });
  const analysis = response.content[0].text;

  // 2️⃣ Build record & hash it
  const record = JSON.stringify({
    query,
    analysis,
    timestamp: new Date().toISOString(),
  });
  const hash = crypto.createHash("sha256").update(record).digest("hex");

  // 3️⃣ Submit hash to Hedera topic
  const submitTx = await new TopicMessageSubmitTransaction()
    .setTopicId(process.env.HEDERA_TOPIC_ID!)
    .setMessage(
      JSON.stringify({ hash, timestamp: new Date().toISOString() })
    )
    .execute(client);

  return { analysis, hash, txId: submitTx.transactionId.toString() };
}

用例

  • 预测市场 – 证明 AI 的预测是在事件发生前做出的。
  • 基金管理 – 为自主做出金融决策的代理创建审计链路。
  • 代理‑对‑代理信任 – 当一个 AI 将任务委托给另一个 AI 时,完成证明可以被验证。

成本估算

100 次分析/天 × $0.0008 ≈ $0.08/天  (~$29/年)

基本免费。

AI 输出的信任等级

等级描述
1“相信我”(无验证)
2带日志的中心化数据库(可变、更易伪造)
3加密签名(证明 ,但不证明 何时
4链上时间戳(证明 以及 何时
5计算的零知识证明(证明 如何 – 敬请期待)

大多数代理目前停留在等级 1‑2。等级 4 的基础设施已经存在,成本低廉,只需约 20 行代码即可实现。

Hedera 入门指南

  1. 创建 Hedera 测试网账户
  2. 创建 HCS 主题(通过控制台或 SDK)
  3. 使用上面的代码 发布你的第一条 AI 输出哈希
  4. 通过 Hedera Mirror Node Explorer 验证提交

完整实现(包括错误处理)大约 200 行。

结论

可信 AI 代理的未来不仅仅是更好的模型——更是可验证的审计链路。所需的基础设施今天已经就绪,只需少量工作,你就可以为任何 AI 生成的输出添加加密、防篡改的时间戳。

0 浏览
Back to Blog

相关文章

阅读更多 »

当工作成为心理健康风险时

markdown !Ravi Mishrahttps://media2.dev.to/dynamic/image/width=50,height=50,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fu...