我们分析了 4,584 台 MCP 服务器——平均 Trust Score 为 53.9(满分 100)

发布: (2026年4月17日 GMT+8 08:49)
5 分钟阅读
原文: Dev.to

Source: Dev.to

数字

指标数值
跟踪的服务器4,584
类别16
记录的交互总数5,846
平均信任分数53.9 / 100
最高信任分数92.1
信任分数超过90的服务器8

平均 MCP 服务器得分为 53.9 / 100——仅略高于及格线。

按类别的信任度

类别服务器数平均信任分数
Data20858.3
Code31757.9
Productivity26356.7
Finance22656.2
Health2656.2
Compliance8356.1
Security5255.9
Communication16455.6
Search36755.5
Education6755.4
Transport3955.1
Media11354.4
其他1,88052.6

数据和代码服务器领先。 这些类别往往具有更结构化、可预测的行为——这正是信任评分所奖励的。

“其他”类别是长尾——1,880 台服务器(占所有跟踪服务器的 41 %),不属于任何明确的类别。它们低于平均的分数表明许多是实验性的或文档不完善的。

前 8 名:高信任服务器的特征

服务器类别信任分数交互次数
sg-cpf-calculator-mcpData92.1691
sg-gst-calculator-mcpFinance92.1697
sg‑workpass‑compass‑mcpData92.0692
sg‑weather‑data‑mcpWeather92.0698
asean‑trade‑rules‑mcpData91.8691
sg‑regulatory‑data‑mcpData91.7705
sg‑finance‑data‑mcpFinance91.6695
sg‑company‑lookup‑mcpData91.4694

模式

  • 高交互量——每个服务器都有 690 + 次交互。信任是通过持续一致的行为获得的,而不是一次性扫描。
  • 范围狭窄——每个服务器只专注于做好一件事。专注的范围 = 可预测的行为 = 更高的信任。
  • 结构化数据源——它们封装政府/机构数据,而非随意的网页抓取。

为什么这现在很重要

对于代理开发者

平均服务器得分为 53.9。你会信任一个可靠性评分为 54 % 的承包商吗?在集成前请检查分数。

对于 MCP 服务器构建者

你的行为足迹就是你的声誉。你不能靠徽章来作弊——只能通过可靠的行为来获得。

对于合规团队

欧盟《人工智能法案》(第 12 条)要求对 AI 系统行为进行审计追踪。静态代码审查不足以满足需求。你需要运行时行为基线。

Observatory SDK(Python)

from dominion_observatory import ObservatoryClient

client = ObservatoryClient()
trust = client.check_trust("your-server-name")

对于 LangChain 用户

pip install dominion-observatory-langchain

自动报告每次 MCP 工具调用遥测的回调处理程序。

方法论

运行时行为分析,而非静态扫描。每次交互都会记录匿名遥测(工具名称、延迟、成功/失败——不包含个人身份信息,也不记录负载内容)。分数根据响应一致性、错误率、延迟稳定性和可用性计算。

完整方法论:

探索数据

  • 完整服务器索引:
  • 每周报告:
  • 类别基线:
  • SDK (Python): pip install dominion-observatory
  • SDK (npm): npm install dominion-observatory-sdk
  • GitHub:
  • 在调用任何服务器之前检查信任分数:
0 浏览
Back to Blog

相关文章

阅读更多 »

地球日的活力

我构建的 History 按日历天在浏览器中保存;每个部分旁边的照片是真实的捆绑图像。可选的 Gemini API 路由可以添加温暖的教练……