小型 OSINT 团队如何将 Epstein 文件泄露转化为可操作情报
It looks like only the source line was provided. Could you please share the text you’d like translated?
概述
2026年2月,我参与了一项完全基于开源情报(OSINT)的集体调查,旨在对美国司法部(DOJ)在埃普斯坦案件相关的公开法庭记录中出现的模糊引用进行背景化。
此项发布——是迄今为止与被定罪的金融家杰弗里·埃普斯坦(Jeffrey Epstein)相关的最大规模公开资料之一——自2026年1月起在所谓的 Epstein Files Transparency Act 框架下向公众提供了数百万页文档。
最初在网络社区内进行的协作分析,在短短几天内演变为支持正式机构行动的技术贡献。其关键区别在于一个小型调查团队的工作方式:将现代工具与严格的人为审校、高效沟通相结合——在实际操作中比许多更大规模的组织更具敏捷性。
这种设置实现了与调查新闻媒体的直接合作,后者通过深入报道扩大了公共数据的传播范围和背景化;同时也与巴西联邦检察院(Ministério Público Federal – MPF)建立了合作。这些互动对于加速官方程序至关重要,包括启动行政调查并随后上报至专门处理跨国犯罪的国家单位。
以下按时间顺序描述了所采用的技术工作流程。
Technical methodology (step‑by‑step)
1. Initial entity extraction and human curation
(Days 1–3 of February 2026)
Public documents — mainly emails and excerpts from 2011 court records released in DOJ datasets — were reviewed manually and with basic supporting tools.
- Most of the early analytical value came from human curation: careful reading of socio‑economic descriptions, vague geographic references and implicit logistical elements.
- This stage established the foundation for all subsequent cross‑referencing.
2. Entity resolution and OSINT mapping with specialised tools
(Around February 4)
Using exclusively public sources, we performed multi‑source correlation involving business registries, corporate structures and open archival datasets.
-
Maltego was used to map digital networks and associated online connections.
-
Entity‑resolution techniques prioritised contextual matches, such as:
- Approximate geographic linkage
- Migration or relocation history
- Recurring logistical and temporal patterns
- Indirect but persistent relationships
-
Open Social Network and Results – as a result, a key intermediary entity was resolved within a matter of hours.
3. Graph construction and visualisation with Neo4j and Mermaid.js
Resolved entities and relationships were imported into Neo4j, enabling the modelling of complex investigative networks and the execution of graph queries focused on:
- Centrality
- Paths and intermediaries
- Logistical and institutional hubs
This graph‑based representation revealed temporal and geographic patterns that were not apparent through linear document analysis.
The entire workflow was visually documented using Mermaid.js, adopting a diagrams‑as‑code approach integrated into Markdown. We produced:
- Process flowcharts
- Timelines
- Entity‑relationship graphs
These visual artefacts greatly facilitated collaborative review, traceability and methodological transparency.
4. AI support (Grok) for chronology and partial analysis
Grok was used as an auxiliary tool to:
- Consolidate event timelines
- Identify dates of mentions and document releases
- Summarise selected text snippets
- Suggest optimised queries and candidate links between entities
AI was used strictly as an operational accelerator. All validation and critical decisions remained under human responsibility and manual source verification.
5. Responsible disclosure, collaboration and immediate impact
(February 4–9)
- ~Day 4: Controlled public disclosure of the resolved entities within s
Note: the original text ends abruptly at “within s”; the content has been retained unchanged.
时间线(示例)
| Day | Activity |
|---|---|
| Day 1 | 从公开来源(法院文件、公司登记、新闻档案)进行初始数据收集。 |
| Day 2‑3 | 社区驱动的丰富 – 专业的在线论坛和 OSINT 小组对实体进行交叉核对,补充缺失链接,并生成初步的图模型。 |
| Day 4‑6 | 独立调查记者的放大 – 使用相同的公开数据,他们发布了深入报告,扩大了可见度并施加了机构压力。 |
| Day 7‑8 | 将映射扩展到已发布文件中发现的其他参考,包括潜在的国际枢纽和公开上市实体。 |
| Day 8‑9 | 观察到行政程序升级至专门处理跨国犯罪的国家单位,这与 OSINT 发现的快速整合和记录相一致。 |
指导原则
- 严格依赖公开且可获取的来源。
- 不收集或披露超出已有公开信息的敏感信息。
- 明确承认工作是集体协作的性质(在线社区、调查新闻以及巴西联邦检察院 – MPF)。
- 持续强调人工策展,以确保准确性、伦理标准和问责制。
经验教训与影响
- 该案例展示了一个小型、协同良好的团队——使用 Neo4j 进行图模型构建,Maltego 进行网络映射,Mermaid.js 用于可视化文档,以及 Grok 提供分析和时间线支持——如何在开源调查中取得超出预期的成果。
- 核心因素不是 自动化,而是对公开数据进行严格的交叉引用,并结合结构化、可审计的文档记录。
- 与调查记者和巴西联邦检察院的直接合作,使技术分析转化为实际的制度性输入。
- 该工作流为 在高影响力社会情境(如埃普斯坦案)中伦理且负责任地使用 OSINT 与 AI 提供了具体示例。
- 从事 OSINT、图数据库、调查过程可视化或 AI 辅助分析的专业人士,可将此工作流迁移到 合规、尽职调查、企业调查和独立研究 等场景中。
团队工作流、数据策划与轻量框架
- 受看板(Kanban)启发的工作流 – 协调任务、控制数据质量,并在整个 OSINT 过程保持可追溯性。
- 以人为中心的数据策划流水线 – 原始提取在提升至共享图谱和文档层之前会经过审查、标准化和验证。
- 每张卡片代表一个单独的调查假设或实体集群,并遵循明确的生命周期:
- 发现
- 初步验证
- 多源佐证
- 图谱整合
- 可发布文档
- 每张卡片代表一个单独的调查假设或实体集群,并遵循明确的生命周期:
- 策划重点 – 防止实体混淆、管理模糊引用,避免过早归因。特别关注以下方面:
- 名称消歧
- 地理不确定性
- 时间一致性
- 来源出处
- 纳入标准 – 仅将由独立公共来源支持且在上下文上连贯的实体纳入 Neo4j 与 Mermaid.js 文档中。
将简易的团队框架(看板式协作)与严格的人为策划层相结合,实现了 在不牺牲方法严谨性、伦理标准或可审计性的前提下的运营速度。
正面运营与制度影响
-
运营收益:
- 任务可视化和明确定义的策展阶段减少了工作重复。
- 减少了相互矛盾的假设,加速了向高置信度实体的收敛。
-
制度收益:
- 一致的策划数据集、清晰的来源溯源以及可追踪的决策流程,使调查记者和 MPF 能更快地复用。
- 降低了验证成本,提升了对 OSINT 输出的信任,并促进了其直接融入正式的分析和行政程序。