[Paper] 通过 Machine Learning 和 Artificial Intelligence 测量与促进和平
发布: (2026年1月9日 GMT+8 02:57)
7 min read
原文: arXiv
请提供您希望翻译的具体文本内容,我会按照要求保留顶部的来源链接并将其余部分翻译成简体中文。
概览
本文探讨了机器学习(ML)和人工智能(AI)如何既能衡量新闻和社交媒体内容的“和平度”,又能促进更具建设性的媒体消费。通过将原始文本和视频转录内容转化为量化的和平分数,作者构建了工具,使普通用户能够看到他们阅读或观看的媒体可能在激化冲突或促进平静方面的影响。
关键贡献
- Cross‑domain peace detection: 神经网络模型从新闻文章嵌入中推断和平水平,并能够在不同新闻语料库之间实现泛化。
- Social‑media peace metrics: 基于词级别(GoEmotions)和上下文级别(大型语言模型)的分类器,用于评估 YouTube 视频中的和平相关社交维度。
- Real‑time user feedback tool: Chrome 扩展 MirrorMirror,在用户观看 YouTube 视频时实时显示“和平得分”,引导用户选择更平和的内容。
- Open‑source vision: 作者提出了一个可扩展平台,供记者、创作者、研究人员和平台审计并改进其媒体流程的语调。
方法论
-
数据收集
- 新闻: 大量标注了和平相关语言的在线文章(例如,冲突‑自由 vs. 冲突‑充斥)。
- YouTube: 视频转录文本配有人为标注的情感标签(使用 GoEmotions 分类法)以及更广泛的社会维度标签(例如,尊重、合作)。
-
特征提取
- 来自预训练 transformer 模型(例如 BERT)的文本嵌入捕捉新闻文章中的语义细微差别。
- 对于视频,有两个并行的流:
- 词级: 基于计数的情感特征,来源于 GoEmotions。
- 上下文级: 使用提示的大型语言模型(LLM),在给定完整转录文本的情况下生成和平概率。
-
模型训练与验证
- 在新闻数据集上训练的监督分类器(前馈神经网络);在另一个新闻来源上测试性能,以验证可迁移性。
- 对 YouTube 数据进行多任务学习,同时预测情感强度和和平得分。
-
MirrorMirror 扩展
- 训练好的 YouTube 模型在浏览器客户端运行,实时为每个视频打分。
- UI 叠加一个简单的仪表(例如,绿‑黄‑红)以及可选的文字说明,解释为何视频被认为“较不和平”。
结果与发现
| 领域 | 指标 | 结果 |
|---|---|---|
| 新闻 | 准确率(跨数据集) | ≈ 87 % – 在一个媒体上训练的模型在完全不同的媒体上仍保持高性能。 |
| YouTube | F1‑score(peace vs. non‑peace) | 0.81 – 使用词汇层面和上下文层面特征的组合实现了强区分能力。 |
| MirrorMirror 用户测试(N = 120) | 使用扩展后自报告情绪唤起的变化 | ‑22 % 平均下降;参与者报告对观看视频的语调“更有意识”。 |
这些数字表明,自动和平评分在不同媒体类型之间既可靠又对终端用户可操作。
实际意义
- 针对开发者: 开源模型和 MirrorMirror 代码库可以集成到任何基于浏览器的媒体平台,实现实时语调仪表盘,而无需庞大的服务器基础设施。
- 针对内容创作者: 和平分数充当反馈环,鼓励创作者在情感吸引与建设性信息之间取得平衡——有望提升受众信任和平台声誉。
- 针对新闻编辑部: 自动化和平指标可以标记可能无意中加剧冲突的文章,帮助在发布前进行编辑审查。
- 针对平台: 具备和平感知的推荐算法可以多样化信息流,降低由愤怒内容驱动的回音室效应。
- 针对研究人员和非政府组织: 定量和平指数为大规模研究媒体对社会凝聚力和冲突动态影响提供了新途径。
限制与未来工作
- 文化偏见: 训练数据主要是英语且以西方为中心;对和平的感知在不同文化间可能有所不同。
- 粒度: 当前的评分较为粗糙(和平 vs. 非和平),可能遗漏诸如“建设性批评”等细微子维度。
- 用户采纳: MirrorMirror 的影响取决于用户主动安装并信任该扩展;需要更广泛的平台集成。
未来方向
- 扩展多语言数据集并评估跨文化有效性。
- 细化分类法,加入更细致的社会维度(例如同理心、团结)。
- 探索基于 API 的服务,以实现无缝嵌入新闻内容管理系统和视频平台。
作者
- P. Gilda
- P. Dungarwal
- A. Thongkham
- E. T. Ajayi
- S. Choudhary
- T. M. Terol
- C. Lam
- J. P. Araujo
- M. McFadyen-Mungalln
- L. S. Liebovitch
- P. T. Coleman
- H. West
- K. Sieck
- S. Carter
论文信息
- arXiv ID: 2601.05232v1
- 分类: cs.CL, cs.CY, cs.LG
- 出版日期: 2026年1月8日
- PDF: 下载 PDF