[Paper] 通过 Machine Learning 和 Artificial Intelligence 测量与促进和平

发布: 1个月前 (2026年1月9日 GMT+8 02:57)

7 分钟阅读

原文: arXiv

请提供您希望翻译的具体文本内容，我会按照要求保留顶部的来源链接并将其余部分翻译成简体中文。

概览

本文探讨了机器学习（ML）和人工智能（AI）如何既能衡量新闻和社交媒体内容的“和平度”，又能促进更具建设性的媒体消费。通过将原始文本和视频转录内容转化为量化的和平分数，作者构建了工具，使普通用户能够看到他们阅读或观看的媒体可能在激化冲突或促进平静方面的影响。

Cross‑domain peace detection: 神经网络模型从新闻文章嵌入中推断和平水平，并能够在不同新闻语料库之间实现泛化。
Social‑media peace metrics: 基于词级别（GoEmotions）和上下文级别（大型语言模型）的分类器，用于评估 YouTube 视频中的和平相关社交维度。
Real‑time user feedback tool: Chrome 扩展 MirrorMirror，在用户观看 YouTube 视频时实时显示“和平得分”，引导用户选择更平和的内容。
Open‑source vision: 作者提出了一个可扩展平台，供记者、创作者、研究人员和平台审计并改进其媒体流程的语调。

数据收集
- 新闻: 大量标注了和平相关语言的在线文章（例如，冲突‑自由 vs. 冲突‑充斥）。
- YouTube: 视频转录文本配有人为标注的情感标签（使用 GoEmotions 分类法）以及更广泛的社会维度标签（例如，尊重、合作）。
特征提取
- 来自预训练 transformer 模型（例如 BERT）的文本嵌入捕捉新闻文章中的语义细微差别。
- 对于视频，有两个并行的流：
  - 词级: 基于计数的情感特征，来源于 GoEmotions。
  - 上下文级: 使用提示的大型语言模型（LLM），在给定完整转录文本的情况下生成和平概率。
模型训练与验证
- 在新闻数据集上训练的监督分类器（前馈神经网络）；在另一个新闻来源上测试性能，以验证可迁移性。
- 对 YouTube 数据进行多任务学习，同时预测情感强度和和平得分。
MirrorMirror 扩展
- 训练好的 YouTube 模型在浏览器客户端运行，实时为每个视频打分。
- UI 叠加一个简单的仪表（例如，绿‑黄‑红）以及可选的文字说明，解释为何视频被认为“较不和平”。

领域	指标	结果
新闻	准确率（跨数据集）	≈ 87 % – 在一个媒体上训练的模型在完全不同的媒体上仍保持高性能。
YouTube	F1‑score（peace vs. non‑peace）	0.81 – 使用词汇层面和上下文层面特征的组合实现了强区分能力。
MirrorMirror 用户测试（N = 120）	使用扩展后自报告情绪唤起的变化	‑22 % 平均下降；参与者报告对观看视频的语调“更有意识”。

这些数字表明，自动和平评分在不同媒体类型之间既可靠又对终端用户可操作。

未来方向