你的内容工具缺少的可读性评分
Source: Dev.to
大多数可读性工具只给出一个单一分数。这在构建文档流水线、内容检查器或任何需要在内容发布前捕获不可读文本的系统时是个问题。
下面是四个值得跟踪的指标、它们实际衡量的内容以及你的目标值。
Flesch‑Kincaid Grade Level
该分数根据两个输入——平均句子长度和平均单词音节数——将文本映射到美国学校年级水平。分数为 8 表示典型的 13 岁孩子可以毫无障碍地阅读。
目标: 大多数技术文档为 6 到 9。
- 高于 12: 句子过长或使用了多音节术语;读者会跳过密集的段落。
- 低于 5: 可能过度简化,以至于缺失上下文。
Flesch Reading Ease
使用与 FK Grade Level 相同的输入,但在 0‑到‑100 的尺度上输出相反的分数。分数越高表示越容易阅读。它对句子长度的权重高于音节数,因此对连写句子惩罚更重。
目标: 技术文档为 60 到 70。
- 低于 50: 已进入学术或法律领域;大多数读者不会读完该部分。
- 高于 75: 可能失去精确度,这在技术写作中很重要,因为准确的措辞承载意义。
60‑70 的区间是清晰度与准确性共存的实际甜点。
Automated Readability Index (ARI)
ARI 采用不同的方法。它不统计音节,而是统计每词字符数。这使得计算更快,也不易受音节划分边缘情况的影响。它输出的年级分数类似于 FK,但在技术内容中常会出现差异,因为长词常见但对目标受众未必困难。
目标: 开发者文档为 7 到 10。
ARI 充当交叉检查:如果 FK 给出 8 年级而 ARI 给出 14 年级,说明一堆长技术术语导致字符数膨胀。即使内容对主题专家来说读起来没问题,也值得审视,因为新手用户没有这些背景。
Sentence Length Variance
大多数工具只报告平均句子长度,止步于此。方差才是它们遗漏的信号。所有句子长度相近的文本显得单调,阅读和解析更困难。短句与长句交替使用可以形成节奏,让读者保持方向感。
目标: 句子长度的标准差在 8 到 15 个词之间。
- 低于 5: 写作平淡。
- 高于 20: 句子结构不一致,既会困扰自动解析器,也会让人工阅读者感到混乱。
这在过程文档中特别重要——可快速扫描的短句应当支撑更长的解释性句子。
我构建了一个 TextAnalytics API,能够在一次调用中返回所有这些分数——如果你在构建检查器、CMS 插件或仅仅想为内容流水线设质量门槛,这会非常有用。