HTML 作为论文的可访问格式

发布: (2025年12月6日 GMT+8 22:59)
6 min read

Source: Hacker News

HTML 作为论文的可访问格式

研究中的可访问性障碍并非新生事物,但它们非常紧迫。我们从社区听到的声音是,arXiv 通过在现有 PDF 之外提供 HTML 论文,可以在最短时间内产生最大影响。

arXiv 已成功推出 HTML 格式的论文。我们正逐步为 arXiv 超过 200 万篇论文的语料库补充 HTML。并非所有论文都能成功转换,因此会有少量论文没有 HTML 版本。我们将随时间改进转换质量。

HTML 格式的链接将出现在摘要页面的现有 PDF 下载链接下方。作者将在提交过程的某个环节预览其论文的 HTML。

Beta 推出仅是开始。我们还有很长的路要走来改进 HTML 论文,并将继续征求作者、读者以及整个 arXiv 社区的反馈,以提升 LaTeX 的转换效果。

为什么是“实验性”HTML?

你知道吗,arXiv 90 % 的投稿是 TeX 格式,主要是 LaTeX?这带来了独特的可访问性挑战:要将 TeX——一种被作者以各种独特方式广泛扩展的语言——准确转换为 HTML,而 HTML 对屏幕阅读器、文字转语音软件、屏幕放大器和移动设备更友好。除了技术挑战外,转换必须快速且自动化,以维持 arXiv 免费、快速传播的核心服务。

正因为这些挑战,我们知道会出现一些转换和渲染问题。我们决定以“实验性”HTML的 beta 形式推出,因为:

  • 可访问的论文现在就需要。我们与 arXiv 社区,尤其是有可访问性需求的研究者交流,他们一致要求我们不要等待。
  • 我们需要你的帮助。显而易见的工作已经完成。社区的报告将帮助我们定位那些未能正确转换的特定 LaTeX 包。

在 HTML 论文中可能看到的错误信息

arXiv.org 上的 HTML 论文仍在不断完善,有时会显示错误。随着我们改进可访问性,向你说明这些错误的原因以及作者可以采取的措施以尽量减少它们。

了解更多关于在 HTML 论文中可能看到的错误信息

参与方式

1) 阅读 HTML 论文并报告问题

我们鼓励社区在自己的研究领域尝试 HTML 论文。

报告问题

  1. 前往你感兴趣的论文的摘要页面。

  2. 找到 PDF 下载链接并点击新的 HTML 链接。

  3. 通过以下任意方式报告问题

    • 点击 Open Issue 按钮,
    • 选中文本后点击 Open Issue for Selection 按钮,或
    • 使用键盘快捷键 Ctrl+?

    如果你使用屏幕阅读器,请使用 Alt+y 在每段切换可访问的报告按钮。

请不要因为 HTML 论文与 PDF 论文外观不完全相同而创建报告。
我们的首要目标是提升论文的可访问性,因此在 beta 阶段我们更看重功能而非形式。布局错误或难以辨认的 HTML 必须报告。我们确实预期 HTML 论文的呈现方式会与 PDF 不同:换行位置会不同,可能会有更多空白,复杂的排版布局会被简化。这是设计使然。

HTML 是一种不同的媒介,相较于 PDF 具有自身优势。除了与辅助技术的兼容性更好外,HTML 还能更好地适配你所使用的设备特性,包括移动设备。

2) 帮助改进 LaTeX 的转换

  • 作者: 请参阅我们的指南《LaTeX 标记最佳实践以实现成功的 HTML 论文》。
  • 开发者: 为转换工具贡献代码。我们的合作伙伴 LaTeXML 维护着一个问题列表,欢迎反馈和贡献。
  • 出版商、学会、会议组织者: 审核贵组织向作者推荐的 .cls 文件中不受支持的宏包。提供使用受支持宏包的 .cls 文件是支持并在科学社区中推广可访问性的简便途径。

感谢我们的合作伙伴

我们想向所有在本项目期间慷慨分享见解、专业知识和指导的残障科学家表达特别的感谢。

我们还要感谢两家组织,没有它们,arXiv 上的 HTML 论文将不可能实现:LaTeX 项目 和来自 NIST 的 LaTeXML 团队。我们深深感激这些团队的每一位成员,感谢他们的知识、卓越工作以及对可访问性的承诺。

Back to Blog

相关文章

阅读更多 »

滚开联系页面

请提供您希望翻译的具体摘录或摘要文本,我才能为您进行翻译。