Gemini 上的屏幕阅读器体验缓解
Source: Dev.to
摘要
本文描述了 PageLive 如何解决伴随的 Screen Reader Experience Analysis on Gemini 中识别的障碍。PageLive 是一个在浏览器层运行的 Chrome 扩展,通过在不修改 Gemini 应用本身的情况下弥补可访问性缺口。并非所有障碍都已完全解决;对于 PageLive 仅提供部分缓解的情况,会在文中明确注明。
范围
本文直接对应 Gemini 上的屏幕阅读器体验分析中的发现。发现按原始编号引用。缓解措施已在 Windows 桌面上的 Chrome 中使用 NVDA 进行测试。
PageLive 可在 PageLive Chrome Web Store 页面 免费安装。
缓解措施
2.1 未宣布响应完成
分析严重性: 障碍
缓解状态: 已解决
PageLive 监控页面上的新助手响应,并向屏幕阅读器宣布其可用性。当生成完成、内容准备好阅读时,用户会收到通知,无需导航到聊天区域或猜测输出是否仍在进行中。
如果用户希望按需获取响应,可按 Ctrl + Shift + Enter 读取最近的 Gemini 响应,而不会更改导航上下文。当用户已将焦点移至其他位置且不想手动返回聊天区域时,这非常有用。
2.2 屏幕阅读器无法读取公式和符号
分析严重性: 阻断
缓解状态: 已解决
PageLive 处理 Gemini 响应中的公式和符号内容,并以屏幕阅读器能够读取的形式呈现。没有 PageLive 时,这些元素在可访问性树中缺失,导致没有输出。使用 PageLive 后,用户在正常阅读响应时即可获得公式和符号的内容。
2.3 对话框出现未被宣布
分析严重性: 障碍
缓解状态: 已解决
PageLive 在 Gemini 中的对话框打开或关闭时进行宣布,提供基于事件的状态反馈。用户会被告知对话框已出现,无需自行导航去发现它。
2.4 长对话中缺乏回顾聊天流程的手段
分析严重性: 障碍
缓解状态: 已解决
PageLive 引入 ContentMap,可通过 Ctrl + M 打开,呈现当前对话中提示和响应的结构化摘要。用户可以在列表中导航,按 Enter 在任意条目上直接跳转到聊天历史中的相应位置。
这为用户提供了一种定位机制,功能等同于视力用户通过扫描对话的视觉布局获得的感知,而无需顺序遍历整个聊天记录。
2.5 缺少常用操作的键盘快捷键
分析严重性: 摩擦
缓解状态: 已解决
| 操作 | 快捷键 |
|---|---|
| 跳转到聊天输入框 | Shift + Esc |
| 开始新聊天 | Ctrl + Alt + O |
| 删除当前聊天 | Ctrl + Shift + Backspace |
| 宣布上一次响应 | Ctrl + Shift + Enter |
| 打开用于聊天导航上下文的页面信息 | Alt + / |
删除快捷键会打开确认对话框,允许用户在操作完成前确认或取消。通过 Alt + / 打开的页面信息对话框提供活动聊天的元数据,并可通过在聊天标题控件上按 Enter 将焦点直接移动到侧边栏列表中的当前聊天。
缓解措施概述
| 发现 | 分析严重性 | 缓解状态 |
|---|---|---|
| 2.1 未宣布响应完成 | 障碍 | 已处理 |
| 2.2 屏幕阅读器未读取公式和符号 | 阻塞 | 已处理 |
| 2.3 对话框出现未宣布 | 障碍 | 已处理 |
| 2.4 长对话中无法回顾聊天流程 | 障碍 | 已处理 |
| 2.5 常用操作缺少键盘快捷键 | 摩擦 | 已处理 |
进一步阅读
本文是 PageLive 项目针对 Gemini 的文档的一部分。文中引用的所有发现均在配套的 Screen Reader Experience Analysis on Gemini 中完整记录。有关 PageLive 为 Gemini 提供的完整键盘快捷键和功能列表,请参阅 PageLive for Gemini documentation。
免责声明
- 本文是 PageLive 项目的一部分,该项目开发 AI 聊天界面的键盘快捷键和屏幕阅读器支持。作者开发了本文所述的 PageLive 扩展。
- 可在 PageLive Chrome Web Store 页面 免费安装 PageLive。
- 本文中引用的发现、严重性分类和测试观察均为作者本人基于在 Chrome 上使用 NVDA 的手动测试所得。AI 辅助仅用于塑造本文的写作风格。