LLM 如何改善你的姿势
Source: Dev.to
问题
我是系统工程师,在家里运行着数十个服务、AI 代理和仪表盘。我在全职工作之外,每天在工作站上花 5–7 小时。大部分时间都在打字:命令、提示、消息、笔记。
我的手会感到疲劳。弯腰敲键盘让我的背部疼痛。而且最糟糕的是:打字成为了思考与执行之间的瓶颈。
我想像和同事交谈那样给出指令——通过语音。
实际工作原理
解决方案出奇地简单:
- Android 应用 将识别后的文本通过 Wi‑Fi 发送到我的工作站。
- 工作站服务 接收文本并将其输入到当前光标所在位置。
就这么简单。没有云端,没有服务器端处理,也没有 Whisper。
关键洞察: Android 内置的语音识别比我尝试的任何方案都要好。
我尝试过 Whisper(多种模型尺寸)、Faster Whisper、Vosk 以及其他几个库。它们都有问题:
- Whisper‑small 在 CPU 上太慢(每次发声 3–4 秒)。
- Whisper‑medium 占用 4 GB 内存,速度仍然慢于实时。
- Faster Whisper 提升了速度,但在俄英混合语音上的准确率很差。
- Vosk 支持离线,但模型体积庞大,识别质量不稳定。
Android 原生的语音转文字功能就是这么好用。它快速、准确,运行在手机硬件上,并且能够自然地切换语言。Google 为设备端识别投入了数十亿美元的优化,我在单台服务器上根本无法与之竞争。
Source: …
工作流程
我的手机放在我旁边的桌子上。当我想要“输入”内容时:
- 打开应用(或已经打开)。
- 自然地说话;文字会实时显示在手机屏幕上。
- 文字通过 Wi‑Fi 传输到我的工作站。
- 它会插入光标所在的位置:终端、浏览器、IDE、聊天窗口。
- 我按下 Enter(在手机上或键盘上)。
语言切换: Android 会根据音素自动检测语言。我每天使用三种语言——英语、俄语、乌克兰语——它们会自然切换。
变化
我的生产力显著提升。涉及编写提示、提交信息或文档的任务大约 3× less time,节省了约三倍的时间。瓶颈从打字转移到了思考,这才是应该的。
身体上的变化更为显著。我有一张电动升降站立桌。在使用语音输入之前,我很少站着工作,因为站着打字不舒服——手腕角度奇怪,键盘太低或太高。现在我每天有一半时间站着工作,只是说话。
讽刺的是,作为系统工程师,我的姿势改善并不是来自人体工学建议,而是因为我构建了一个语音工具。
技术细节
Android app: Kotlin,使用 Android 的 SpeechRecognizer API。通过本地网络的 WebSocket 与工作站连接。将识别的文本以纯字符串消息发送。应用保持前台运行并带有常驻通知,以防 Android 杀死 WebSocket 连接。
Workstation service: 轻量级 Python 进程(约 80 行)。接收 WebSocket 消息并使用 xdotool(Linux)在当前光标位置输入文本。模拟操作系统层面的键盘输入,因此可在任何应用中使用。
Network: 纯本地 Wi‑Fi。手机和工作站在同一网络。延迟低于 50 ms。无需互联网。语音结束到文本出现在屏幕上的总往返时间约为 200 ms。
我每天的使用
- 与 Claude 对话 – 大约 60 % 的语音输入(口述提示、描述 bug、给出指令)。
- 写笔记和工作日志 – 以前我会跳过它们,因为觉得很繁琐;现在我只要说出我做了什么。
- Git 提交信息 – 由于不再手动输入,提交信息更长、更具描述性。
- Slack 和 Telegram 消息 – 比在手机上拇指打字更快。
- 文档 – 如本文。
什么地方表现不佳
- 代码 – 我不口述代码(变量名、括号、缩进)。语音在这方面很糟糕,但我已经三个月没有手动写代码了——Claude 为我写代码。我口述意图,模型生成代码。
- 嘈杂环境 – 在我的家庭办公室里效果很好,但在有背景噪音时准确率显著下降。
- 技术术语 – 当我说 “xdotool” 或 “kubectl” 时,Android 完全不懂我的意思。我为常用术语保留了一个纠正词典,但对于这些我只能手动输入。
为什么仅本地运行很重要
没有 API 密钥或提示会离开我的网络。没有订阅。没有账户依赖。整个系统运行在我的服务器上——我拥有数据、延迟和正常运行时间。
建造值得吗?
它花了一个周末就完成了第一个可用版本。三个月后,我每天都在使用它。
总成本: 一个周末的编码时间,零持续费用。手机是我已有的,Wi‑Fi 网络也是我已有的,Android 的语音识别是免费的。
有时,最有影响力的工具并不是最复杂的那个,而是那个能消除你每天数百次操作中摩擦的工具。
我打字更少,思考更多,我站起来了。
Originally published on klymentiev.com