计算机终于学会倾听

发布: (2026年2月10日 GMT+8 17:17)
13 分钟阅读
原文: Dev.to

Source: Dev.to

请提供您希望翻译的文章正文(除代码块和 URL 之外的内容),我将按照要求把它翻译成简体中文并保留原有的 Markdown 格式。

Introduction

有一家位于圣地亚哥的酒吧——我不想说是哪一家,因为那样大家都会去把它毁了——那里的调酒师从未问过我想要什么。他看到我走进来,就直接倒酒。十五年如一日。他只看我坐的姿势就能判断是咖啡日还是里贝罗日。他从不出错。

我提到这一点是因为上周我花了一个小时和我的电脑争论它把文件放在哪儿。

文件是存在的。我写过它。电脑也知道这一点。但电脑要我记住完整的路径、完整的文件名、完整的拼写。你要明白,电脑记忆力完美,却没有主动性。它就像一个拥有无限文件柜却没有常识的职员。

“你知道我的意思,”我对屏幕说,就像你平时那样。

它不知道。它不可能知道。它本来就不是为此而设计的。

破碎的桌面隐喻

在 1984 年——那一年,而不是那本书,尽管那本书也有关——苹果告诉我们,计算的未来是一个带有文件夹的桌面。一个隐喻。你的文件会存在小图标的文件夹里,你会对它们进行组织,一切都直观。

而且确实如此。大约十年间如此。

随后我们拥有了更多的文件。随后我们有了电子邮件。随后我们有了网络、标签页、应用程序、通知、云存储,突然之间桌面隐喻变成了一个残酷的玩笑。没有人的桌面上会有 47,000 件物品。没有人的桌面会在你睡觉时给你发信息。

隐喻崩溃了。但我们仍然在使用它。我们仍在使用它。四十年间拖拽小图标的文件夹,假装这很正常,假装我们的子孙后代也会这么做。

他们不会。

介绍 OpenClaw

我一直在使用一种叫做 OpenClaw 的工具。

我会尝试解释它的功能,但根据不同的读者,这个解释可能显得过于简单或奇怪。它的核心是:你用文字告诉电脑你想要什么,它就会去实现。

  • 不是 “输入这个命令”。
  • 不是 “先点这里,然后点那里,再点这里”。
  • 不是 “记住这个应用的十七个菜单”。

你说出你的需求,电脑会自行找出实现的方法。

  • 找到我上周阅读的那篇关于葡萄牙火车的文章。
  • 把这份文档发送给我的编辑。
  • 明天我有什么会议?
  • 把文字放大。不,是所有文字。遍布所有地方。

它真的能做到。并不是因为它被预先编写了每一种可能的请求——那根本不可能——而是因为它 理解 了请求,并知道如何使用相应的工具。

我知道,这听起来像科幻小说。它也让人联想到过去十年里让我们失望的语音助手。但两者之间有区别,而这个区别很重要。

语音助手不过是派对把戏。它们能回答问题,能设定计时器,能在你用恰当的方式提问时播放音乐。但它们无法真正完成任务,因为它们没有“手”。它们只是装在罐子里的头颅。

这次不同。它有手。

学徒类比

我的一个朋友——一位传统的木匠,制作的家具可以流传千代——曾向我讲述他的学徒经历。师傅会说:

“给我做一张桌子。”

而不是:

“把第三层架子上的橡木板取下来,用锯片设定为……的台锯把它锯成180厘米。”

只要 “给我做一张桌子。”

学徒必须自行想办法完成其余的工作。这就是重点。师傅的职责是描述结果,学徒的职责是对工艺有足够的了解以实现这些结果。

我们已经做了四十年的学徒。计算机是师傅。它告诉我们到底要按哪个按钮,而我们就去按。我们把自己的意图翻译成它的语言,每天成千上万次。

这是一种倒置的关系。这种倒置一直存在。我们只是没有其他选择。

现在

我们可能

会有

别的

选择。

代理式操作系统

我称之为 agentic operating system(代理式操作系统),这个说法听起来有点拗口,但我还没有找到更好的表达。概念很简单:操作系统不再是一个装有按钮的文件柜,而是一个能干的助手。你描述你的需求,它就会执行。

  • 不是需要你事无巨细指挥的助理。
  • 也不是每三十秒就用问题打断你的助理。

就像在圣地亚哥的那位调酒师一样的助理:它一直在关注,了解上下文,能够在不需要你从头解释一切的情况下做出正确的决定。

这不仅仅是人工智能的问题,或者说不只是人工智能的问题。它关乎 架构。关乎决定让人类描述期望的结果,而机器负责实现。关乎接受这本应一直如此的工作方式。

未来的威胁

现在。我在这里感到紧张。

因为无论我们是否构建,这个未来都在逼近。大型科技公司也看到了它。

  • Apple 正在研发。
  • Microsoft 正在研发。
  • Google 肯定在研发。

他们拥有的工程师数量超过某些国家的公民数。

而且他们会按自己的方式构建它。

他们的方式意味着:

  • 只能在他们的硬件上运行。
  • 你的与电脑的对话会被永久存储在他们的服务器上,供他们使用。
  • 只要你留在他们的生态圈内,付费订阅并接受他们的条款,助手就能出色运行。

我们以前见过这种情况。我们现在正身处其中。

从个人到普遍

个人电脑本应是 个人 的。这就是革命所在。在 PC 之前,计算机属于机构——大学、企业、政府。PC 把机器放进了你的家中,置于你的控制之下。

而在一段时间里,这确实如此。你拥有硬件。你拥有软件。你可以打开它,看看它是如何工作的,如果你懂得的话还能修改它。电脑是你的。

随后,所有权慢慢消失了。

  • 软件转向订阅模式。
  • 文件转移到云端。
  • 操作系统开始要求账户,然后是网络连接,随后是你的生物特征数据。

个人电脑变成了 个人终端,连接到别人的计算机。你在租用自己的桌面。

免费软件的角色

免费软件——理查德·斯托曼在 1980 年代开启的项目,林纳斯·托瓦兹在 1990 年代让它变得实用——是抵抗的力量。GNU、Linux,以及整个属于每个人又不属于任何人的工具生态系统。它保留了计算机可以真正属于你的理念。

数以百万计的人在使用它。服务器运行在它之上。手机也运行在它之上(尽管从它们的封闭程度你可能看不出来)。它能工作。它很重要。

而现在,我们再次需要它,为下一次转变做好准备。

因为如果具备主动性的操作系统只能以专有形式存在——如果想要一台会倾听的电脑唯一的方式是让 Apple、Microsoft 或 Google 调解每一次交互——那么我们将失去一种很难再找回的东西。

不仅仅是隐私,虽然隐私也是。也不仅仅是所有权,虽然所有权也是。更根本的是:能够与你自己的工具建立一种不受拥有自身利益的公司监督的关系。

在圣地亚哥的酒吧里,调酒师不会向任何人报告我的饮酒习惯。他也不会建议我可能更喜欢可口可乐。他不会在倒酒的过程中暂停,给我播放广告。关系很简单:我是顾客,他是调酒师,饮料很好喝。

我希望我的电脑也是如此。我猜我并不孤单。

所以,我向所有构建事物的人、向那些让免费软件活了四十年的社区提出请求:

  • 构建它。构建可以在 GNU/Linux、BSD 或任何尊重用户的系统上运行的主动层。
  • 在公开的环境中构建,让我们能够看到它是如何工作的。
  • 构建它,使对话保留在我们的机器上,让助手服务于我们,而不是某个遥远的数据中心。

它不必完美。它不必与 Apple 三年后凭借十亿美元营销活动推出的产品竞争。它必须存在。它必须是一种选择。它必须保持大门敞开。

OpenClaw 是一个起点。还有其他项目。这个架构是可行的——我知道,因为我正在使用它,现在就写下这篇文章,而这在五年前还会被视为魔法。

计算机最终会倾听的未来正在到来。问题是我们是拥有那个未来,还是租用它。

我已经知道我更倾向于哪一种。

电脑仍然倒不出里贝罗(葡萄酒),但它正在学会注意。这已经是进步了。

0 浏览
Back to Blog

相关文章

阅读更多 »

新文章

您确定要隐藏此 comment 吗?它将在您的 post 中被隐藏,但仍可通过 comment 的 permalink 查看。Hide child comments 如我们……

设置 Ollama、NGROK 和 LangChain

!Breno A.https://media2.dev.to/dynamic/image/width=50,height=50,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fu...