左子祯｜我们跟电脑的关系，可能从第一天起就是反的

导读

Perplexity 预告的 Personal Computer 捅破了一层窗户纸：我们习惯了把意图拆解成无数点击和拖拽来“伺候”电脑。左子祯认为，真正的 AI 变革不该是模拟人类去点鼠标，而是直接接收目标。这种从“指令”到“目标”的范式转移，正试图结束长达四十年的“人机错位”关系。

重点

传统系统依赖指令，而 AI 操作系统应接收目标，跳过中间繁琐的“翻译”步骤，直接交付最终结果。
现在的 AI 模拟点击就像是“没有马的马车”，只是在用旧时代的交互逻辑，去强行适配新时代的智能。
我们不应追求让 AI 熟练操作 UI 界面，而应重构底层逻辑，让机器直接理解数据并调用能力完成任务。

备注

所谓“数字化能力”往往是对繁琐工具的妥协。如果 AI 只是在替我们走一遍点按钮的老路，那它依然没能跳出马车时代的思维。真正的解放不是找个替身去干杂活，而是让“流程”这个概念本身从用户的视野中消失。

编辑评论

看到左子祯分享的这段关于 Perplexity 新产品“Personal Computer”的思考，我第一反应不是去查那个常驻在桌面上、24/7 运行的 Mac mini 到底长什么样，而是被他引述的那句“传统操作系统接收指令，AI 操作系统接收目标”给击中了。作为长期跟踪硬件和 AI 演进的编辑，我得说，这可能是今年最能戳破大模型泡沫的一句话。我们现在对 AI 的兴奋点确实有点跑偏。你看社交媒体上那些火爆的 Demo，无论是 OpenClaw 还是各种 Agent，大家都在惊叹 AI 能像人一样移动鼠标、点击浏览器、在搜索框里打字。这看起来很酷，但冷静下来想，这其实是极其低效且滑稽的。正如文中所说，这叫“没有马的马车”。我们发明了算力惊人的芯片，结果却让它去模拟人类那根迟钝的手指在屏幕上找按钮。如果一个 AI 还需要通过视觉识别去点那个“导出”按钮，那说明底层的系统逻辑根本没变，它只是在替你打杂，而不是在帮你解决问题。 Perplexity 提出的这个方案，可信度其实挺微妙的。一方面，Perplexity 在搜索领域的创新已经证明了他们有颠覆交互的基因；但另一方面，让用户专门买一台 Mac mini 跑本地服务，这种产品形态非常“硬核”，甚至带点极客的偏执。它更像是一个过渡期的实验品，而不是最终面向大众的消费电子。目前的公开信息非常有限，我们甚至不知道它如何处理隐私边界，或者如何解决云端指令与本地文件操作之间的延迟。但它的核心价值不在于那台 Mac mini，而在于它试图把人类从“翻译员”的角色里解救出来。这种转变对整个软件产业的冲击将是毁灭性的。如果未来我们只需要给出一个“目标”，那么现在市面上 90% 的 SaaS 软件、那些靠复杂的 UI 界面和操作流程建立壁垒的工具，都会失去存在的意义。当 AI 可以直接调用 API 或者理解底层数据流来达成结果时，谁还需要学习怎么用 Photoshop 的滤镜，或者怎么在 Excel 里写复杂的嵌套公式？软件的“易用性”将不再取决于界面设计得好不好看，而取决于它对人类意图的理解有多精准。对于我们普通用户来说，这其实是一个非常重要的判断标准。以后你在挑选 AI 工具时，可以试着问自己一个问题：这个东西是在帮我“点鼠标”，还是在帮我“拿结果”？如果是前者，它只是一个更高级的宏脚本，很快就会被淘汰；如果是后者，它才真正触及了下一代计算的

今天看到 Perplexity 发布了一个新产品的预告，叫 Personal Computer。

目前能了解到的产品形态是这样的：产品跑在一台专用的 Mac mini 上，7×24 小时运行，常驻在你的桌面上。它可以持续访问你本地的文件、应用和会话，同时连接 Perplexity 的云端服务器，你可以从任何地方远程控制它。

更多的信息还不知道，因为还没有正式发布，但它官网上的第一句话，我反复读了很多遍：

传统操作系统接收指令（instructions），AI 操作系统接收目标（objectives）。

这句话像一把刀，把我脑子里一团模糊的东西一下子切开了。

我突然意识到一件事：我们跟电脑的关系，可能从第一天起就是反的。

———

你每天花多少时间在"翻译"？

你想把一份会议纪要整理成 PPT 发给老板。你的意图就一句话，但你要做的事情是：打开备忘录，复制内容，打开 PPT 软件，选模板，调格式，插图片，导出文件，打开邮箱，写正文，加附件，点发送。

十步。

你的意思只有一个，你替电脑翻译了十步。

仔细想想，你每天在电脑前的八个小时，有多少是在做"真正的思考和决策"，有多少是在做 "把想法翻译成电脑能理解的操作"？

我赌后者至少占了六个小时。

按钮是给你的手指点的。菜单是给你的眼睛找的。下拉框、滚动条、弹窗、确认对话框，所有这些界面元素，本质上是一套翻译系统。它存在的唯一原因是电脑听不懂人话。

我们发明了人类历史上最强大的机器，然后花了四十年时间学习怎么伺候它。

然后还把"伺候得熟练"叫做 "数字化能力"。

———

所以最近这波 OpenClaw 热潮，到底在兴奋什么？

你肯定注意到了，最近 OpenClaw 在国内外的火热，几乎所有大公司都在疯狂推自己的 “龙虾”，像下饺子一样往外蹦。

网上每天都有人发视频：龙虾自己打开浏览器截图了！龙虾自己写代码部署了！龙溪自己做 PPT 了！

评论区一片"卧槽牛逼"。

但看多了之后有一个很奇怪的感觉一直消不掉：

这些 demo 都很酷，但我关掉视频之后，没有任何一个真正改变了我的日常。

为什么？

你仔细看那些 demo 在干嘛：AI 打开 Chrome，AI 移动鼠标，AI 点击按钮，AI 在输入框里打字。

它在模拟人类操作电脑的动作。

这两件事听起来一样但完全不同："AI 在帮你完成任务"和"AI 在模拟你用鼠标键盘操作界面"。

一个超级智能，它的工作方式是看屏幕截图，识别按钮在哪，然后模拟鼠标移过去点一下。

它在走人类走的那条弯路。

这就好比你雇了一个天才，然后让他坐在你的工位上，用你的鼠标，照着你的流程，一步步点。他明明可以直接理解数据、直接调用能力、直接完成任务，但你非要他用你的方式干活。

这不是解放。这是带着旧枷锁跳舞。

———

一个"没有马的马车"式的荒诞

汽车刚发明的时候，英语里管它叫 horseless carriage，"没有马的马车"。

理解新事物最偷懒的方式，就是拿旧事物做参照。所以早期的汽车长得跟马车一模一样，就是把前面的马换成了发动机。路还是马车走的路，规则还是马车时代的规则。

后来怎么样？人们意识到：车的形态、道路的设计、城市的结构为什么不能变？

然后一切都变了。

现在的 AI Agent 行业，就处在"没有马的马车"阶段。

我们把人去掉了，但完整保留了人操作电脑的全套流程。AI 在模拟人点鼠标、人敲键盘、人看屏幕。

没有人的人机交互。没有马的马车。一模一样的逻辑。

真正该问的问题不是"怎么让 AI 更像人一样操作电脑"，而是：

如果 AI 是主角，"电脑"这个东西还应该长这样吗？

———

"指令"和"目标"：一词之差，两个物种

回到那句让我反复咀嚼的话：传统操作系统接收指令，AI 操作系统接收目标。

这不是文字游戏。这背后是两种完全不同的人机关系。

接收指令的系统：你是操作者，它是工具。你得懂它。你得学它的语言，适应它的逻辑，记住它的规则。你不会用，是你的问题。

接收目标的系统：你是老板，它是员工。它得懂你。你只管说要什么结果，怎么做是它的事。它没做好，是它的问题。

过去四十年，人和电脑的关系是第一种。人去适应机器，人去学习软件操作，人去记忆软件快捷键。

我们一直把"学会操作工具"当成能力，但其实那是成本。

你什么时候见过有人需要"学习怎么用椅子"？好的工具不需要学习。需要你学习的工具，恰恰说明它还不够好。

从"你懂电脑"到"电脑懂你"，这个翻转迟早要发生。

———

App 这个概念正在死亡

顺着这个逻辑往下想，有一件事变得很明显：

你为什么需要不同的 App？因为不同任务需要不同软件处理。写文章用 Word，做表格用 Excel，发邮件用 Outlook，管项目用 Notion。

但对 AI 来说，这些边界不存在。它不在乎数据在哪个 App 里，它只在乎怎么完成你的目标。完成目标需要同时调五个 App 的数据，它就同时调，你甚至不需要知道背后跑的是什么。

你不会再说"打开 Excel"，你只会说"帮我看看上个月的销售数据怎么样"。

App 不会消失，但它会从"你面对的界面"变成"AI 调用的能力"。

就像你去餐厅点菜，你不需要知道后厨用的是什么锅、什么灶、什么刀。你只要说你想吃什么。

以后用电脑也是一样。App 会变成后厨，AI 是服务员，你只管点菜。

———

AI 会逼你直面那个真实的问题

看到这些变化的时候，我脑子里闪过的第一个念头不是兴奋。

是不安。

我花了二十多年学会的那些技能、软件、工作技巧，可能正在变得毫无价值。

这些东西曾经是"效率高"的标志。现在呢？如果电脑不再需要你"操作"了，这些技能算什么？

但想了想，每一次技术范式转移都是这样。

旧时代的稀缺能力，会变成新时代的基础设施。这很残酷，但一直在发生。

那新的稀缺能力是什么？

我觉得是你能不能清晰地知道自己到底要什么。

当电脑从"接收指令"变成"接收目标"的时候，瓶颈不再是"怎么做"，而是"做什么"。

你有没有过这种体验：老板让你做个方案，你打开 PPT，先选模板，调颜色，排版，忙了半小时，其实一个字正文都没写。你不是在做方案，你是在用操作的忙碌逃避思考的痛苦。

AI 会把这个逃避的空间压缩掉，它会逼你直面那个真问题：你到底要表达什么？你到底要达成什么？你到底要什么？

在一个 AI 能替你做所有事情的世界里，最值钱的能力是知道该做什么事情。

———

为什么这件事不是大公司先做的

这也是一个有意思的角度。

为什么是一个成立没几年的公司在做这件事，而不是苹果、微软、Google？

因为巨头被自己的成功绑住了。

苹果的利润来自硬件和生态，它不会革自己操作系统的命。微软靠 Office 和 Azure 赚钱，它需要人们继续用 Word 和 Excel。Google 的收入来自广告，它需要人们继续用浏览器搜索。

每个巨头都在往旧系统里塞 AI，但没有人敢重新设计系统本身。

因为重新设计意味着否定现有产品。否定现有产品意味着动摇收入根基。

这就是创新者的窘境，很好理解，看看 Siri 多难用就知道了。

———

最后

我不知道未来到底会怎样。这篇文章里的判断，可能有些对了，有些错了，也可能全错了。

但有几个直觉我很确定：

操作系统会被重新定义。两年之内，"操作系统"的核心会从"提供图形界面"变成"理解用户意图、自主完成任务"。

App 的边界会消融。人面对的不再是一个个独立软件，而是一个统一的、理解你的智能层。

人机关系会翻转。从"人学习怎么用电脑"变成"电脑学习怎么懂人"。这个翻转一旦完成，不可逆。

四十年前，"Personal Computer"的意思是"一台属于你的电脑"。

现在这个意思正在获得一个新的含义：一台理解你的电脑。

属于你，和理解你，是两件完全不同的事。

我们正从一个时代跨入另一个时代，至于那个时代具体长什么样，得走过去才知道。

来源
作者：左子祯
发布时间：2026年3月12日 14:11
来源：原帖链接

左子祯｜我们跟电脑的关系，可能从第一天起就是反的

ByMichael Sun

导读

重点

备注

编辑评论

你每天花多少时间在"翻译"？

所以最近这波 OpenClaw 热潮，到底在兴奋什么？

一个"没有马的马车"式的荒诞

"指令"和"目标"：一词之差，两个物种

App 这个概念正在死亡

AI 会逼你直面那个真实的问题

为什么这件事不是大公司先做的

最后

By Michael Sun

Related Post

Leave a Reply Cancel reply

You missed