# Karpathy 与 Cherny 的 Agent 编程相变：从「我落后了」到 80% 交给 AI 的实践与批注

> **案例背景**：InfoQ 编译的 Karpathy、Claude Code 作者 Boris Cherny 等人关于 LLM agent 编程的实践与反思；2025 年 12 月前后 Claude/Codex 跨过「连贯性阈值」，引发工作流相变。本文按「案例文章整理与优化」Prompt 整理，并融入读者批注。

## 📋 案例概述

| 项目       | 内容                                                                              |
| -------- | ------------------------------------------------------------------------------- |
| **时间**   | 2025 年 11 月–12 月（几周内完成转变）                                                       |
| **主角**   | Andrej Karpathy、Boris Cherny（Claude Code 核心作者）及评论区工程负责人                         |
| **核心变化** | 从 80% 手写+自动补全 / 20% agent → 80% agent 编码 / 20% 人工改改、收尾润色                        |
| **关键判断** | Claude/Codex 在 2025 年 12 月左右跨过「连贯性阈值」，agent 编程从偶尔好用变为可稳定纳入工作流                   |
| **来源**   | [InfoQ 文章](https://www.infoq.cn/article/eUXjPQdv3XRVqWwdzJO9)，Karpathy X 长文与评论区 |

***

## 🎯 从焦虑到切换：一个月内的两种状态

### 一个月前：「我落后了」

Karpathy 在 X 上写道：「我从没像现在这样，作为一名程序员感到如此落后。」他认为职业正在被剧烈重构，个人贡献的代码行数在减少；若能把过去一年出现的工具串联用好，「能力可能会提升 10 倍」，没拿到这份增益则「明显就是技能问题」。

需要掌握的是**一层新的可编程抽象**：agent、子 agent、提示词、上下文、记忆、工具、MCP、LSP、工作流、IDE 集成等，还要在脑中建立心智模型，理解这些「随机、会出错、难以解释、不断变化」的实体的优势与陷阱。他比喻：像「一个强大的外星工具被直接发下来，却没有配套说明书」。

### 今天：「20 年最大变化」

同一人，几周后状态完全不同：**过去 20 年的编程习惯在短短几周内被打断**。11 月仍以手写+自动补全为主，12 月已变为约 80% 交给 agent、20% 人工修改润色；他称这是近二十年编程生涯里**对基础工作流影响最大的一次变化**。

***

## 1. 人机协作的沉没成本

> 一个不错的 case，让我想到人类与 AI 协作的更多可能性，有点类似搬东西：有了 AI 的辅助，人类可以不断研究怎么搬能提高效率。因为沉没成本没那么高了，人的思维反而不会固守成规。

**对应原文**：最近一次是在排查 Claude Code 的一个内存泄漏。Cherny 一开始走的是传统路径：连上 profiler、跑应用、暂停采样、再手动翻 heap 分配记录，一步步排查。但与此同时，他的一位同事处理同一个问题时，直接让 Claude 生成 heap dump，再让模型去读 dump，找出那些「本不该还被保留着」的对象。Claude 一次就命中问题点，顺手提了个 PR，把问题修掉了。「这种事几乎每周都会发生。」他写道。

***

## 2. It's hard to unlearn

> It's hard to unlearn. 这是一年前我朋友在学网球时分享的一句话，因为脑子里有经验，反而会被束缚住。不过这件事也需要辩证来看：一方面，经验束缚着我们，这无法反驳；可更加无法反驳的是，经验给了我们更多助力。切忌不可偏执一端，想到了司马老贼的话：「夫处世之道，亦即应变之术，岂可偏执一端。」

**对应原文**：Cherny 还补充了一个很有意思的观察——某种意义上，那些新入职的同事，甚至刚毕业的新人，反而更容易把模型用到位。因为他们不会被「模型做不到什么」的旧印象束缚，那些印象大多是早期模型时代形成的「历史记忆」。而对已经形成使用习惯的工程师来说，每隔一两个月，就得花不小的心理力气去重新校准：模型现在究竟能做到什么？而且这个边界还在持续外扩。

***

## 3. 编程工作流与生态

> 这段对目前 AI 工作流对工作的生态影响还挺客观的，肯定有一批人开始在慢慢吃螃蟹了，但更多的人仍是对此毫不知情。

**对应原文**（编程工作流）：随着最近一轮 LLM 编码能力的明显提升，和很多人一样，我的工作方式在很短时间内发生了变化：11 月大概还是 80% 手写+自动补全 / 20% agent；到 12 月就变成 80% agent 编码 / 20% 人工改改、收尾润色。也就是说，我现在基本是在用英语「编程」——有点不好意思地用自然语言告诉 LLM 该写什么代码。自尊心多少会疼一下，但能用大粒度的「代码动作」去操控软件这件事，净收益实在太大了。这是我近二十年编程生涯里，对基础工作流影响最大的一次变化，而且它是在短短几周内发生的。我猜现在已经有两位数百分比的工程师也在经历类似的转变；但在更广泛的人群中，对这件事的认知可能仍只有个位数低位百分比。

***

## 4. IDE / agent 群 / 出错风险

> 这一段描述了 AI 的局限性，但这并不影响人们拥抱它。我们并不需要一个银弹，而是一个可以落地的解决方案。

**对应原文**：在我看来，现在不管是「IDE 不再需要」的热炒，还是「agent swarm」的热炒，都有点过头。模型当然还会犯错——如果是你真正关心的代码，我会建议你像鹰一样盯着它们：旁边开一个足够大的 IDE，用来随时检查。而且错误的形态也变了：不再是简单的语法错，而是更隐蔽的概念性错误，有点像一个略显草率、匆忙的初级工程师会犯的那种。最常见的一类是：模型会替你做出一些错误假设，然后不核实就沿着假设一路跑下去。它们也不太会管理自己的困惑：不主动澄清、不揭示不一致、不提供权衡取舍、该反对时也不反对，而且还有点过度讨好。它们也很容易把代码和 API 过度复杂化；此外，它们偶尔会作为副作用去改/删一些自己不喜欢、或没完全理解的注释和代码——哪怕这些内容和当前任务是正交的。尽管有这些毛病，它依然带来巨大的净提升，而且很难想象再回到纯手工写代码的时代。TL;DR：每个人都有自己的新工作流；我现在的配置是：左边开少量几个 Claude Code 会话（Ghostty 的窗口/标签页里），右边开 IDE 负责看代码和手动改动。

***

## 5. 碎片内容与感受

> 以下是一些碎的内容，更像是一些感受吧。

**对应原文**（摘录）：

* **韧性**：看一个 agent 不知疲倦地死磕某件事真的很有意思。它们不会累，不会灰心，就是持续尝试——很多时候如果换成人，早就放弃、改天再战了。看它为一个问题挣扎很久，30 分钟后又突然赢了，那种「feel the AGI」的感觉很强。你会意识到：耐力本身就是工作的核心瓶颈之一，而 LLM 把这条上限显著抬高了。
* **加速**：LLM 辅助带来的「加速」其实不太好衡量。我当然感觉自己做原本要做的事更快了，但更大的变化是：我做了更多，原因主要是两点：1）我可以写很多以前根本不值得写的东西；2）我可以去碰以前因为知识/技能门槛而不敢碰的代码。所以这当然是 speedup，但可能更像是一种「扩张」。
* **杠杆**：LLM 特别擅长反复循环，直到达到明确目标——大部分「feel the AGI」的魔法就在这里。与其告诉它怎么做，不如给它成功标准，然后看它自己跑。把你的指令从 imperative 转成 declarative，会让 agent 循环更久，从而获得更大的杠杆。
* **乐趣**：我原本没预料到：用 agent 编程反而更有趣了，因为大量「填空式苦力活」被拿掉，剩下的更多是创造性部分。我也更少卡住（卡住真的不快乐），同时更有勇气——几乎总能找到一种方式与它并肩作战，推动事情向前。
* **退化**：我已经注意到，自己手写代码的能力正在慢慢退化。「生成代码」和「判别代码（阅读/审查）」在大脑里是两种不同能力。因为编程里有大量偏语法的细碎细节，即便你写起来费劲，审代码通常仍能审得很好。
* **Slopacolypse**：我已经在为 2026 做心理建设：那很可能是 GitHub、Substack、arXiv、X/Instagram，乃至整个数字媒体的「slopacolypse」（垃圾内容大爆发）之年。我们还会看到更多 AI 炒作式的生产力表演，与此同时，也会出现真实而确凿的改进。
* **一些问题**：「10X 工程师」会怎样？有了 LLM 之后，通才会越来越超过专才吗？未来的 LLM 编程体验会像什么？社会中有多少领域，本质上被数字化知识工作所瓶颈住了？
* **TL;DR：我们现在处在哪？** 到 2025 年 12 月左右，LLM agent 能力（尤其是 Claude 和 Codex）似乎跨过了某种连贯性阈值，并在软件工程及相关领域引发了一次「相变」。2026 将是高能量的一年：整个行业都在消化、吸收这股新能力。

***

## 📋 TL;DR：我们现在处在哪？

到 **2025 年 12 月左右**，LLM agent 能力（尤其是 Claude 和 Codex）似乎跨过了某种**连贯性阈值**，在软件工程及相关领域引发了一次「相变」。当下「智能」这部分突然明显领先于其他——工具与知识的集成、组织层面的新工作流与流程、以及更广泛的扩散机制仍滞后。

**2026 将是高能量的一年**：整个行业都在消化、吸收这股新能力。

***

## 📖 延伸阅读

* [InfoQ 原文](https://www.infoq.cn/article/eUXjPQdv3XRVqWwdzJO9)
* [Karpathy X 长文 1](https://x.com/karpathy/status/2004607146781278521)
* [Karpathy X 长文 2](https://x.com/karpathy/status/2015883857489522876)

***

**案例标签**：#Agent编程 #LLM工作流 #人机协作 #Karpathy #Claude #案例整理 #读者批注

**案例类型**：启示案例（成功经验 / 行业观察）\
**学习价值**：⭐⭐⭐⭐⭐\
**适用场景**：了解一线实践者对 agent 编程的认知转变、人机协作边界、经验与「unlearn」的辩证、以及 2025–2026 工作流相变的生态判断

> 💡 **使用提示**：批注已按原文对应段落融入对应小节，便于对照阅读与延伸思考。
