Linguista

Andrej Karpathy 的 Claude 编程经验分享

Andrej Karpathy @karpathy 2026-01-26

最近几周使用 Claude 进行了大量编程,一些随机感想。

编程工作流。鉴于 LLM 编码能力的最新提升,和许多人一样,我迅速从 11 月约 80% 手动+自动补全编码和 20% 使用 Agent,转变为 12 月的 80% Agent 编程和 20% 编辑+修修补补。也就是说,我现在真的主要是用英语编程,有点不好意思地用文字告诉 LLM 该写什么代码……这对自尊心有点伤害,但通过大型"代码操作"来操作软件的能力实在太有用了,特别是当你适应它、配置它、学会使用它,并理解它能做什么和不能做什么之后。这无疑是我大约 20 年编程经历中基本工作流程的最大变化,而且这一切发生在几周之内。我预计类似的转变正在相当大比例的工程师中发生(两位数百分比),而普通大众对此的感知似乎还只有个位数百分比。

IDE/Agent 群体/易错性。在我看来,无论是"不再需要 IDE"的炒作还是"Agent 群体"的炒作,目前都太过火了。模型确实还会犯错,如果你有任何真正关心的代码,我会像鹰一样盯着它们,在旁边的大型 IDE 中进行监督。错误的类型已经发生了很多变化——它们不再是简单的语法错误,而是那些稍微粗心、匆忙的初级开发者可能犯的微妙概念性错误。最常见的类别是模型会替你做出错误的假设,然后不加检查地继续运行。它们也不管理自己的困惑,不寻求澄清,不揭示不一致之处,不呈现权衡取舍,在该反驳时不反驳,而且仍然有点过于唯唯诺诺。在计划模式下情况会好一些,但仍然需要一种轻量级的内联计划模式。它们还真的很喜欢把代码和 API 过度复杂化,膨胀抽象概念,事后不清理死代码等等。它们会用 1000 行代码实现一个低效、臃肿、脆弱的构造,然后你需要说"嗯,你就不能直接这样做吗?"它们会说"当然!"然后立即将其缩减到 100 行。它们有时仍然会作为副作用更改/删除它们不喜欢或没有充分理解的注释和代码,即使这些与当前任务正交。尽管通过 CLAUDE.md 中的指令做了一些简单的修复尝试,所有这些问题仍然存在。尽管有这些问题,它仍然是一个巨大的净改进,很难想象回到手动编码。长话短说,每个人都有自己的开发流程,我目前是在左侧的 ghostty 窗口/标签中开几个 CC 会话,右侧放一个 IDE 用于查看代码+手动编辑。

毅力。看着 Agent 不知疲倦地工作真是太有趣了。它们从不疲倦,从不气馁,只是继续前进和尝试,而一个人早就放弃了改日再战。看着它为某事挣扎很长时间,然后在 30 分钟后成功脱困,这真是一个"感受 AGI"的时刻。你意识到耐力是工作的核心瓶颈,而有了 LLM,这一瓶颈已被大幅提高。

加速。目前还不清楚如何衡量 LLM 辅助的"加速"效果。当然,对于我本来要做的事情,我感觉净速度快了很多,但主要效应是我做的事情比原计划多得多,因为 1) 我可以编写各种以前不值得编写的东西 2) 我可以处理以前因知识/技能问题而无法处理的代码。所以当然是加速,但可能更多是扩展。

杠杆作用。LLM 在循环直到满足特定目标方面异常出色,这也是大多数"感受 AGI"魔力的所在。不要告诉它做什么,给它成功标准,然后看着它运行。让它先编写测试,然后通过测试。把它与浏览器 MCP 一起放入循环中。首先编写非常可能正确的朴素算法,然后要求它在保持正确性的同时优化它。将你的方法从命令式改为声明式,以让 Agent 循环更长时间并获得杠杆作用。

乐趣。我没有预料到使用 Agent 编程会感觉有趣,因为大量填补空白的苦差事被消除了,剩下的就是创造性的部分。我也感觉较少被阻塞/卡住(这不有趣),并且我体验到更多的勇气,因为几乎总是有办法与它合作取得一些积极进展。我也看到其他人有相反的情绪;LLM 编程将根据那些主要喜欢编码的人和那些主要喜欢构建的人来分裂工程师群体。

萎缩。我已经注意到我正在慢慢开始萎缩我手动编写代码的能力。生成(写代码)和辨别(读代码)是大脑中不同的能力。主要由于编程中涉及的所有小而主要的语法细节,即使你 struggle with writing,你仍然可以很好地审查代码。

垃圾末日。我正在为 2026 年作为整个 GitHub、Substack、ArXiv、X/Instagram 以及通常所有数字媒体的垃圾末日之年做准备。我们还将在实际的真正改进的旁边,看到更多的 AI 炒作生产力剧场(这甚至可能吗?)。

问题。我心中的几个问题:

长话短说,我们处于什么位置?LLM Agent 能力(尤其是 Claude 和 Codex)在 2025 年 12 月左右跨越了某种连贯性阈值,并导致了软件工程和密切相关领域的相变。智能部分突然感觉远远领先于所有其他部分——集成(工具、知识)、新组织工作流程的必要性、流程、更普遍的传播。2026 年将是一个高能量年份,因为行业将消化新能力。


此文章由 AI 翻译