AI编码工具双雄也开始商业互捧了?Cursor × Claude 最新对谈:两年后,几乎100%代码都将由AI生成!
发布时间:2025-06-15 10:49 浏览量:1
编译 | 宇琪、冬梅
Cursor 推出不到两年,就实现了大多数 SaaS 公司需要十年才能实现的目标:年经常性收入 1 亿美元。
更可怕的数字是,据美国一家纸媒报道,Cursor 每日编写 10 亿行代码。
在硅谷层出不穷的创业故事中,Cursor 的起源看起来像是一个标准模板——四位麻省理工的计算机天才,对“开发者生产力”有着近乎偏执的追求。他们的故事有着太多让人惊叹的地方:公司成立一年半,总融资达到 95 亿、 4 位创始人年龄均为 25 岁、公司在 4 个月内 ARR 从 1 亿增至 3 亿、整个公司不到 50 人、每天编写 10 亿行代码......
但这个故事的反转在于:他们拒绝成为又一个被风口吹起的泡沫。
2023 年 10 月,他们获得了由 OpenAI 领投的 800 万美元种子轮融资。这笔支持不仅仅是财务上的认可,更是与这家引领 AI 革命的公司达成的战略联盟。当其他初创公司追逐消费级应用或企业级工作流程时,Cursor 的创始人却将开发者视为 AI 工具的终极早期采用者。
他们的独特之处并非源于背景或资金,而是他们的严谨纪律。竞争对手们融资规模庞大,招聘力度也很大,而 Cursor 则刻意保持着小团队规模。这种限制迫使他们高效地构建产品,并专注于产品质量而非组织复杂性。
对于 Cursor 取得如今的成就,有 X 用户表示的确让人震惊。
“仅有 50 位工程师,每秒 100 万笔交易……每位工程师负责 2 万笔交易,太不可思议了!”
他们也的确一直在专心构建让开发者持续受益的编码工具,因此在开发者群体中 Cursor 的受欢迎程度非常高。
一位早期 Cursor 用户所说:
“最好的开发工具不仅能让你速度更快,还能让你以全新的视角思考一切可能性。其精湛的技术创造了一种近乎心灵感应的编码体验,这与传统的 IDE 或简单的 AI 助手有着根本的不同。”
还有用户表示,像 Cursor 这种代码生成工具早已成日常编程中的常态了,只是要谨慎使用它们。
难以置信代码生成这么快就成了新常态。现在审核 AI 生成的内容需要更多时间,但这确实让我免去了很多重复的工作。不过,还是要谨慎对待。
Cursor 的传奇不仅仅是又一个独角兽的故事。Cursor 几乎打破了之前所有软件公司增速纪录,甚至超过了 Wiz 和 Deel 等传奇的快速增长公司。这个由四位麻省理工学院好友开发的 AI 编码工具,是如何成为商业史上最快达到 1 亿美元 ARR 的公司?在由 Cursor 引领的智能编码浪潮中,软件开发的新形态是什么样的?AI 时代开发者核心价值又将迁移到何处?
当数百万开发者通过 Cursor 将编程效率提升 10 倍时,其团队正用更激进的方式重构开发范式——用 AI 工具开发 AI 工具,在自我迭代的闭环中突破语言模型的能力边界。
最近,Cursor 的联合创始人 Aman Sanger、机器学习工程师 Jacob Jackson、智能系统工程师 Lukas Möller 与 Anthropic Claude Relations 负责人 Alex Albert 坐在一起,探讨了 Cursor 成功背后的原因、如何进行自我迭代、后台 Agent 功能开发进展、下一个编程瓶颈以及 Claude 4 等话题。基于该播客视频,InfoQ 进行了部分增删。
核心观点如下:
新模型能力的持续演进提供了调试和探索的空间,进而反哺产品迭代并催生新功能。
优秀代码的核心原则对人类与模型实则相通:避免重复、保持简洁。
AI 将参与几乎所有代码编写,但开发者理解需求、把握品味、指导软件方向的核心作用将比以往更关键。
如何用 Cursor 构建 Cursor
Alex:对关注 AI 行业的人来说,显而易见,今年是 Cursor 意义重大的一年。你们在短短一年多的时间里,收入已突破 3 亿美元,这令人惊叹。如今,数百万开发者都在使用 Cursor。今天的 Cursor 版本与一年前有何不同?
Aman:我认为有几个显著的变化。一直以来,鉴于当前语言模型的水平,人们对其实际应用潜力存在很高的预期,但实际应用效果与预期之间存在一定的差距。我认为 Cursor 至少在编程领域,是最早能够通过多元化功能在一定程度上弥合这一差距的公司之一。与此同时,你也看到这些模型在编程能力上取得了巨大进步,我认为 Claude 3.5 Sonnet 是这方面第一个显著的范例,标志着编程能力质的飞跃。
在此之前,Cursor 在诸如制表符补全、预测下一个编辑等方面确实非常实用,仅此一项功能就带来了相当快速的增长,同时它也擅长在单个文件内进行编辑。但我们发现,当你将像 Claude 3.5 Sonnet 这样智能的模型与我们用于检索的其他几个自定义模型相结合,并应用这个更强大模型生成的修改建议时,就具备了进行跨文件编辑的能力。我认为正是这种跃阶函数,促成了 Cursor 的大规模普及。此后,一方面模型本身持续改进,另一方面我们也在底层不断优化,致力于探索这些模型能力的边界。
Alex:这种能力的演进是自然形成的,还是当 Claude 3.5 Sonnet 首次发布时,你们突然意识到“天啊,现在我们可以实现许多以前不可能的功能了”?当时的场景是怎样的?
Aman:这一过程是循序渐进的。模型质量提升是阶段性的,但在此前的顶尖模型中已有征兆。事实上,我们曾因模型测试方法不足而饱受质疑——内部使用方式与产品发布后用户的实际应用场景差异显著。然而,我们确实观察到每个新模型在推理能力和代理式编程方面的持续进步。随后需要大量调试与实验:验证有效方案,分析失败原因。我认为 Claude 3.5 Sonnet 是首个真正实现高效跨文件交互的模型。此后又经历了多次能力跃升,例如工具使用功能,使模型能在编辑器中真正发挥智能代理的作用。
Alex:新模型能力的持续演进为你们提供了调试和探索的空间,进而反哺产品迭代并催生新功能。
Aman:是的,的确是这样的。
Alex:这就引出了我的下一个问题:我听说过很多关于你们团队如何用 Cursor 构建 Cursor 的事迹。它就像一个自我反馈的递归循环。能否具体阐述这种开发模式在日常工作中的运作方式?例如在开发新功能时如何实践?
Lukas:这很大程度上取决于每个人的具体职能和所负责的产品模块及其发展阶段。如果是在初始构建代码库或新功能时,Agent 功能能有效启动项目;当面临具体技术难题时,思维模型(Thinking Models)可以帮助你查看你所面临的单个框,然后进行非常精确的编辑。在最初使用代码库时,人们可能对此不太了解,需要大量使用 QA 功能和搜索工具——Claude 3.5/3.7 在代码库研究及厘清模块交互关系方面表现卓越。
Alex:意思是利用这些功能探索代码库能提升效率,同时在使用过程中发现功能缺陷并推动优化?
Lukas:确实如此。Cursor 的发展核心在于解决自身痛点:我们在使用中识别开发瓶颈,进而优化产品。团队秉持“全员可自由尝试”的理念,鼓励直接为产品添加新功能,通过内部使用收集反馈并持续迭代。
Alex:**您是否认为,或许在更本质的层面上,当企业自身成为其产品的最佳内部用户时,会形成一种独特优势?**
Aman:100% 是这样的。我认为这就是我们能快速构建新功能,并丢弃明显不起作用的功能的原因。因为我们可以诚实地对待自己,判断某些功能是否有用,无需先向用户发布并追踪使用数据,这显著缩短了功能迭代周期。
那说回到我们如何使用 AI 编程这个问题时,其实公司内部每个人使用 AI 的方式都不同,因为每个人的工作性质也是不同的。部分员工在熟悉的代码库区域工作时,他们的脑子里已经有了想法,直接编写代码并利用 Tab 功能加速,使传达效率更高。但在陌生代码领域或需编写大量代码时,则可借助模型分担编码及部分逻辑推理工作。如 Lukas 所述,当接触全新代码库时,这些模型能带来质的飞跃。随着模型与 Cursor 协同优化,开发者对代码库的掌控力将持续增强。
Alex:因此,功能适用性存在差异,某种程度上就想一个频谱?
Aman:正是如此。就像这个频谱的一端是“Tab”,适用于完全掌控编码场景;中间是“Command K”,用于编辑特定代码段或单文件;另一端是“Agent”,擅长编辑多个文件;最末端则是我们正在研发的“后台 Agent”,可完成完整拉取请求(PR,Pull Request)级别的任务。
下一个编程瓶颈是什么?
Alex:你们刚发布了后台 Agent 的预览版,其具体功能是什么?
Aman:当前模型端到端任务能力虽持续提升,但尚未完全成熟。加速开发的关键在于并行化处理——后台 Agent 允许任务在后台运行。若完成度达 90%,开发者可快速接管并利用 Cursor 功能完善剩余部分,实现后台与前台的无缝切换。该功能尚处早期阶段,未来或可支持同时处理多项变更并自由调度前后台任务,这将深刻改变软件开发和 Cursor 的使用方式。
Lukas:我们将后台 Agent 视为可广泛应用的基础能力。当前实现形式简洁:输入指令即可推送至后台独立运行。未来可拓展更多集成方式,具有广阔的产品化空间。
Alex:这是否意味着将代码库置于虚拟机中?具体如何实现环境迁移?
Lukas:正是。我们构建了足够小的独立环境,预装完整的开发工具链及所有 VS Code 扩展,使 Agent 能够充分利用这些资源执行任务。
Alex:当前异步任务与后台处理已成为编码乃至研究领域的趋势,如何看待未来可能出现的数千 Agent 协同解决复杂问题的情况?
Aman:下一瓶颈将是软件验证、代码验证。模型越来越擅长生成大量代码,假设开发者 30% 时间用于编码,70% 用于审查,或者情况反过来用 70% 的时间审查代码,30% 的时间编写代码,即使彻底解决编码问题,软件开发效率提升仍不超过三倍。因此亟需优化代码审查流程,确保 Agent 修改不仅符合规范(规范本身可能存在模糊性),更需精准匹配开发者预期。这是我们重点关注的领域。
Alex:关于验证机制是否有初步构想?
Aman:**公司内部已有若干方案 **。我们的 CEO Michael 尤为推崇代码库的抽象化表达——例如以伪代码形式呈现变更,并确保其与真实代码的映射关系可验证,这将大幅压缩验证时间。但该方案面临挑战:氛围编程(Vibe coding)的验证依赖于实时交互测试,这在拥有数百万行代码的生产环境中极难实现。
Alex:小型原型项目与大型生产代码库的核心差异是什么?当前模型处理这两类环境的能力处于何种阶段?
Jacob:后台 Agent 设计时已深入考虑此问题。以修复失败测试为例:模型需能运行测试。小型仓库操作简单,但企业级代码库的依赖配置极为复杂。我们聚焦于两方面,首先简化开发者创建可运行测试环境的流程;其次,建立可重复的快照机制以适配代码状态变更。通过后台虚拟机支持 Agent 进行多轮实验,开发者仅需关注成功案例。这要求底层基础设施与用户体验的深度优化。
Aman:此外还存在其他根本性挑战。一种思路是让模型通过测试验证来确保正确性。但在大型代码库中,开发者常需处理类领域特定语言(DSL)的复杂结构,其逻辑可能分散于数百万文件(潜在达数亿词元量级)。我们已通过训练检索模型及整合多源上下文(如开发者近期编辑轨迹、团队成员代码变更动态)显著改善此问题。但核心难题在于:仅靠优质检索能力,仍不足以让模型真正理解庞大代码库,这是我们致力解决的关键问题。
Alex:或许需结合记忆机制与长上下文处理?
Aman:记忆机制确能提升模型对用户行为的适应性,但其性能增益有限。相较于处理大型代码库所需的高级能力,现有方案仍显初级。
Lukas:大型代码库不仅要求通过测试,更需遵循正确范式——需契合现有代码结构、符合规范指南。我们正通过 Cursor 规则引擎与多维度上下文整合,竭力实现这一目标。
Aman:例如:编写全新防抖函数(Debounce)可通过测试,但正确做法应是复用代码库中既有的三四种实现。选择依据可能仅存于同事间的 Slack 对话记录,此类问题在超大型代码库中极难解决。
Alex:非代码形式的决策依据对开发有什么影响?
Aman:这在当前并非核心瓶颈,但若模型能完美掌握代码库,虽可获 5-10 倍效率提升,却难突破上限,因为最终制约因素在于模型能否理解那些从未在 PR 或代码中明示的隐性知识。
Lukas:还需融合销售等业务端的非技术因素考量。
Alex:未来 Cursor 需要集成更多外部系统吗?
Aman:该目标距离关键突破尚有距离。当前重点仍是深化用户交互数据,如代码细节、提交记录的利用,以持续优化 Cursor。
代码品质取决于天赋和实践
Alex:当前网页设计已出现针对 LLM(大语言模型)阅读的优化趋势。代码编写会否因需适配人类评审与 AI 协作者而发生范式转变?
Lukas:是的,此趋势已然显现。API 设计正积极调整以适配模型,例如显性标识软件版本变更。代码结构亦趋向扁平化,如将 N 层交互简化为两层,以提升模型处理效率。
Jacob:优秀代码的核心原则对人类与模型实则相通:避免重复、保持简洁。随着模型能力提升,代码量激增将使得代码品味(Taste),即构建优雅简洁方案的能力,愈发重要。
Alex:代码品味部分源于天赋,但更多通过实践积累,可以通过观察成败案例逐渐形成。当 AI 承担更多编码工作时,存在质疑声:是否会导致程序员惰性?或剥夺新人接触大型代码库的成长机会?如何看待自动化辅助与核心工程技能培养间的平衡?
Jacob:这些工具本身具有教育价值。开发者可随时通过指令向 Claude 询问概念原理,这极大提升了学习效率。虽然工具可能催生更多质量参差不齐的代码,但总体仍是推动行业标准提升的强力工具。
Lukas:代码质量源于快速迭代与试错。模型极大加速此过程,使开发者更快掌握有效方案。长期看,这反而是新人接触大型项目、积累经验的催化剂。
Aman:未来工程师仍需深入技术细节。有趣的是,可能出现新型软件工程师——他们无需掌握底层技术,却能通过更高阶思维(如用户体验设计)有效工作。例如构建 Notion 类产品时,核心能力在于精准描述交互逻辑,这本身就是编程思维的延伸。
Alex:Claude Opus 4 与 Sonnet 4 已发布,如何评价新模型?Cursor 的集成计划是什么?
Aman:我们对新模型的表现非常满意。Sonnet 4 的测试结果令人惊喜——尽管 3.5 版本已是优秀的代理编码(Agentic coding)模型,但其存在已知缺陷,如过度修改测试用例以强行通过验证。Sonnet 4 有效修复了这些问题,智能水平实现显著跃升。其表现可与某些智能层级更高但代理编码能力稍弱的模型(如 GPT-4-o)相抗衡,而成本却大幅降低。因此我们对 Opus 充满期待,它将成为极佳的后台智能体解决方案。
Alex:这正是我们重点优化的“奖励黑客(Reward hacking)”问题,指的是模型为达目标走捷径的情况,新版已减少 80% 此类行为。Sonnet 3.5 的成功源于首次专注长周期编码能力训练——跨文件编辑、工具调用等复杂场景的协调能力为后续模型奠定基础。
Aman:我很好奇 Sonnet 3.5 是如何诞生的?它堪称 Anthropic 首个真正强大的编码模型。
Alex:Sonnet 3.5 诞生源于系统性训练。自公司创立之初,我们就深知提升模型编码能力的重要性——这对模型整体发展尤为关键。Claude 3 Opus 在其时代已是优秀的编码模型,但 Sonnet 3.5 标志着我们首次集中投入:不仅优化基础编码能力,更专注解决长周期编码任务——例如跨文件编辑、指令执行、工具调用与分布式修改等复合场景。该模型成功整合这些能力,为后续模型奠定了技术范式。
Aman:在 Sonnet 与 Opus 的发展规划中,编码能力与其他领域能力如何权衡?
Alex:编码虽是我们的核心领域之一,但非唯一重点。模型在编码领域的卓越能力可显著迁移至复杂决策推理与智能代理(Agentic)模式——这种能力泛化对混合编码、知识检索及研究类应用尤为重要。我们持续突破模型能力边界,同时在安全性与用户意图对齐方面严格把关。具体探索方向包括:去年十月展示的计算机视觉功能,使模型能像人类一样通过图像界面直接操作系统,而无需 API 或工具调用。以及由 Amanda Askell 主导的“Claude 人格(Claude’s character)”项目,深入思考 AI 作为人类生活中重要伙伴的角色定位——不仅是编码助手,更是可深度对话的知心伙伴。这些理念深度融入模型训练与产品决策。
Aman:Anthropic 如何看待软件工程与研究的未来走向?这些模型将在多大程度上增强、替代或承担相关工作?
Alex:个人认为模型不会取代开发者,正如前述,它们承担基础编码工作后,反而释放了更多可能性。以自身经历为例:虽拥有计算机科学背景,但如今模型在封闭环境(如 LeetCode 问题)的编码能力已超越我。然而,我的创造力却达到前所未有的高度——能快速构建原型、演示概念。这种赋能感远胜于能力剥夺,过往的工程经验使我更能驾驭模型,将其潜力发挥至更高水平。
基于此,延伸一个前瞻性探讨:2027 年 1 月 1 日(距现在约两年),你认为 AI 生成代码的比例将达多少?届时开发者的日常工作形态将如何演变?
Jacob:这如同在 1995 年询问“未来法律文书由 Word 生成的比例”——答案将是近 100%。AI 将参与几乎所有代码编写,但开发者理解需求、把握品味、指导软件方向的核心作用将比以往更关键。
Aman:在 Cursor 用户中该比例已超 90%(因广泛使用 Agent、Command K 等高阶功能)。即便是手动编码场景,Tab 功能也完成了约 70% 的内容,软件生产的每个环节都将被 AI 重塑。
Alex:是否可能实现"软件按需生成"的终极形态?
Jacob:我们将见证非技术岗位人员(如销售)自主构建工具(如定制看板)。但看板应展示哪些指标仍需人类决策——品味的重要性在此凸显。软件创造将更普及,其瓶颈在于能否发掘未被满足的独特需求。
Alex:例如:Anthropic 传播团队的同事曾直接提交 Claude.ai 的生产环境缺陷修复 PR。他运用基于 Claude 的编程工具,凭借产品直觉与品味完成了专业开发。这昭示着未来:具备洞察力者将突破传统角色限制。尽管五到十年后职能形态将剧变,但人类能力边界持续扩展终将创造积极价值。
Aman:另一种可能是软件自适应进化:用户使用应用时,系统根据交互体验实时调整功能而无需主动编码。全球用户虽未必都想亲手编程,但个性化软件服务的潜在受益者将是全人类。
Alex:才华横溢的工程师若在加入大厂与创业公司(如 Cursor/Anthropic)间抉择,有何建议?
Aman:当前创业公司展现出了显著吸引力。像 Anthropic 和 Cursor 这样的团队正汇聚顶尖人才,这种趋势反映出大厂对顶尖人才的吸引力正在减弱——尽管大公司依然拥有优秀人才,但人才密度往往偏低。而在创业环境中,精悍的团队规模天然形成高密度人才网络,与卓越同行并肩作战本身就是独特体验。更重要的是,你能在十人至百人量级的团队中深度参与改写行业规则的产品建设,无论是构建颠覆性工具还是重塑软件开发范式的模型,这种以微小团队撬动巨大影响力的机会,其价值不言而喻。
参考链接:
https://www.youtube.com/watch?v=BGgsoIgbT_Y
今日好文推荐
被骂“在乱讲”的专家,这次可能说对了:传统数据仓库正在被 Agentic AI 吞噬
对 Agentic AI 的支撑,快成这家大厂的OKR了
游戏教父 John Carmack:LLM 不是游戏的未来
12年首次大改!真有人喜欢苹果的“液态玻璃”吗?至少Flutter 开发者的噩梦开始了