日期:2025年11月17日
阅读时间:5分钟
Y Combinator是一家创业加速器,自2005年以来已经孵化了超过5000家公司,这些公司的总估值超过8000亿美元,包括Airbnb、Stripe和DoorDash等知名企业。
如今,像Claude Code这样的agent编码工具正在从根本上改变YC初创公司构建和扩展的方式。创始人现在可以直接从终端发布产品,将开发周期从几周压缩到几小时,甚至让非技术创始人从第一天起就能与成熟企业竞争。
我们采访了三家展示这一变革实践的YC初创公司:
HumanLayer(F24)使用Claude Code构建了他们的整个平台,并开创了上下文工程实践
Ambral(W25)正在使用Claude Code和Claude Agents SDK构建的复杂sub-agent驱动工作流来扩展AI驱动的客户管理
Vulcan Technologies(S25)正在使用Claude Code为政府和行业解决监管复杂性
让我们深入了解。
HumanLayer:从SQL agents到扩展AI优先的工程团队
一个给 agent 开发者 用的 Human-in-the-Loop 平台 + Coding Agent 工具链
Dexter Horthy在构建自主AI agents来管理SQL仓库时,注意到agent采用面临一个根本性(但可以理解的)挑战:公司不愿意让AI应用在无人监督的情况下访问敏感操作,比如删除数据库表。
改变一切的转型
这一认识成为HumanLayer的核心洞察:通常,任何软件中最有用的功能也是风险最高的,特别是对于非确定性的LLM驱动系统。
"我们的MVP是一个在Slack中与人类协调的agent,可以进行基本的清理工作,比如删除90多天未被查询的任何表格,"Horthy解释说。"我们不愿意让AI应用在无人监督的情况下运行原始SQL,所以我们加入了一些基本的人工审批步骤。"
2024年8月,Horthy构建了一个MVP,向旧金山的各个初创公司演示,并获得了他的第一批付费客户。这一进展使HumanLayer进入了YC F24批次,团队全力以赴提供API和SDK,让AI agents可以通过Slack、电子邮件、短信和其他渠道联系人类获取反馈、输入和批准。
通过2025年第一季度的广泛客户发现,HumanLayer团队与数十个构建AI agents的工程团队交流,意识到他们在agent开发循环中存在一个未曾预料到的差距。
"每个团队都有自己的agent架构,"Horthy解释说。"我们意识到我们不能只是构建一个更好的API——我们需要帮助建立让生态系统成熟的模式和原则。"
这促使Horthy在""12-Factor Agents: Patterns of reliable LLM applications""中记录了他们的学习成果。该指南于2025年4月发布,迅速走红,综合了他们构建生产agent系统的经验,并突出了新兴上下文工程学科的最佳实践。
使用Claude Code构建一切
有了这些学习成果,HumanLayer团队开始探索替代产品理念和转型角度。
当Anthropic推出Claude Code时,Horthy和他的团队已经是Claude模型编码的强烈支持者。他们立即开始使用它来构建这些实验。
"我们只是用Claude Code编写所有内容,"Horthy说。"当Claude Agent SDK与Opus 4和Sonnet 4一起推出,支持无头agent执行时,我们知道这将是大事。"
在内部完善Claude Code工作流程几个月后,Horthy开始与亲密的创始人朋友分享它们。
"告诉我需要全力投入的时刻是与BoundaryML(YC W23)的Vaibhav进行的全天配对编程会议,"Horthy回忆说。"Vaibhav起初持怀疑态度,但在我们花了7个小时完成了通常需要1-2周的工作后,他被说服了。我意识到这个工作流程可以适用于其他团队和其他代码库。"
构建CodeLayer:扩展AI优先的工程
如今,HumanLayer的产品CodeLayer帮助团队使用worktree和远程云端workers并行运行多个Claude agent会话。他们发现了一个关键模式:一旦工程师掌握了Claude Code,他们的生产力提升如此之大,以至于真正的挑战变成了组织性的——如何在整个团队中扩展这些工作流程。
"当你团队中的多个人都在发布AI编写的代码时,你面临的是完全不同类型的问题,"Horthy解释说。"这是一个沟通、协作、工具和管理问题。你必须重新构建团队构建软件的一切方式。"
自2025年第四季度开始以来,HumanLayer已经与各种规模的工程团队关闭了几个大型试点项目,部署这些工具和工作流程,所有这些都是用Claude Code构建的。
Ambral:用subagents构建生产系统
一家B2B SaaS / Salestech,做 AI Account Management Team / Customer Mission Control。
核心价值:
把 客户信号(产品使用日志、邮件、会议记录、工单等)汇总成每个账户的 AI 模型画像;
自动识别哪个客户需要关注、为什么需要关注,是 扩容机会 还是 流失风险;
主动给 AM/CSM 提建议甚至直接代为执行下一步动作(跟进邮件、安排会议等),本质上是“AI 版 post-sale 团队”。
Jack Stettner和Sam Brickman创立Ambral来解决每个B2B创始人和CRO都熟悉的问题:随着公司扩展,推动早期增长的创始人级别的客户亲密关系变得不可能维持。
由Claude subagents驱动的客户管理
无论是在经历高速增长的早期公司还是在成熟的企业公司,客户经理通常同时管理50到100个账户。"你无法用1/50的注意力提供有效的客户管理体验,"Stettner解释说。曾经适合创始人头脑中的客户背景分散在系统、日志、Slack消息、会议记录和产品使用数据中。
Ambral将来自客户活动和交互的信号综合成每个账户的AI驱动模型。系统精确指出谁需要关注以及为什么,自主驱动或推荐扩展,同时捕捉不满的早期迹象以防止流失。
"我们试图为每个客户提供一对一客户经理的体验,"Stettner说。
作为这家年轻初创公司的CTO和唯一工程师,Stettner在开发方面大量依赖Claude Code,并使用Claude的Agent SDK为产品本身提供动力。技术架构反映了对如何从不同Claude模型中提取最大价值的复杂理解。
委托工作流:Opus负责思考,Sonnet负责构建,周围都是subagents
Stettner采用了一种精确的工作流程,结合subagents利用不同Claude模型的优势:
"我使用Opus 4.1进行研究规划。Sonnet 4.5在执行我在Markdown中创建的计划方面绝对killer,"Stettner解释说。
他的开发过程遵循三个不同阶段:
研究阶段(Opus 4.1):对功能实现所需的任何背景进行深入研究。"我认为最重要的是在规划之前做研究,"Stettner强调。"让Claude为你做研究,创建一个大的、长的研究文档。"他使用一系列subagents并行研究代码库的多个领域。
规划阶段(Opus 4.1):创建一个包含不同阶段的计划,说明如何实现功能。"我会让Opus创建一个包含阶段的计划,关于实际如何实现的具体阶段,然后我会修改那个计划。也许我会与Opus讨论某些细节的问题,或者我会手动更新这个markdown文件。"
实现阶段(Sonnet 4.5):系统地执行计划的每个阶段。"然后我会使用Sonnet 4.5去实现每个阶段。"
这种方法战胜了Stettner尝试的其他工作流程,并受到Humanlayer的Horthy正在做的一些工作的影响:"我尝试了每个编码工具,基本上实验了每个模型。我只是认为Anthropic的模型目前在工具使用方面是最好的,这转化为代码。"
构建强大的研究引擎
产品本身镜像了这种多agent方法。Stettner使用Claude Agent SDK构建了Ambral的核心研究引擎,每种数据类型都有专门的sub-agents。
"我花了很多时间使用Claude Agent SDK基本上构建了一个非常强大的研究引擎,可以在所有这些数据中运行,"Stettner解释说。"它基于Claude sub-agents,对于每种数据类型,我们都有一个专门的sub-agent,它是理解该数据的专家。"
无论用户与系统聊天还是Ambral为客户构建自动化,一切都由Claude Agent SDK和一系列sub-agents支持,这些sub-agents跨使用数据、Slack消息、会议记录和产品交互进行检索和推理。
架构灵感直接来自Stettner的开发经验:"我认为Claude Code subagents做得多么好以及帮助我进行开发,这启发了我基本上想要采用那些相同的sub-agents并在产品本身的研究引擎中使用它。"
Vulcan Technologies:赋能非技术创始人发布产品
一家Reg-Tech / LegalTech**,做 AI 法规起草与合规,自称 “AI legal cartography” 。
用 AI 把美国的 法律、法规、判例 做成一个巨大的“法律图谱 / 知识图”;
帮政府部门、监管机构、行业组织和大企业做新法规/规章的起草、对现有法规进行一致性和合规性检查、找到“法律条文 vs 实际执行”中的错配
对于Vulcan的CEO兼联合创始人Tanner Jones来说,Claude Code的影响远远超出了生产力——它构成了公司构建的民主化。在创立他们的初创公司时,Vulcan团队相信必须有一个能让政府为公民提供更好服务的产品。如果没有Claude Code,这一愿景将不可能实现,因为两位创始人都没有工程背景。
在没有专门工程师的情况下发布产品
Vulcan解决了一个已经积累了几个世纪的问题:监管条例复杂性。弗吉尼亚州众议院,世界上最古老的持续运作的民主机构,体现了这一挑战。400多年的监管积累创造了美国最细致和复杂的法规之一。
当Aleksander Mekhanik和Tanner Jones在2025年4月联合创立Vulcan时,两人都没有传统的工程背景。Mekhanik在大学学习ML和数学,而Jones的最后一次编程经历是高中的AP JavaScript课程,当时他们用纸和笔编写代码。然而,这对组合在5月1日为弗吉尼亚州州长办公室构建了他们第一个产品的原型——并且在竞标中击败了成熟的咨询公司。
"整个原型都是使用Claude制作的,"Jones解释说。"这是Claude Code之前的事情。它实际上是将脚本复制粘贴到web应用程序中,然后替换其中的实现方法。。"在构建原型后,他们聘请了他们的CTO Christopher Minge,他有在Google的Gemini和Waymo工作的经验。然后,当Claude Code在6月推出时,三人的速度又成倍增长。
Vulcan的AI驱动监管分析帮助将弗吉尼亚州新房的平均价格降低了24,000美元,通过识别冗余和重复的监管要求,每年为弗吉尼亚人节省超过十亿美元。弗吉尼亚州州长非常喜欢Vulcan的工作,以至于他签署了第51号行政命令,强制要求所有州机构使用"agentic AI监管审查"。
公司构建的民主化
对于Jones来说,Claude Code的影响超越了生产力指标。
"如果你理解语言并且理解批判性思维,你就能很好地使用Claude Code,"他说。"我实际上认为学过人文科学的人可能会有一些边际好处,因为我们与AI交流的媒介是语言。如果你对语言有很好的掌握,擅长构建组织良好的有序列表、嵌套项目符号和深思熟虑的过程,你的prompts可能会执行得更好。"
Jones赞扬Claude Code是Vulcan成功的重要组成部分:"在四个月内,三个创始人,只有一个真正是技术背景,我们获得了州和联邦政府合同,并从一些顶级VC那里筹集了1100万美元的种子轮。没有Anthropic令人难以置信的工具,这一切都不可能实现。"
拥有"真正技术"背景训练的Vulcan CTO Christopher Minge,在如何思考工程方面经历了自己的转变。
"感觉有点像我在Google有一个同事,我把所有的想法和任务都给他们,他们经常犯错,但我的角色是委托给几个Claude Code实例,并善于检查常见错误和有效沟通想法,"Minge解释说。
YC创始人的最佳实践
这三家初创公司已经开发了最大化Claude Code影响的经过实战考验的方法,包括:
1. 将研究、规划和实现分离到不同的会话中
"不要让Claude在试图规划的时候进行研究,在试图实现的时候进行规划,"Stettner建议。"使用不同的prompts,并将它们变成不同的步骤。"
这种模式防止了上下文污染,允许每个阶段专注于其核心目标。为每个主要阶段启动一个新的Claude Code会话,只向前传递提炼的结论,而不是拖拽整个上下文历史。
2. 审慎地进行上下文管理
Stettner对其他创始人的建议集中在审慎的上下文管理上:
"上下文至关重要。当我看到意外或低质量的输出时,通常是因为我在某个prompt中有矛盾,"他解释说。"在向系统prompt中放入什么信息或选择何时开始新对话方面要非常审慎,因为你不想混淆你的上下文。如果你的prompt中有任何矛盾,你将收到更低质量的输出。"
3. 监控并中断思维链
"试着审视思维链并观察它在做什么,"Jones建议。"把手指放在扳机上,随时准备逃脱并中断任何不良行为。"
这在运行多个实例时变得尤其重要。在早期——前几次工具调用内——捕捉错误方向比让Claude Code完成整个错误方法节省更多时间。
新构建者优势
这三家初创公司展示了使用像Claude Code这样的工具构建公司的根本转变。HumanLayer在转型和扩展的同时,制定了现在在YC生态系统中使用的上下文工程实践。Ambral正在用精简的创始团队大规模解决客户成功问题。Vulcan作为非工程师赢得了政府合同。
构建软件的传统障碍——技术专长、团队规模、开发时间——正在让位于新的竞争优势:清晰思考、结构化问题分解以及与AI有效协作的能力。
准备用Claude Code构建吗?
《如何用Claude Code构建公司:三家YC初创公司的案例研究》 是转载文章,点击查看原文。
