深度

Sam McCandlish:被低估的技术中枢——个人路径、思想取向与行业影响

AI
·
8 分钟读完

家庭背景

出生与成长:Sam McCandlish(全名Samuel Russel McCandlish)出生于1990年7月1日。他的家乡在美国宾夕法尼亚州匹兹堡。关于其家庭环境的公开资料不多,但从小他对科学表现出浓厚兴趣,尤其是物理学研究。就读大学期间,他曾在哈佛-史密森天体物理中心参与引力微透镜方面的暑期研究项目,展现了对基础科学探索的热情。

教育背景

本科与硕士:McCandlish于布兰迪斯大学(Brandeis University)完成本科教育,获物理学和数学双学士学位,并继续在该校取得物理学硕士学位。在此期间,他扎实的数理基础为日后从事人工智能研究打下了基础。

博士研究:此后,他进入斯坦福大学攻读理论物理学博士,研究方向涵盖高能物理理论领域,专攻量子引力和张量网络。2018年前后他从斯坦福获得博士学位(理论物理学博士),期间对复杂系统和基础理论的训练使他具有独特的跨学科视野。

职业经历

OpenAI 任职:完成博士学位后,McCandlish于2018年前后加入新兴的人工智能研究机构 OpenAI,担任技术工作人员,成为该机构技术团队的一员。他在OpenAI工作了大约三年,逐步晋升为研究负责人之一。在OpenAI期间,他领导了多个AI安全(AI Safety)项目,致力于减少大型模型潜在风险,并开创性地研究了「模型规模缩放规律」(Scaling Laws),这一研究后来成为训练更大规模模型的指导原则,对GPT-3等突破性模型的诞生产生了直接影响。此外,作为GPT-3研发团队的核心成员之一,他也是2020年GPT-3论文《语言模型是少样本学习者(Language Models are Few-Shot Learners)》的作者之一,为大规模生成式模型的能力提升做出了贡献。

创办Anthropic:2021年初,McCandlish与时任OpenAI副研究院长达里奥·阿莫代伊(Dario Amodei)等多位同事一同离开OpenAI,联合创立了人工智能创业公司 Anthropic。作为Anthropic的联合创始人,他最初出任首席技术官(CTO),主导公司的技术战略和研究方向。在Anthropic,他领导“大型语言模型组织”(Large Language Model Organization)部门,统筹模型训练、推理和核心计算资源等团队工作。他还被任命为公司的“负责扩展官”(Responsible Scaling Officer),负责制定和实施Anthropic的负责任规模化策略,平衡AI模型规模增长与安全控制。截至2025年10月,公司引入新的基础设施主管后,McCandlish卸任CTO转任首席架构师(Chief Architect)一职,继续专注于大模型的预训练和大规模训练工作。无论职位如何调整,他始终是Anthropic技术方向的核心制定者之一。

创业经历

Anthropic 的创立:McCandlish作为联合创始人参与了Anthropic的初创全过程。2021年,他与Dario Amodei及包括Daniela Amodei、Jack Clark、Jared Kaplan、Tom Brown、Chris Olah等在内的六位前OpenAI成员共同创办了Anthropic。创立Anthropic的动机源于他们在OpenAI内部对AI发展路线的不同理念:创始团队希望建立一家“更负责任”的AI公司,把安全可控放在首位。因此,Anthropic自诞生之初就以AI安全研究为宗旨,尝试在提高模型能力的同时确保模型行为符合安全规范。作为创业团队中的技术领袖,McCandlish在Anthropic早期负责组建研究团队、搭建计算基础设施,并制定公司技术路线图,使Anthropic迅速在大型模型领域站稳脚跟。

其他创业项目:目前暂无资料显示McCandlish参与了Anthropic以外的其他创业项目或创办新公司。其职业重心一直放在人工智能大型模型的研究与Anthropic的发展上。他的创业经历主要体现在Anthropic的创建和成长过程中。

旗下品牌与资产

Claude 系列模型:Anthropic的旗舰产品是大型语言模型Claude系列AI助手,它被视为OpenAI ChatGPT的有力竞品。Claude能够进行对话、问答和文本生成等任务,是Anthropic在商业化方面的核心品牌。在McCandlish的领导下,Anthropic非常重视Claude模型的安全性和可控性。例如,Claude采用了“宪法式AI (Constitutional AI)”的训练方法:预先制定一套原则来约束模型输出,以便让Claude在回答问题时遵循道德和安全准则,避免产生有害或歧视性的内容。这种创新的方法凸显了McCandlish对模型安全性的重视,也成为Claude品牌的重要卖点之一。

技术影响力:作为Anthropic的首席技术负责人,McCandlish对Claude以及相关技术方向有着重要影响力。他领导研发的Claude 2等模型在上下文长度、稳定性等方面取得突破,使Claude系列在企业应用中具有竞争力。此外,他推动的“负责任扩展”政策确保Anthropic在扩大模型规模和功能时同步加强安全措施,从而维护了Claude品牌在安全可靠方面的声誉。

股权与个人资产:身为联合创始人,McCandlish持有Anthropic相当比例的股份。随着Anthropic估值在近年迅速攀升——截至2025年9月,公司融资后估值已达1830亿美元——McCandlish的身家水涨船高。据《福布斯》报道的实时富豪榜数据显示,到2026年初他个人净资产已接近37亿美元。这反映了他所持有的Anthropic股权价值。目前他被视作人工智能领域的一位新兴富豪,其财富主要来源正是Anthropic的股权增值。

投资机构

早期融资:Anthropic在成立之初即获得了充足的风险投资支持。2021年公司完成了1.24亿美元的A轮融资(投资方包括初始支持该团队的风险投资者和AI安全倡导者)。2022年4月,Anthropic宣布完成5.8亿美元的B轮融资,该轮融资由加密货币交易所FTX的创始人山姆·班克曼-弗里德(Sam Bankman-Fried)领投。同时,FTX高管Caroline Ellison、Nishad Singh,硅谷投资人Jim McClave,“长期主义”支持者Skype联合创始人Jaan Tallinn,以及新兴风险研究中心(CERR)等也参与了此轮投资。这一时期的融资使Anthropic能够招募约40人的科研团队并建立大型算力基础设施。

战略投资者:在后续发展中,Anthropic吸引了多家科技巨头成为战略投资者。谷歌(Google)于2022年底通过其母公司Alphabet向Anthropic投资了3亿美元,获得约10%的股权。随后在2023年10月,谷歌追加5亿美元投资,并承诺在未来提供总计15亿美元的云资源支持,以深化合作。与此同时,亚马逊(Amazon)也在2023年宣布与Anthropic达成深度合作,计划投资最高40亿美元并将Anthropic作为AWS云服务的主要AI合作伙伴之一。根据协议,AWS成为Anthropic的首选云和训练平台,Anthropic则优化其模型在AWS上运行,并优先使用亚马逊提供的定制芯片进行模型训练。除了谷歌和亚马逊,Salesforce 等企业也在2023年前后对Anthropic进行了战略投资或合作。

近期融资与估值:2023年至2024年间,Anthropic融资步伐加快,累计募集资金超过70亿美元。据报道2024年底Anthropic正寻求新一轮融资,估值一度传闻高达400亿美元。2025年9月,Anthropic正式完成130亿美元的F轮融资,投后估值攀升至1830亿美元,领投方为硅谷著名投资机构ICONIQ,联合领投方包括富达投资、光速创投等知名机构。该轮还吸引了黑石、黑岩、老虎全球、淡马锡、谷歌等众多机构投资者参与。如此庞大的融资规模使Anthropic成为全球估值最高的AI创业公司之一,也体现了资本市场对其技术和商业前景的信心。

投资关联与处置:值得一提的是,早期领投Anthropic的FTX公司在2022年末爆发财务丑闻并破产清算,这使Anthropic的融资历史蒙上一层阴影。2024年3月,破产后的FTX清算团队宣布将所持有的Anthropic约2/3股份出售给包括阿布扎比主权财富基金在内的财团投资者,出售价格约为8.84亿美元。其中,阿布扎比政府的Third International投资公司出资5亿美元购入了最大一部分股份,其次还有华尔街公司Jane Street等购入部分股权。这笔交易使FTX从最初对Anthropic的5亿美元投资中获利退出,也帮助Anthropic摆脱了与FTX及其创始人法律纠纷的关联。目前Anthropic的股权结构以创始团队和大型机构投资者为主,谷歌和亚马逊等持有显著但少数的股权(例如亚马逊累积投资8亿美元后仍为小股东)。整体来看,Anthropic背后既有硅谷顶级风投基金,又有科技巨头的资金与资源支持,这为其长期独立发展提供了保障。

商业模式

Claude产品定位:在McCandlish的主导下,Anthropic将其核心技术转化为可商业化的AI产品,最重要的即是Claude系列对话模型。Claude被设计为“更安全、稳定的AI助手”,Anthropic有意将其与OpenAI的产品区分开来,强调Claude在可控性和可靠性上的优势,以吸引那些注重风险管控的企业客户。这种定位契合大型企业和机构的需求,使他们愿意将Claude应用于关键业务场景。例如Claude内置了对不良内容的防范措施(如宪法式AI原则),被视为在输出有害信息防范方面更加稳健。Anthropic通过这一差异化策略,成功将Claude塑造为企业可放心采用的AI解决方案。

服务与合作:Anthropic主要通过API云服务的形式将Claude提供给客户使用,其商业模式以B2B为主。公司与大型云服务商深度合作:在AWS的Bedrock平台上,Claude作为预置模型供企业随取随用;在谷歌云Vertex AI上,Claude也作为主要的对话AI模型供客户调用。这种合作让Claude迅速成为众多企业核心IT基础设施的一部分。例如,辉瑞制药通过AWS引入Claude加速新药研发,Intuit在税务软件中调用Claude解释复杂税法给数百万用户,欧盟议会使用Claude构建“Archibot”搜索系统处理海量文档。通过云平台,Claude获得了规模化分发渠道,同时企业客户的数据和模型托管在同一云环境下,满足数据安全与合规需求。这极大降低了企业集成AI的门槛,推动Claude成为各行业广泛应用的AI助手。

产品化路径:在产品策略上,Anthropic一方面为开发者提供友好的接口和工具,另一方面也开始直接面向个人用户推出服务。截至2025年,Anthropic已经开放了Claude API,开发者能够将Claude集成到自己的应用中,同时Anthropic推出了专注编程辅助的Claude Code版本(于2025年5月正式上线,仅三个月就达到5亿美元年化收入)。针对普通用户,公司亦提供Claude Pro和Claude Max订阅服务,提供更高的调用频率、更大的上下文窗口等增强功能。这些举措表明Anthropic正在探索从企业级市场向更广泛用户市场拓展。此外,公司根据不同行业需求开发定制解决方案(如客户支持、教育、金融服务等场景),以行业产品形式提供差异化的Claude模型版本。通过多层次的产品布局,Anthropic将其领先的模型技术转化为持续的商业收益。

盈利与增长:得益于清晰的商业模式和强大的产品需求,Anthropic的营收增长迅猛。Claude于2023年3月推出,仅两年内公司年化营收即突破十亿美元规模。到2025年8月,Anthropic年化营收已攀升至50亿美元量级,成为历史上增长最快的科技公司之一。据官方披露,截至2025年中,公司服务的企业客户已超过30万家,大型付费客户数量在一年内增长了近7倍。这种商业成功证明了Anthropic将尖端AI技术产品化的能力。McCandlish作为技术掌舵人,在确保技术先进性的同时注重满足市场需求,使得Claude系列产品获得了良好的口碑和市场占有率,为Anthropic建立起可持续的盈利模式。

杰出成果

模型缩放规律 (Scaling Laws):McCandlish最广为人知的学术贡献之一是关于AI模型性能的缩放规律研究。2020年,他与合作者Jared Kaplan等发表了里程碑式论文《Scaling Laws for Neural Language Models》。该研究系统揭示了语言模型的性能指标(如困惑度)如何随模型参数规模、训练数据量和计算量扩展而呈现出幂律关系。论文结论指出:在给定算力下,训练“适当大”的模型且不必跑满训练数据即可获得最佳性能,这一发现被称为“缩放定律”。这一成果对行业影响深远——它为研究者提供了指导规模化模型训练的定量法则,促使后来业界在规划更大模型(如GPT-3等)时有据可循。McCandlish作为论文共同第一作者之一做出了核心贡献。该论文自发布以来被引用数千次,成为AI规模化研究领域的基石文献之一。

GPT-3 与Few-Shot Learning:在OpenAI工作期间,McCandlish参与了GPT-3模型的研发,这是一款拥有1750亿参数的大型语言模型。2020年5月,他作为作者之一在知名期刊上发表了GPT-3论文《Language Models are Few-Shot Learners》。该论文展示了GPT-3在无需额外微调的情况下,通过提示就能在众多NLP任务上达到当时最先进水平。GPT-3的Few-Shot Learning能力震动业界,McCandlish在其中负责模型训练和性能分析方面的工作。GPT-3的成功证明了模型规模和性能提升的紧密关系,也为后来大模型的发展奠定了技术基础。

AI对齐与安全:在确保AI安全可靠方面,McCandlish也有突出贡献。加入Anthropic后,他与团队致力于让大型语言模型变得“有用且无害”。2022年,他共同发表了论文《Training a Helpful and Harmless Assistant with RLHF》,探讨如何利用人类反馈强化学习(RLHF)来训练AI助手,使其在提供有帮助回答的同时避免输出有害信息。该研究提出了一系列基于人类偏好的奖励机制,大幅提升了模型输出的安全性。这项工作是Anthropic “有益与无害”AI原则的早期技术基础,也是日后“宪法式AI”方法的前身探索。McCandlish对这些AI对齐(Alignment)研究的投入,体现出他在技术创新和伦理安全上的平衡追求。

技术影响与引用:McCandlish在短短数年间已成为AI研究领域的高影响力学者。截至2025年,他共发表论文40余篇,研究内容涉及机器学习、计算机科学以及物理学等交叉领域。他的工作在学术界和产业界均产生巨大反响:根据语义学者数据统计,他的论文被引用超过数千次,H指数达到17。尤其是“Scaling Laws”与GPT-3相关论文,被视为AI时代具有划时代意义的成果,被众多后续研究反复引用和验证。除了论文影响力,他在OpenAI和Anthropic参与研发的GPT-2、GPT-3、Claude等大型模型也直接推动了生成式AI技术的进步。可以说,McCandlish在AI模型能力提升和安全原则制定这两个关键方向上的贡献,使他成为该领域技术变革的重要推动者之一。

负面信息或争议

与FTX的融资争议:McCandlish本人并未卷入个人丑闻,但Anthropic早期的一笔投资存在争议。正如前文所述,2022年Anthropic从加密货币交易所FTX的创始人Sam Bankman-Fried处获得大额融资。然而2022年底FTX爆雷倒闭,Bankman-Fried被爆出大规模欺诈行为遭起诉。这使Anthropic间接陷入舆论质疑,一度引发外界对其早期资金来源的担忧。尽管Anthropic并非事件参与方,但在FTX丑闻影响下,公司形象受到牵连。为切断与FTX的不良关联,Anthropic于2024年通过股份转让的方式清除了FTX的持股影响。FTX持有的股权由其他投资者接盘后,Bankman-Fried不再对Anthropic有任何影响。这一事件提醒业界AI公司在融资选择上需谨慎考虑资金来源的信誉风险。

安全与加速的争议:作为Anthropic的技术领军人物,McCandlish及其团队高举AI安全旗帜,但也有人质疑他们在提升模型能力方面的激进行为。部分AI安全社区人士评论认为,Anthropic创始团队(包括McCandlish在内)一边宣称关注长期安全,一边积极推动更大更强模型的研发和发布,客观上起到了加速AI发展的效果,这与其宣扬的安全至上理念存在矛盾。在有效利他主义(EA)社区的讨论中,有人将Anthropic的这类做法称为“适度加速主义者”,认为他们打着安全的旗号实际上推动了前沿AI能力更快地到来。这种批评认为,Anthropic的工作可能缩短了AI达到危险级别的时间表,而目前尚未有足够有效的安全技术来控制如此强大的AI。不过支持者则强调,Anthropic正是因为意识到大型模型不可避免地出现,才选择掌握并研究它们以制定安全对策,其初衷仍是降低长期风险。对于这场争议,McCandlish本人很少公开回应,但Anthropic整体在公开场合重申了其“先能力、亦重安全”的双轨策略,即在推动AI能力提升的同时投入同等精力研究对策。

其他负面信息:截至目前,未有迹象表明McCandlish存在学术不端、职场不当行为等个人负面事件。他在业内口碑良好,主要以科研成果和专业贡献受到关注。在媒体报道中,他的形象是一位低调务实的研究者和技术领导者,并无个人争议。需要指出的是,Anthropic作为一家快速崛起的AI公司,其高企的估值和激进的发展也引来部分媒体的质疑,有评论认为AI领域存在一定泡沫和炒作。但这些质疑更多针对行业环境,而非直接针对McCandlish个人。综上,除了融资背景和战略路线的讨论外,Sam McCandlish本人并没有卷入公开的负面丑闻,其专业声誉目前依然积极正面。