怎么在电脑上翻墙
值此盖茨基金会成立25周年之际,比尔·盖茨郑重承诺,其个人与基金会的庞大财富将在未来20年内悉数捐出,预计总额逾2000亿美元,核心投向全球健康与教育这两大关乎生命价值的领域,目标是拯救数千万人的生命。他坦言此举并非出于不舍,而是希望在有生之年最大化这些资源的效用,并在已取得的巨大成功——如全球儿童年死亡数从逾千万降至五百万以下——的基础上再接再厉。盖茨认为,限时集中投入能确保基金会忠于使命、完成更多工作,之后则由新一代慈善家应对未来的挑战。
他直言,个人拥有如此巨额财富近乎“疯狂”,而将之用于最贫困和最需要帮助的人群,是他从父母那里继承的、以公平为导向的价值观使然。尽管对未来二十年的进展抱持极大乐观,盖茨亦深切关注当前全球健康资金的严峻挑战。他痛惜地指出,由于美国及部分欧洲国家削减了对疫苗、艾滋病药物等关键援助的投入,儿童死亡人数恐在未来五年不降反升,从每年近五百万增至超过六百万,这是“不应发生的,太可怕了”。
盖茨强调,尽管基金会倾力投入,但政府仍是全球健康事业的主导力量,其资金规模远超任何私人慈善。例如,美国政府的全球卫生拨款是盖茨基金会的四倍以上。他持续倡导发达国家政府仅需拨出预算的百分之一用于援助最贫困人口,这不仅能以极高效率拯救生命——其成本效益远超国内项目千倍,更能促进受援国稳定与发展,最终防止疫情蔓延,惠及全球。对于将慈善资源投向海外而非本国的质疑,他回应这笔“适度的资金”能带来巨大的战略与人道回报。
即将步入古稀之年的盖茨将此视为其职业生涯的“最后一章”,肩负着将包括沃伦·巴菲特慷慨捐赠在内的巨额财富用得其所的重任,并无意百年后的历史评价。他坚信,许多当前肆虐的疾病如肺结核、麻疹、疟疾等,都应在他有生之年被根除。展望未来,他对人工智能在教育和医疗领域的革新潜力充满期待,例如AI导师辅助教学、AI提供医疗建议等。同时,基金会正大力资助阿尔茨海默症、艾滋病毒治愈、营养不良改善以及新型疫苗(如贴片式疫苗)等前沿科研。驱动这一切的,是“我们应该帮助其他人”这一贯穿其工作的核心价值理念。
人工智能的最新进展,尤其是编码代理,正预示着未来工作方式的深刻变革,尽管这可能引发人们对自己或朋友工作岗位消失的忧虑。历史上,早期计算机程序员的工作与今日软件工程师已大相径庭,而新工具正赋予个人前所未有的自主超能力,使得当下成为创业启动想法的最佳时机。
将软件工程师比作高薪的“有机农民”,暗示一场类似“联合收割机”的技术革命即将来临,这虽让部分软件工程圈感到不安,但编码代理的出现及其可预见的快速进步(未来3至12个月内),无疑将对软件工程产生显著影响。这不仅关乎初创企业和科技界,长远看,也可能波及医生、律师、会计师等知识工作领域。我们实质上已发明了软件工程的自动化。
个人经验印证了这一点:使用无代码工具和AI编码工具(如Claude Code)在短时间内重建博客、迁移数十年数据,甚至构建了包含数万行代码、拥有交互式语音代理的复杂应用recipeninja.ai,全程几乎未手动编写代码,效率比十年前专业编码时提高了十倍。这种“凭感觉编码”模式,即使对久未编码的专业人士也赋予了巨大能量。当更多软件工程师、半技术人员乃至非技术人员掌握这些工具时,其影响将更为深远。
数据显示,YC创始人中采用AI编写大部分代码的比例在过去几个批次中从接近0%迅速增长到约三分之一至一半,表明这些工具正被积极采纳并持续改进。对于“AI不够好”的论点,历史经验(如“创新者的窘境”)表明,新技术往往从看似玩具开始,但其改进速度惊人,最终会超越现有市场领导者。AI编码工具正处在这样的轨迹上。
至于“杰文斯悖论”——成本降低将催生更大需求——尽管软件需求可能远超食物等有限需求,甚至趋向“按需定制软件”的未来,即AI为个体即时生成解决特定问题的代码,但满足这些新增需求的很可能不再是人类。如同联合收割机极大提高了粮食产量却大幅减少了农业人力,AI在软件领域的自动化程度可能更高。
结论是,今天的软件工程工作在5到10年后将不复存在。未来需要的是能驾驭AI编码机器的聪明人,工作性质已发生巨变,这可视作又一次抽象升级,人类将成为更高层次的代理。短期内,人类在“能动性”(决定解决什么问题)和“品味”(判断好坏)上仍有优势,特别是那种能专注于为用户创造卓越产品体验的个人愿景。
因此,对于潜在创始人而言,现在是历史上启动想法的最佳时机,AI工具赋予个人和小团队以少量资本构建巨大价值的能力。这一趋势也正向法律、医学、会计等传统行业渗透,人工智能正成为竞争的必备要素,不拥抱AI将面临淘汰。尽管知识工作成本降低将带来巨大的消费者剩余,但转型期可能伴随大规模失业和社会动荡。
对个人而言,关键在于紧跟最新工具发展,并擅长识别人类问题并着手解决。随着构建变得容易,理解人、发现问题和沟通能力将更为重要。短期内,AI工具将使软件团队更小、产品质量更高,因为单人或小团队能更好地掌控用户体验。总而言之,现在及未来五年,是借助AI从零开始构建事物的黄金时代,众多行业将被彻底改变,创业正当其时。
科技市场方面,人工智能的“token”被视为比关税更为根本的驱动力。微软报告的代币处理量激增,预示着AI算力需求的爆发,这缓解了部分因关税和AI泡沫担忧引发的市场悲观情绪。AI被视为美国例外主义的新起点,并促使管理层重新思考决策方式,谢尔盖·布林甚至认为管理者将是首批被AI取代的群体。这为风险投资在传统企业转型中发现新机遇打开了大门,成熟市场亦可能被AI彻底颠覆。
然而,谷歌正面临AI带来的严峻挑战。苹果高管埃迪·库透露其搜索量首次下滑,归因于ChatGPT等AI工具的兴起,导致谷歌市值一度蒸发千亿美元。尽管谷歌拥有强大的底层模型和庞大用户群,但在如何将聊天界面整合或取代传统搜索,以及平衡高昂的AI查询成本与现有搜索广告模式之间,面临创新者的窘境。观点认为,谷歌需要更积极地将Gemini等AI产品推向前端,甚至不惜进行自我蚕食,这需要创始人级别的品味和勇气。YouTube和Workspace被视为谷歌整合AI的潜在突破口。
关于市场格局,“最大七要素”的时代或将结束,新的指数构成引人深思。私营公司如SpaceX、OpenAI等不愿上市,部分归因于成为上市公司的巨大成本与监管压力。同时,反垄断趋势下,大型科技公司的并购受限,这可能扼杀小公司的退出路径,进而抑制风险投资的积极性。讨论呼吁减少监管,允许良性竞争,包括大型企业间的并购,以激励创新和风险资本投入,避免社会因缺乏投资而停滞不前。历史数据显示,退出渠道的收窄已对风险投资的活跃度产生影响。
当前科技投资领域正经历一场严峻的收缩,这恰逢一个抛物线式增长的新经济周期的开端,本应加速创新的资本却面临枯竭。风险投资若无法向有限合伙人返还资金,增量资本的来源便转向散户及海外主权财富基金,但这可能导致市场常态化,风险投资金额随之减少,经济增长与创新将回归特定速度。
作为有限合伙人,追求扣除税费后年化10%的净回报是基本目标,以实现近乎零破产风险的无限复利增长。然而,当前市场环境下,为达此目标,投资者不得不承担更高风险,从对冲基金到私募信贷与股权,即便如此,综合回报率仍显不足。风险投资虽承诺高回报,但其极低的流动性要求回报率达到20%区间中高段,而实际数据却更像三到四年的对冲基金表现。
这种流动性困境,部分源于政府部门、监管机构(如FTC)的人为干预。缺乏IPO与并购的现状,使得风险投资除非被视为带有慈善性质,否则难以独立证明其合理性,除非资本流出、价格下降、回报倍数上升。回顾2021年IPO市场的辉煌(如Rivian、Robinhood等巨头上市)与并购活动的活跃,对比22年至25年的惨淡,甚至差于过往正常年份,引发了对当前市场环境的深刻反思。并购市场人士甚至认为许多交易已不值得提交董事会,监管层可能因不愿看到特定个体成为亿万富翁而阻碍交易,却忽视了资本回流至其他风险投资者所产生的瀑布效应及附带损害,这种连锁反应最终波及福特基金会、哈佛大学等机构投资者。
与此同时,硅谷及美国创造的“飞轮效应”——成功企业(如谷歌)上市后人才溢出,催生新企业(如Facebook)并培养天使投资人与LP——正受到阻碍。然而,澳大利亚等国却在积极复制这一模式,如Atlassian的创始人们投资了Blackbird,后者又投资了Canva,共同推动了澳洲的创业浪潮。美国企业家在身后将财富捐赠给基金会,继续推动社会进步的传统亦面临挑战。
在此背景下,一种新型的“区间基金”(interval fund)应运而生。传统私募资金门槛高、锁定期长,GP每三年需募新基金,压力巨大。公开市场则充斥着指数基金,主动管理者为规避风险也趋向指数化,缺乏在市场高位或下跌时持有现金的灵活性。新基金借鉴伯克希尔·哈撒韦模式,旨在构建一个可同时投资公开股票、私有公司并持有大量现金的系统。投资者被允诺一个五到七年的投资周期,每年可赎回部分资金,基金则以更低费用换取更长期的资本承诺。
这种基金将科技投资“民主化”,最低投资额约5万美元,资格条件更宽松,使更多投资者得以参与。发起人以1.25%的管理费和12%的激励费,换取近乎永久性的资本,以期实现更长时间的复利增长。基金的启动获得了贝索斯、戴尔等家族办公室及科技企业家的支持,目标是打造史上最大规模的启动基金。其运作模式将通过华尔街公司分销,面向与财富管理公司有联系的广大投资者,并简化了税务(1099表格替代K1表格)和管理流程。
面对竞争,该基金将专注于自身优势:深刻理解公开与私募市场,以及现金管理的风险控制能力。其核心目标(北极星)是在未来十年内打造新的“七巨头”公司。这意味着需识别未来市值最大的公司,它们部分已上市,部分仍是私有。鉴于规则与监管负担,未来的最佳投资组合必然是公私混合,需要能跨越两者的投资工具。在投资私有公司时,策略将聚焦于识别并投资于各个领域的领导者,即便估值高昂,也需审慎判断,并运用公开市场投资者的纪律性来评估私有公司的价值。优秀的投资者需兼具展望未来的想象力与公共市场日常的纪律性,在波动的市场中保持冷静与耐心。
布雷特·泰勒,一位曾重写谷歌地图、担任Facebook首席技术官并两度创业的杰出工程师,分享了他从卓越工程师转变为成功企业家的深刻洞见。他强调,创业者需克服单一视角,认识到企业在不同阶段面临产品、市场或竞争等多元挑战,并应根据业务核心需求调整自身角色,而非固守舒适区。泰勒以其在Facebook任CTO的经历为例,说明了通过接受反馈、提升团队标准并专注于对业务最重要的事务,而非个人偏好,他实现了个人成长并从中获得了更大的影响力与快乐。他认为,不应让个人擅长定义自己,而是要像变色龙一样适应环境,这种自我意识和反思能力是领导者避免公司失控的关键。
谈及他与Clay共同创立的Sierra公司,泰勒阐述其愿景是帮助企业构建面向客户的人工智能代理,坚信AI代理将成为公司主要的数字界面。他将当前AI代理的构建类比为网站建设,是品牌和业务的体现,并希望Sierra能成为驱动这些品牌AI代理的核心平台。
对于AI市场的格局,泰勒认为将分化为三个层面:资本密集、趋于整合的基础模型市场;如同“镐和铲”的工具制造市场,可能面临基础模型公司的竞争压力;以及他认为最具潜力的应用人工智能市场,主要以垂直领域代理(如法律、客户体验、市场营销的AI代理)的形式出现。他将这类代理视为新型SaaS,企业将通过购买执行特定工作的代理来消费AI。泰勒对此感到兴奋,认为这不仅是软件应有的消费方式,更能通过提供以往依赖高成本劳动力的成果来改变市场,有望催生万亿美元级的应用型企业软件公司。他提醒创业者,真正的价值在于利用技术解决高价值商业问题,并以更低成本提供有价值的成果。
在AI代理的商业模式上,Sierra采用基于结果的定价,即当AI代理自主解决客户问题时收费,旨在与客户的商业模式保持一致。泰勒视此为软件商业模式的自然演变,从盒装软件到SaaS,再到为完成的工作付费。他强调,这种模式颠覆了传统企业软件的销售与实施方式,迫使供应商对结果负责。对于初创企业而言,不受旧商业模式束缚是一个巨大优势,因为改变商业模式远比弥合技术差距更为困难。AI时代不仅带来新的技术和交付模式,更催生了新的商业模式,这正是初创企业的机遇所在。
回顾创业历程,泰勒指出,如今的基础设施(云服务、开发工具等)极大降低了创业的间接成本,使初创公司能更专注于核心差异化业务。他建议创业者避免在非核心事务上浪费资源,要保持自律,专注于能带来长期价值的领域。对于帮助ADT这类老牌公司利用AI转型,泰勒认为关键在于以合作伙伴的身份出现,深入理解并帮助解决其紧迫的业务问题,用客户的语言沟通,展现同理心。在当前AI供应商众多的市场中,通过深入研究客户、提供差异化价值才能脱颖而出。他坚信垂直领域的AI代理大有可为,因为不同行业的核心工作流程和价值点各不相同,能快速在这些核心流程上提供价值的公司将占据优势。对于定价,无论是基于成本节约还是增量收入,关键在于理解客户的核心需求、购买流程和决策者,有时预付费模式甚至比按需付费更容易被接受,这需要深入洞察购买周期。
在红杉举办的活动上,OpenAI深度研究团队的负责人伊萨·富尔福德介绍了其团队的创新产品——深度研究。该功能作为ChatGPT中的一种高级代理能力,旨在通过在线进行多步骤研究,以解决高度复杂的任务。用户提供一个提示后,深度研究会在5到30分钟内浏览大量网络资源,进行推理分析,并最终生成一份详实全面的报告,其水准可媲美专业研究分析师,能在短时间内完成人类需数小时才能完成的工作。
深度研究的核心驱动力是OpenAI O3模型的一个微调版本,该版本特别强化了网络浏览和数据分析能力。伊萨回顾了项目的起源:一年多前,团队在强化学习和推理模型(尤其在数学、科学和编码任务上)方面取得了显著进展,并观察到这些能力可以泛化到其他领域。为了验证模型在用户日常任务上的实用性,团队选择了在线浏览作为切入点,因其应用广泛且作为只读代理在安全方面更易控制。项目的启动始于一个内部演示,通过提示模型来展示深度研究产品的潜力,成功激发了团队热情,随后便着手训练专门的深度研究模型。这一过程涉及创建强化学习任务以教授模型浏览和数据分析技能,并为其配备必要的工具,如浏览器访问权限(搜索、点击、滚动)和代码执行环境(用于数据分析、绘图等)。
伊萨展示了深度研究的多个应用实例。许多用户将其用于专业场景,如学术研究、风险投资分析和咨询工作。同时,个人用途也非常普遍,例如购物决策和旅行规划。在一个演示中,她向深度研究提出分析人工智能公司风险投资最新趋势并生成图表的请求。深度研究首先会提出澄清性问题,以确保最终输出符合用户期望,鼓励用户提供具体信息。随后,它会展示其“思维链”摘要,即模型如何推理遇到的信息来源以及它采取的工具调用(如使用Python进行搜索或分析)。伊萨还分享了个人使用案例,如在韩国时,她要求深度研究查找15分钟路程内的夜市,并要求其查阅Reddit和韩文资源,找出每个夜市中评分最高的店铺。深度研究成功处理了这些复杂约束,并提供了包含引用的详尽报告。
此外,O3模型之所以在搜索方面表现出色,部分原因在于它也使用了为深度研究开发的工具和浏览数据集进行训练。深度研究目前已能处理诸如查询美国已获监管批准的特定血友病基因疗法等专业问题,并返回包含引用和解释的准确列表。
尽管深度研究功能强大,伊萨也坦言其并非完美,有时会出现“幻觉”。团队正致力于提高其可靠性,并计划将深度研究的能力整合到主要的推理模型中。未来的发展方向还包括引入私有上下文信息,如用户内部的公司知识库和付费墙资源。更长远的目标是使深度研究不仅能综合现有信息,更能实际执行行动。
Anthropic首席产品官Mike指出,无论内容创作采用何种媒介或AI介入程度多深,核心始终在于故事的叙述力及内容背后能否引发人们共鸣并建立长期互动。他认为,未来区分内容是否由AI生成将变得无关紧要,更重要的是信息的推导、出处和来源引用,这些在AI时代反而更容易实现和追溯。在产品构建层面,Mike强调,尽管解决用户实际问题这一基本原则(如Instagram时代的经验)依然适用,但在AI领域,尤其是Anthropic,更需依赖自下而上的创造力,因为许多优秀产品的灵感源于对模型能力的深入理解,而这些能力往往在研发后期才显现。以Model-Component Protocol (MCP)为例,其诞生并非顶层设计,而是工程师在解决重复性集成问题(如Google Drive、GitHub)中自发探索抽象共通模式的结果,并致力于将其开放和标准化。
展望未来,Mike对MCP在驱动模型“采取行动”以及促进智能体(agent)间交互方面充满期待,尽管后者标准化为时尚早。他认为理想的AI应不仅能检索信息,更能自动化执行工作流程,甚至发展出智能体间相互雇佣的“经济体”。在编码产品方面,Anthropic注重生成用户乐于使用且效果良好的代码,而非单纯追求基准测试。公司内部已大量使用Claude辅助编码,超过70%的pull request由其生成,这同时也带来了对代码审查等二阶效应的新思考。Mike观察到,AI工具的普及正改变工作方式,非技术部门如销售也开始广泛应用,而他个人则将AI视为思考伙伴,用于起草各类文档。他强调,提升组织内对AI工具使用的共享可见性,有助于消除使用偏见。
对于Anthropic的未来,Mike表示将聚焦于“智能体”概念,致力于让模型能长时间自主工作,这需要记忆、高级工具使用及组织化融入能力,并围绕此构建可验证性、日志记录等辅助系统。新模型也在持续研发中。他坦言,当前AI产品对初次使用者而言仍有较高门槛,提升易用性是一大挑战。谈及行业趋势,Mike认同算力的极端重要性,并指出AI实验室内部需权衡算力在强化学习、客户用例和新模型预训练间的分配,这甚至会影响是否为了部署高价值产品而延迟发布新模型。他相信,将模型投入实际应用并获取市场反馈,对产品迭代至关重要。在平衡研究与产品时,Anthropic力求产品能体现其应用AI和微调能力的独特价值,而非简单复制API功能。
关于市场竞争与产品策略,Mike观察到用户乐于同时使用多种AI产品,它们并非完全替代关系,暗示短期内多产品并存的局面可持续,长期或出现某种形式的整合。针对智能体间交互标准,他认为除协议外,更关键的是解决模型在信息披露与保密间的辨别力这一研究难题,并需考虑大规模应用时的可审计性及智能体身份管理。最后,Mike指出应用层产品构建的常见误区在于未能将AI置于产品核心,或未能充分向模型暴露应用原语,理想状态下模型应成为应用的主要“用户”。
丹·罗伯茨,曾为红杉资本成员,在过去两年多与我们深入交流并分享了关于推理的知识。去年AI Ascent大会上,他即将离开红杉加入OpenAI的消息被阿尔弗雷德意外透露,令他颇为窘迫,如今他已能更从容地分享其见解。
OpenAI去年九月发布了名为O1的模型。其核心突破在于,模型性能不仅随训练时间增加而提升——这是机器学习的常规现象——更重要的是,它也随着测试时间的增加而改进。这意味着模型被教会了推理,它会花时间思考,思考时间越长,表现越好。这一“测试时扩展”的全新维度至关重要。
最近发布的O3模型是更优秀的推理模型。以一个量子电动力学问题为例,O3能够观察问题、迭代思考、放大细节,并在大约一分钟内给出正确答案,其验证过程对专业人士也颇具挑战。目前的模型能在一分钟内复现教科书级别的计算,但我们的目标是让它们对人类知识和科学前沿做出重大贡献。
设想一个思想实验:若将一道关于广义相对论的考题(由GPT 4.5虚构)提给1907年的爱因斯坦,他需要大约八年时间才能发现并解答。而O3模型现在就能给出正确答案。这凸显了从快速计算到产生原创性科学发现的跨越目标。
为实现这一目标,关键在于提升模型性能,而这依赖于强化学习(RL)。演讲的核心信息是,我们希望扩大强化学习的规模。相较于GPT-4.0主要依赖预训练计算资源,O1已开始引入RL计算,O3则使用了更多。未来,我们可能拥有海量的RL计算能力,甚至被其主导。这挑战了Yann LeCun将RL视为预训练(蛋糕)之上的一小颗樱桃的观点;我们期望用一个巨大的RL樱桃来“碾碎”同样大小的蛋糕,彻底颠覆现有范式。
OpenAI的计划是明确的:扩展计算规模,包括筹集巨资、建设基础设施、训练模型并持续投入。同时,我们致力于发展“规模化科学”,即研究如何在新范式下(如测试时计算和RL训练)有效扩展模型能力。GPT-4的经验表明,对模型最终性能的预测是可能的,但新方向要求我们重新定义和探索扩展的科学。
当前模型有时被喻为“白痴天才”,未能做出如发现广义相对论的突破,或许是因为我们提出的问题类型不对,或者训练数据过于集中在特定领域如竞赛数学。真正的解决方案在于进一步扩大规模。
展望未来,人工智能可完成任务的长度大约每7个月翻一番。目前模型能处理约1小时的任务,以此推断,大约9年后,我们或许能拥有一个能够发现广义相对论的模型。
本期“No Priors”专访了多邻国(Duolingo)的联合创始人兼首席执行官路易斯·冯·安。多邻国最初是一款语言学习应用,现已扩展至数学和音乐教学,并计划加入国际象棋。路易斯·冯·安在卡内基梅隆大学获得计算机科学博士学位,并创办了被谷歌收购的Recaptcha。多邻国目前月活跃用户超1.16亿,市值170亿美元。
多邻国的创立源于路易斯·冯·安与其博士生塞韦林(现任CTO及联合创始人)为寻找博士论文课题,决定研究如何用计算机辅助教育,特别是英语教学,因其能显著提升个人收入潜力。然而,他们在亲自体验学习对方母语(西班牙语和德语)的过程中,发现传统学习方式极其枯燥,难以坚持。这一痛点促使他们将多邻国尽可能游戏化,以提升用户动机,使其成为一款适合普通大众而非语言狂热者的产品。最初有效的措施是将课程时长缩短至2分钟,这大大降低了用户的进入门槛,即便用户最终可能学习更长时间。行为科学方面,“连续学习记录”(streaks)和略带消极攻击性的“召回通知”被证明出乎意料地有效,前者培养了用户的习惯,后者则利用了用户不愿被“放弃”的心理。
路易斯强调,学习中最困难的问题是动机,而非方法论的优劣。如同健身,关键在于坚持,因此降低门槛、提升趣味性至关重要。多邻国正是通过借鉴手机游戏等成瘾机制怎么在电脑上翻墙,将这些技巧用于教育,吸引用户投入学习时间。例如,要达到西班牙语的良好水平大约需要500小时,中文则需2000小时,关键在于如何让用户累积这些时间。面对用户“懒惰”和易被娱乐内容吸引的现实,多邻国选择顺应并利用这些行为特点。
随着机器学习能力的加速发展,多邻国积极拥抱大型语言模型(LLM)。AI极大地提升了内容创作效率,使公司能为更多语种背景的用户提供更丰富的课程,并实现以前难以规模化的功能,如与AI进行无压力的对话练习。目前,多邻国正利用LLM彻底改造数学课程,力求打造兼具辅导老师效果与游戏趣味性的产品,即便最终可能只达到两方面各90%的效果,其组合也将非常强大。在选择新增教学科目时,多邻国会考虑受众规模、学习所需时长、对世界的益处、移动应用的适用性以及内部团队的热情。
关于品牌,多邻国以其特立独行的猫头鹰吉祥物和幽默甚至“精神错乱”的品牌声音著称。这并非刻意设计,而是源于互联网上关于猫头鹰强迫用户学习的表情包,公司随后顺势而为,并发现这种策略效果显著,尤其是在TikTok等社交平台。作为一家教育公司,其品牌营销享有更大的容错空间。
多邻国的成功背后是海量的A/B测试——已进行超过16000次,以不断优化用户体验和学习效果,例如,系统会推送用户有约83%几率答对的练习,以最大化乐趣和学习动力。路易斯认为,未来教育将因AI的高度可扩展性和个性化能力而改变,教师角色会继续存在,但学校可能更多承担托管和辅助AI教学的功能。尽管教育体系变革缓慢,但部分私立学校和发展中国家可能率先采纳新技术。
对于大型语言模型是否构成威胁,路易斯承认平台转移的潜在风险,但也相信多邻国庞大的用户基础、独特的学习数据、强大的品牌和工程文化将构成竞争优势。人们对多邻国的最大误解在于低估了动机在学习中的重要性以及应用背后隐藏的复杂性。最后,他提到AI也正在优化多邻国独特的卡通动画风格的制作流程,使艺术家能更专注于创意本身。
路易斯·冯·安的科技之旅始于童年。八岁时,因母亲用电脑替代了任天堂游戏机,他出于需求自学编程,甚至制作自己的游戏。尽管最初立志成为计算机科学教授,并在卡内基梅隆大学实现了这一目标,他却发现自己从“构建东西”中获得的内在回报远超撰写论文。早在研究生时期,他就开始投身于实际项目的构建。他关于人类计算的早期研究,以及对游戏化作为规模化工具的洞察,引领他开发了ESP游戏——一个巧妙地让数百万人为图像添加描述的游戏,最终被谷歌收购并更名为谷歌图像标注器,有效解决了图像搜索难题。
谈及创办多邻国,路易斯表示,一方面是源于他对教育事业的热忱,另一方面则是为了帮助他的博士生塞韦林·哈克完成论文。两人都对教育抱有兴趣,并希望创造普惠的教育机会,尤其受路易斯在危地马拉的成长经历影响,他深知教育对贫困国家个体命运的改变。他们最初考虑教授数学,但最终认为教授英语乃至更多语言更具影响力。于是,免费在线教授英语成为了多邻国的起点。他强调,与联合创始人塞韦林·哈克建立持久伙伴关系的关键在于友情、兼容的工作方式、相互尊重以及深知对方会公平待己,早期一份手写的“我们的协议”便体现了这种透明与信任。
多邻国早期融资并非一帆风顺。首位投资者联合广场创投的弗雷德·威尔逊投资多邻国,更多是看中路易斯此前将公司出售给谷歌的成功经验,而非看好教育行业的商业前景。然而,产品发布后用户的快速增长——达到约100万活跃用户时——为后续融资提供了有力证明。如今,多邻国已发展到拥有超过4600万日活跃用户。
在探索人类动机方面,多邻国发现了一些传统教育者可能忽略的规律:人们普遍不爱阅读,注意力持续时间短,因此课程设计得越来越短,约两分钟一节。进度条的填充能有效激励用户,竞争与合作(尤其是与投入程度相当的陌生人竞争的排行榜)机制也颇具成效。精美的动画和“古怪”的通知,因其教育的“善意”内核,也成功吸引用户回流。
关于多邻国的商业模式,路易斯坦言,公司初期完全免费,甚至内部员工对“赚钱”一度感到抗拒,因为他们多为使命驱动。在投资者的推动下,多邻国采用了免费增值模式:用户可以免费学习所有内容,但需观看广告;付费则可去除广告。路易斯认为这是一种“小型的财富再分配”,即富裕用户为所有人的教育付费。功能的免费与付费界限,则通过大量的A/B测试来决定,平衡用户、投资者与员工的期望。
多邻国并未止步于语言学习,推出了多邻国英语测试,挑战托福等传统标杆,并致力于使其分数成为全球英语水平的新标准。目前,该测试已被美国顶尖大学广泛接受,预计考试量将超过托福。公司还将业务拓展至数学、音乐,近期甚至推出了国际象棋课程。选择新科目的标准包括:极大的市场需求(数亿用户级别)、对世界有益、适合移动应用教学以及公司内部有充满热情的团队推动。
人工智能对多邻国而言是“完全变革性的”。大语言模型显著提升了语言学习体验,例如实现了曾被认为十年内难以达成的AI对话练习功能,并能快速生成高质量教学内容。路易斯强调,AI旨在提升员工能力,让他们专注于更具创造性的任务,而非取代人力;公司不会因此裁员。
在领导力方面,路易斯从早期事无巨细的管理(他认为初创公司在30人规模以下时有其必要性)转变为如今更侧重于文化传播、扮演吉祥物角色以及做出艰难的哲学决策。他学会了授权,并将精力投入到自己擅长且能带来积极能量的事务上。在招聘时,多邻国极其看重文化契合,奉行“宁可有空缺,也不要有混蛋”的原则,即使这意味着漫长的等待。
多邻国独特的市场营销策略被路易斯称为“有益的脱序行为”。从赋予猫头鹰吉祥物“声音”的通知,到那条著名的“这些提醒似乎不起作用,我们现在要停止发送了”的被动攻击式通知,再到顺应互联网上关于猫头鹰“心理恐怖”的表情包潮流,制作愚人节恶搞视频,以及在TikTok上大获成功,都体现了其大胆和不拘一格。路易斯承认,当初对开设TikTok账号持怀疑态度,但年轻团队的坚持证明他是错的,TikTok现已成为重要的用户增长渠道。
回顾过去,路易斯认为最大的失误是未能在公司成立第三年后就开始盈利,而是拖到了第六年。关于数据利用,多邻国每天处理约13亿道练习题产生的数据,已用于构建模型,并会继续探索其潜力。对于保护少数族裔语言,路易斯表示有兴趣,但受限于投资回报率和当前AI在这些语言上的表现,未来随着成本降低可能会增加更多语种。
当被问及希望如何被铭记时,路易斯表示,他真心希望对教育产生积极影响,证明屏幕时间可以对世界有益,并通过手机触达数十亿人并教育他们。在最后的快速问答中,他透露自己的多邻国最高连续学习天数超过3300天,并坦陈自己仍有15%到20%的几率被验证码难住。