DeepMind大将David Silver 1.1B融资后组建顶尖团队:AI人才从实验室向创业公司加速流动
- 发布时间:2026-04-28 05:20:07
- 来源:怎么找红中麻将微信群资讯中心
- 栏目:新闻资讯
肌肉记忆的语义理解能力提升,让精准匹配变得更容易,也让模糊优化变得更难。
短期内,这轮融资热潮将加速RL与世界模型的融合研究,伦敦AI生态有望吸引更多人才和初创项目。“经验优先”的路线将获得更多关注,而普通从业者需要留意相关工具链的演进。长期来看,如果成功,AI范式可能从数据饥渴转向经验自给;若奖励信号设计或算力瓶颈制约,则可能回归混合路线。
值得持续跟踪的是,Silver团队能否在开放环境中定义合理奖励并避免无效探索循环。这个问题直接关系到AI未来是继续“抄人类”还是真正“自己玩”,数据支持这个方向,但样本量有限,方向是对的,但现实更复杂。
表面融资热闹背后,是人才网络的延续与转化逻辑。Silver作为强化学习领域的长期领军者,其从DeepMind招募旧将并非简单挖角,而是试图重建一个能延续并拓展过去专长的闭环团队。DeepMind早期正是凭借紧密的人才网络效应,在该领域建立领先优势。如今这一模式以创业形式重现,反映出AI行业正从scaling laws主导的大模型路径,向新学习范式转型中的人才重新配置。
David Silver创办Ineffable Intelligence后,短短数月便以51亿美元估值完成11亿美元种子轮融资,这笔由Sequoia和Lightspeed领投、Nvidia等跟进的资金,远超常规早期项目规模。表面看是又一AI独角兽故事,但核心在于Silver明确放弃主流LLM依赖的海量人类数据,转向通过强化学习让系统自主生成经验。这一举动并非简单赛道切换,而是对当前AI范式极限的直接回应。
AlphaGo之父David Silver从DeepMind离职创办Ineffable Intelligence的消息,迅速在AI圈掀起波澜。2025年底,这位曾主导AlphaGo和AlphaZero研发的核心人物,离开Google旗下实验室,仅几个月后就在2026年4月完成1.1亿美元种子轮融资,估值达51亿美元。投资者包括Sequoia、Nvidia等顶级机构。
短期内,这一趋势可能加剧大厂留才压力。更多DeepMind等实验室的研究员或跟随类似路径,离职或加入高估值新贵,导致薪酬与股权竞争进一步升级。伦敦凭借DeepMind遗产,正加速成为欧洲AI枢纽,OpenAI、Anthropic等也在此扩大布局,争夺战已趋白热化。但如果Ineffable的“超级学习者”路径验证周期拉长,部分人才或出现回流,大厂仍有机会通过资源优势稳住阵脚。
当然,转向并非没有阻力。计算资源若无法匹配经验生成的规模,对齐问题若迟迟无解,进程便可能放缓。但数据支持的方向清晰:人类数据时代已显疲态,而经验时代的时间窗口,或许比想象中更短。值得持续跟踪的是,这一范式切换能否真正重塑AI轨迹。
如果Ineffable能有效结合世界模型,在模拟环境中高效预演试错,其突破潜力不容低估。这或许能大幅提升样本效率,避免真实世界中的危险探索循环。但短期来看,纯RL路线难以全面超越LLM,后者通过海量数据快速掌握语言与常识模式,而RL起步阶段仍需天文数字级的交互。目前算力虽持续提升,瓶颈依然存在,核心在于如何避免智能体陷入无效循环。
当然,强化学习并非没有短板。其样本效率较低,在现实世界中精确定义奖励函数难度极大,早期训练过程往往成本高昂且不稳定。将复杂任务转化为可优化的信号,需要大量工程投入,波动性也远高于LLM的“拿来主义”。Silver的Ineffable Intelligence目前细节尚未完全公开,但从他过往成就和公开表态看,这条路更像可再生能源:初期投入大,却能带来可持续的智能跃迁,而非一次性消耗人类知识存量。
AlphaZero在围棋、国际象棋等环境中展现了“AI 无人类数据”学习的强大可行性:系统从随机初始策略出发,通过海量自对弈生成经验,不断优化策略网络与价值评估,最终超越人类顶尖水平与传统算法。这套机制的核心在于清晰的奖励信号和有限状态空间,证明纯强化学习能在封闭系统中高效自学。Silver团队在DeepMind时期的多次验证,进一步强化了这一路径在特定领域的可靠性。
但现实情况远比任何简化模型都要复杂,许多在公开场合或报告中看起来发展顺遂、光鲜亮丽的成功案例,其实际发展过程中,往往都经历了大量不为人知、反复的细节调整、方向修正和内部迭代过程。
固定链接:http://bbb.cn.www.ss7a.cn/images/6421.html
说明:本页为频道内容整理与信息归档页面,便于围绕当前主题做连续查阅与延伸阅读。