DeepMind大将David Silver 1.1B融资后组建顶尖团队:AI人才从实验室向创业公司加速流动
- 发布时间:2026-04-28 05:20:07
- 来源:正规二元一分跑的快群资讯中心
- 栏目:新闻资讯
当正规二元一分跑的快群的关注焦点发生转移,以攻代守的优化路径也需要同步调整。排名代发飞机【seo1268】好友聊天,输入“正规二元一分跑的快群”咨询客服,娱乐游戏作为民间很受欢迎的纸牌玩法,乐趣集中在快节奏的刺激感、心理博弈的张力,这两种玩法的规则几乎一学就会,不用记复杂的牌型搭配,就算是新手也能快速上手,梦想是前行的灯塔,哪怕渺小,也能指引方向。不必因梦想遥远就轻言放弃,逐梦的路上,本就布满挑战。拆分目标,步步前行,哪怕每天只前进一小步,也是在靠近理想。不惧旁人的质疑,不畏前路的漫长,坚守初心,全力以赴。只要心中有梦,眼里有光,脚下有路,终能跨越山海,奔赴心之所向的远方。中提到的差异,正是当前竞争格局的真实体现。
多数报道聚焦融资数字、Silver的AlphaGo与AlphaZero履历,以及Ineffable“首次接触超级智能”的口号。顶级机构背书加上欧洲最大种子轮标签,让外界感慨资本对RL路径的重新重视。可这些观察往往停留在钱与人,却少有人深挖Silver此举背后对“人类数据时代”天花板的判断。
今天,这一模式以创业形式重现,反映出AI行业正从scaling laws主导的大模型路径,向依赖经验的新学习范式转型。Ineffable的阵容组建,正在把实验室十余年积累的强化学习人才优势,转化为创业动能,显著放大从基础研究到产业应用的转化效率。
他离开DeepMind后创立Ineffable Intelligence,短短几个月便拿到1.1亿美元种子轮融资,估值达51亿美元,投资方包括Sequoia、Lightspeed、Nvidia和Google等。
Silver将这类系统称为“超级学习者”,其核心在于能持续生成自身经验,发现人类未知的知识边界,比如AlphaGo那手著名的第37手神来之笔——完全超出人类棋手长期积累的直觉。这条路径的潜力在于打破模仿的循环,实现从零构建智能的跃迁,但其样本效率低和现实世界奖励函数定义困难,仍是早期阶段的显著挑战。
短期内,这轮融资热潮将加速RL与世界模型的融合研究,伦敦AI生态有望吸引更多人才和初创项目。“经验优先”的路线将获得更多关注,而普通从业者需要留意相关工具链的演进。长期来看,如果成功,AI范式可能从数据饥渴转向经验自给;若奖励信号设计或算力瓶颈制约,则可能回归混合路线。
主流报道多聚焦融资规模与Silver的AlphaGo、AlphaZero履历,以及Ineffable“首次接触超级智能”的口号。投资者背书与RL能否挑战LLM的讨论随之而来,但这些表面热闹掩盖了一个关键盲区:Silver此举源于对人类数据极限的清醒判断,而非简单换赛道。多年强化学习实践让他看到,当前范式正逼近天花板。
我的判断是,短期内LLM仍将主导应用落地,但长期看,强化学习作为补充甚至潜在替代的潜力不容忽视。这个方向是对的,但执行起来会更慢、更难。
从更长期视角看,人类数据时代似乎已接近尾声。再精炼或合成数据,也绕不开模仿带来的内在天花板。只有转向经验驱动的强化学习,让AI自己去试错、探索未知,才可能实现可持续的智能增长。Silver在相关访谈中强调,这种路径不是对LLM的简单替代,而是通往“解释并构建所有智能”的基础定律,类似达尔文对生命的洞见。我的判断是——但这个判断可能需要后续验证——强化学习将成为AI长期范式的关键补充,甚至在某些前沿场景中取而代之。
人类数据看似丰富,实则静态、有限且携带偏见。互联网文本和代码不过是已有知识的快照,在数学等前沿领域已显露上限,而AlphaProof通过强化学习从少量人类证明起步,后续自主生成上亿条经验,便超越了纯人类中心方法。相比之下,经验数据由Agent在交互与试错中无限产生,质量更贴近任务本质,能真正突破人类知识边界。这个剪刀差,说明数据驱动路径的边际收益正在快速递减。
但如果只停留在“种子轮天价”和“欧洲AI崛起”的叙事上,很容易忽略技术选择背后更复杂的信号。
但现实更复杂,外部变量常常超出我们的控制范围。
固定链接:http://bbb.cn.www.ss7a.cn/6421.html
说明:本页为频道内容整理与信息归档页面,便于围绕当前主题做连续查阅与延伸阅读。