AI大模型训练预算节省新招:用10%成本拟合更准Scaling Law
- 发布时间:2026-04-28 04:14:20
- 来源:谁有1元1分跑的快群资讯中心
- 栏目:新闻资讯
SEO的本质是连接信息与需求的桥梁。
Scaling Law一直是AI实验室规划百万美元级训练预算的核心工具。它帮助团队通过小规模pilot实验外推大模型在更大规模下的性能表现。但拟合这些Scaling Law本身往往需要大量实验,成本动辄百万级。arXiv上最新论文将这一过程形式化为预算感知的序贯实验设计,通过不确定性感知的主动选择,在多样基准任务上仅用约10%的总训练预算,就接近了全集拟合的性能。
最近几天,机器学习社区里一篇arXiv论文迅速传播开来,标题直白:《Spend Less, Fit Better: Budget-Efficient Scaling Law Fitting via Active Experiment Selection》。Scaling Law本是用来规划百万美元级大模型训练的关键工具,可拟合这些定律所需的试点实验本身就可能耗资不菲。
最近arXiv上这篇《Spend Less, Fit Better》论文直击痛点。它把Scaling Law拟合重构为预算感知的序贯实验设计问题:给定一个有限候选实验池,每个实验成本异质,目标是顺序选择执行哪些实验,从而在高成本目标区域实现最佳外推准确性。不是把所有候选都跑一遍,而是聪明地挑最有价值的那些。
Scaling Law 长期被视为 AI 实验室规划百万美元级训练预算的核心工具,通过小规模 pilot 实验外推大模型在更高规模下的表现。但拟合这些 Scaling Law 本身往往需要大量实验,成本容易失控。arXiv 最新论文将这一过程重新形式化为预算感知的序贯实验设计,在多样基准任务上,仅用约 10% 的总训练预算,就接近了全集拟合的性能表现。
主流观点存在明显盲区。他们忽略了实验成本的异质性,以及外推准确性在目标区域(也就是真正高成本的大模型训练)上的优先级。很多人以为多跑几个小实验就够了,却没意识到这些实验的成本差异和信息增益差别巨大,导致预算浪费严重。
这一点目前行业内仍有不同声音。主动实验选择能否在所有Scaling Law景观中保持稳健,还需更多真实算力环境下的长期跟踪验证,但其在低预算区间展现的效率提升,已为中小团队打开了一扇更理性的决策窗口。
后验逼近技术进一步支撑了不确定性感知分配。高斯混合模型被用于近似参数后验,捕捉scaling law中可能存在的多个局部最优“盆”。每次新实验完成后,观测数据更新混合权重和协方差,重新计算剩余候选的效用分数S(x)。这个闭环过程像一个自适应过滤器:早期实验倾向于区分不同趋势,后续则专注降低目标区域的预测方差。
新方法的核心在于不确定性感知的主动选择策略。它把参数不确定性建模为高斯混合近似,以捕捉Scaling Law景观中可能存在的多个局部最优盆地。每次迭代基于当前数据集估计这些盆地,然后为每个候选实验计算其对目标区域均方预测误差的预期减少量,并除以成本的α次方实现归一化。这样算法就能优先挑选单位成本下最能降低目标区域不确定性的实验,早期侧重全局模糊性消解,后期转向局部趋势精炼。
这件事比表面上的“省钱拟合”复杂得多。它本质上呼应了active learning的整体趋势,让Scaling Law拟合从“烧钱验证”变成“智能投资”。在AI训练预算吃紧的时代,这可能重塑游戏规则,促使更多开源工具涌现,但主动选择优化得好与否,将直接决定最终外推的可靠性。值得持续跟踪,现在下结论为时尚早。
具体操作中,团队先定义实验池和目标区域。实验池可涵盖不同学习率与批大小组合、数据分配方案或架构变体,成本用6ND等代理指标估算;目标区域通常锁定亿级参数在万亿token规模的表现,这是最终决策最依赖的部分。流程从几个成本最低的暖启动点开始,数量大致匹配Scaling Law参数个数,确保初始拟合有基本支撑,随后进入迭代选择循环,直至预算耗尽。
排名代发飞机【seo1268】好友聊天,输入“谁有1元1分跑的快群”咨询客服,娱乐游戏作为民间很受欢迎的纸牌玩法,乐趣集中在快节奏的刺激感、心理博弈的张力,这两种玩法的规则几乎一学就会,不用记复杂的牌型搭配,就算是新手也能快速上手,梦想是前行的灯塔,哪怕渺小,也能指引方向。不必因梦想遥远就轻言放弃,逐梦的路上,本就布满挑战。拆分目标,步步前行,哪怕每天只前进一小步,也是在靠近理想。不惧旁人的质疑,不畏前路的漫长,坚守初心,全力以赴。只要心中有梦,眼里有光,脚下有路,终能跨越山海,奔赴心之所向的远方。提醒我们,真正的价值在于提供有深度的分析,而不是简单的关键词堆砌。
固定链接:http://bbb.cn.www.ss7a.cn/3171.html
说明:本页为频道内容整理与信息归档页面,便于围绕当前主题做连续查阅与延伸阅读。