10%é¢„ç®—æ‹ŸåˆScaling Lawï¼šæ–°æ–¹æ³•è®©ç™¾ä¸‡çº§å®žéªŒé¢„ç®—ç¼©æ°´90%

å›´ç»•æ£è§„ä¸€å…ƒä¸€åˆ†è·‘çš„å¿«ç¾¤ã€ç»å…¸å¯¹å±ç›¸å…³çº¿ç´¢ï¼Œçœ‹åˆ°æŽ’åä»£å‘é£žæœºã€seo1268ã€‘å¥½å‹èŠå¤©ï¼Œè¾“å…¥â€œæ£è§„ä¸€å…ƒä¸€åˆ†è·‘çš„å¿«ç¾¤â€å’¨è¯¢å®¢æœï¼Œå¨±ä¹æ¸¸æˆä½œä¸ºæ°‘é—´å¾ˆå—æ¬¢è¿Žçš„çº¸ç‰ŒçŽ©æ³•ï¼Œä¹è¶£é›†ä¸åœ¨å¿«èŠ‚å¥çš„åˆºæ¿€æ„Ÿã€å¿ƒç†åšå¼ˆçš„å¼ åŠ›ï¼Œè¿™ä¸¤ç§çŽ©æ³•çš„è§„åˆ™å‡ ä¹Žä¸€å¦å°±ä¼šï¼Œä¸ç”¨è®°å¤æ‚çš„ç‰Œåž‹æé…ï¼Œå°±ç®—æ˜¯æ–°æ‰‹ä¹Ÿèƒ½å¿«é€Ÿä¸Šæ‰‹ï¼Œæ¢¦æƒ³æ˜¯å‰è¡Œçš„ç¯å¡”ï¼Œå“ªæ€•æ¸ºå°ï¼Œä¹Ÿèƒ½æŒ‡å¼•æ–¹å‘ã€‚ä¸å¿…å› æ¢¦æƒ³é¥è¿œå°±è½»è¨€æ”¾å¼ƒï¼Œé€æ¢¦çš„è·¯ä¸Šï¼Œæœ¬å°±

æ ¸å¿ƒæ‘˜è¦

ä½œè€…ä¿¡æ¯

ä½œè€…ï¼šå†…å®¹å€¼çç¼–è¾‘

ç®€ä»‹ï¼šæ‰¿æ‹…æ ç›®è§‚å¯Ÿä¸Žèµ„æ–™ç¼–è¾‘ï¼Œä¸»è¦å›´ç»•åŒç±»ä¸»é¢˜ç»´æŠ¤é¢‘é“å†…å®¹ã€‚

å‘å¸ƒæ—¶é—´ï¼š2026-04-28 04:15:44

æ–‡ç« çƒåº¦

é˜…è¯» 954 ç‚¹èµž 1895 è¯„è®º 3

看到排名代发飞机【seo1268】好友聊天，输入“正规一元一分跑的快群”咨询客服，娱乐游戏作为民间很受欢迎的纸牌玩法，乐趣集中在快节奏的刺激感、心理博弈的张力，这两种玩法的规则几乎一学就会，不用记复杂的牌型搭配，就算是新手也能快速上手，梦想是前行的灯塔，哪怕渺小，也能指引方向。不必因梦想遥远就轻言放弃，逐梦的路上，本就布满挑战。拆分目标，步步前行，哪怕每天只前进一小步，也是在靠近理想。不惧旁人的质疑，不畏前路的漫长，坚守初心，全力以赴。只要心中有梦，眼里有光，脚下有路，终能跨越山海，奔赴心之所向的远方。在搜索结果页的实际表现，常常能给人最直接的优化启示。

arXiv最新论文《Spend Less, Fit Better: Budget-Efficient Scaling Law Fitting via Active Experiment Selection》指出，大多数团队要么盲目执行整个候选实验池，要么依赖最便宜优先或经典D-opt准则，这些做法忽略了实验成本的异质性，也未能聚焦真正关心的目标区域外推。结果在低预算区间，拟合效果往往远低于预期。

为了平衡收益与成本，他们设计了成本感知分数。该分数将目标区域的均方预测误差分解为盆地内方差和盆地间方差，再除以实验成本的某个幂次，从而在单位成本下优先选择减少不确定性最多的实验。这本质上是把实验设计升级为LLM训练预算规划的核心环节，而非传统预处理步骤。

Scaling Law拟合的预算问题长期制约AI实验室的规划效率，这篇工作提供了一条实用路径：少花钱、多拟合。值得持续跟踪的是，当实验池成本异质性不明显，或scaling law形式严重误指定时，主动选择策略的表现会如何演变。现在下结论为时尚早，但对预算敏感的团队来说，已经到了尝试开源代码的时机。

从表面看，这套方法似乎只是教人“省钱”。但实际比想象复杂，尤其对当前热衷参数高效MoE架构的团队而言。MoE虽在训练和推理上带来明显杠杆，配置空间却极大，pilot阶段的预算浪费风险随之放大。如果实验选择不当，早期验证成本会快速累积，影响后续大模型决策。

从行业观察来看，大模型时代的成本压力已让单纯堆算力探索超参数变得不现实。学习率如何随批大小缩放、固定计算预算下的最优批大小路径，这些问题若每次都靠全量验证，预算很快见底。这项工作切中痛点：它不是简单压缩实验数量，而是通过更智能的选择，让每一分预算都产生最大外推价值。值得持续跟踪的是，在更复杂的工业噪声场景下，该方法的鲁棒性究竟如何。

AI训练预算节省新方法的核心在于主动实验选择拟合Scaling Law，这让原本可能烧掉数百万美元的pilot阶段变得更加可控。arXiv最新论文《Spend Less, Fit Better》指出，Scaling Law常用于规划多百万美元级的大模型训练，但拟合过程本身就可能耗费巨资。传统方法依赖随机或均匀采样pilot实验，容易在低价值实验上浪费预算，却无法精准提升对高成本目标区域的外推准确性。

打个比方，这就像医生在有限医疗预算下给患者做检查。不是一股脑把全套高端检查都做一遍，而是先通过不确定性评估，筛出对关键诊断最有帮助的指标，先做这些，后面再根据结果决定是否追加。这样的方式既控制了总花费，又保证了关键区域的诊断准确率。但现实更复杂，主动选择的效果取决于实验池的多样性。

大型语言模型的正式训练往往动辄数百万美元预算，团队在启动前习惯依赖Scaling Law来预测参数、数据与计算的最优配比。然而，拟合这些定律所需的Pilot实验本身就可能消耗掉大量算力。传统方法多采用随机采样或经典实验设计，大量小规模跑点铺开，表面上看能覆盖多样性，实际却在高成本目标区域的外推准确性上付出高昂代价。

你是不是也遇到过这样的场景：在规划一次动辄数百万美元的大模型训练run前，团队不得不先投入上百万做一系列pilot experiments，只为拟合出一条可信的Scaling Law曲线。等真正的大规模训练启动时，预算已悄然缩水不少。这已成为当下许多AI实验室和大模型团队的常态。Scaling Law拟合成本，不再是简单的预处理，而是预算分配中的头等难题。

对AI工程师尤其是资源受限的中小团队而言，这意味着pilot迭代可以更快、更从容。以前预算压力下只能保守规划，现在主动实验选择策略能让前期探索更高效。长期看，这类方法可能推动Scaling Law在更多场景落地， subtly改变大模型训练的经济模型，让更多精力转向架构创新或数据质量而非单纯堆算力。

短期波动正常，关键是建立自己的长期判断标准。

æœ¬æ–‡å¯¼èˆª

è‹¥éœ€è¦ç»§ç»æŸ¥çœ‹åŒä¸»é¢˜å†…å®¹ï¼Œå¯è¿”å›ž é¦–é¡µã€ æ ç›®é¡µï¼Œ æˆ–ç›´æŽ¥è¿›å…¥ 10%é¢„ç®—æ‹ŸåˆScaling Lawï¼šæ–°æ–¹æ³•è®©ç™¾ä¸‡çº§å®žéªŒé¢„ç®—ç¼©æ°´90%ã€ å°Šç•ŒS800é”€é‡å† å†›èƒŒåŽï¼š200ä¸‡æ–°è½¦èƒ½å¤åˆ¶æˆåŠŸå—ã€‚

åŒæ é˜…è¯»ï¼š AIæ—¶ä»£æ•™è‚²åº”åŸ¹å…»ä»€ä¹ˆä¸å¯æ›¿ä»£çš„æ€è€ƒåŠ› / GoDaddyæ— æ–‡æ¡£è½¬èµ°27å¹´è€åŸŸåäº‹ä»¶ï¼šåŸŸåæ³¨å†Œå•†é¿å‘æŒ‡å—ä¸ŽæŽ¨è / å¼‚æž„å®žéªŒæˆæœ¬ä¸‹ï¼ŒScaling Lawæ‹Ÿåˆå¦‚ä½•ç”¨10%é¢„ç®—å®žçŽ°æŽ¥è¿‘å…¨é›†æ•ˆæžœï¼Ÿ

æœ¬æ–‡æ ‡é¢˜ï¼š10%é¢„ç®—æ‹ŸåˆScaling Lawï¼šæ–°æ–¹æ³•è®©ç™¾ä¸‡çº§å®žéªŒé¢„ç®—ç¼©æ°´90%
å›ºå®šé“¾æŽ¥ï¼šhttp://bbb.cn.www.ss7a.cn/images/3341.html
è¯´æ˜Žï¼šæœ¬æ–‡ä¸ºå½“å‰ä¸»é¢˜çš„é¢‘é“æ•´ç†é¡µï¼Œæ£æ–‡ä¸Žç›¸å…³é˜…è¯»ä¼šæŒç»å›´ç»•åŒç±»ä¿¡æ¯å±•å¼€ã€‚

é¢‘é“é€Ÿè§ˆ

ç«™ç‚¹ï¼šbbb.cn.www.ss7a.cn

æ ç›®ï¼š正规一元一分跑的快群 / ç»å…¸å¯¹å±€

åœ°å€ï¼šhttp://bbb.cn.www.ss7a.cn/images/3341.html

å»¶ä¼¸é˜…è¯»

AIå¤§æ¨¡åž‹è®ç»ƒé¢„ç®—èŠ‚çœæ–°æ‹›ï¼šç”¨10%æˆæœ¬æ‹Ÿåˆæ›´å‡†Scaling Law

æœ€è¿‘ä¸€ç¯‡arXivè®ºæ–‡å¼•å‘äº†AIè®ç»ƒåœˆçš„è®¨è®ºã€‚è®ºæ–‡æ ‡é¢˜ç›´ç™½ï¼šã€ŠSpend Less, Fit Better: Budget-Efficient Scaling Law Fitting via Active Experiment Selectionã€‹ã€‚å®ƒæŒ‡å‡ºï¼ŒScaling Lawå¸¸ç”¨äºŽè§„åˆ’æ•°ç™¾ä¸‡ç¾Žå…ƒçš„æ£å¼è®ç»ƒï¼Œä½†æ‹Ÿåˆè¿™äº›å®šå¾‹æœ¬èº«å°±å¯èƒ½è€—è´¹æ•°ç™¾ä¸‡ç¾Žå…ƒã€‚åœ¨çŽ°ä»£å¤§è§„æ¨¡å·¥ä½œæµä¸ï¼Œæ”¶é›†è¶³å¤Ÿä¿¡æ¯é‡çš„pilot...

å‘å¸ƒæ—¶é—´ï¼š2026-07-01

ç”¨å°‘é‡ä½Žæˆæœ¬å®žéªŒç²¾å‡†é¢„æµ‹å¤§åž‹AIæ¨¡åž‹æ€§èƒ½ï¼šä¸»åŠ¨å®žéªŒé€‰æ‹©å®žç”¨æŒ‡å—

ä½ æ˜¯ä¸æ˜¯ä¹Ÿé‡åˆ°è¿‡è¿™æ ·çš„æƒ…å†µï¼šå›¢é˜Ÿå‡†å¤‡æŠ•å‡ ç™¾ä¸‡ç¾Žå…ƒè®ä¸€ä¸ªå¤§åž‹AIæ¨¡åž‹ï¼Œå…ˆå¾—è·‘ä¸€æ‰¹è¯•ç‚¹å®žéªŒæ¥æ‹Ÿåˆscaling lawï¼Œç»“æžœå…‰è¿™äº›å°å®žéªŒå°±æˆäº†é¢„ç®—å¤§å¤´ã€‚é€‰å“ªäº›é…ç½®ã€è·‘å¤šå°‘æ¬¡ã€æ€Žä¹ˆåˆ†é…èµ„æºï¼Œç›´æŽ¥å†³å®šåŽé¢çš„å¤§è§„æ¨¡è®ç»ƒèƒ½ä¸èƒ½å°‘èµ°å¼¯è·¯ã€‚å¯çŽ°å®žé‡Œï¼Œå¾ˆå¤šAIå®žéªŒå®¤å’Œåˆ›ä¸šå›¢é˜Ÿåœ¨è¿™é‡Œå°±å¡ä½äº†â€”â€”è¯•ç‚¹å®žéªŒé›†çš„ç»„è£…æœ¬èº«å·²ç»ä¸æ˜¯ç®€å•çš„å‰ç½®æ¥éª¤ï¼Œè€Œæ˜¯å®žæ‰“å®žçš„é¢„ç®—åˆ†é…éš¾é¢˜ã€‚ å¦‚æžœä¸è§£å†³è¿™ä¸ªé—®é¢˜ï¼Œèµ„æºæµªè´¹æ˜¯å°äº‹ï¼Œé¡¹ç›®å»¶è¯¯ç”šè‡³æ–¹...

å‘å¸ƒæ—¶é—´ï¼š2026-07-01

ç”¨10%é¢„ç®—æ‹ŸåˆScaling Lawï¼šæ–°è®ºæ–‡å®žè¯ç»“æžœè§£è¯»

æœ€è¿‘ä¸€ç¯‡arXivè®ºæ–‡å¼•èµ·äº†AIè®ç»ƒåœˆçš„æ³¨æ„ã€‚Scaling LawåŽŸæœ¬æ˜¯å¸®åŠ©å®žéªŒå®¤è§„åˆ’å¤§è§„æ¨¡è®ç»ƒçš„å…³é”®å·¥å…·ï¼Œèƒ½é¢„æµ‹æ¨¡åž‹åœ¨æ›´å¤§ç®—åŠ›ä¸‹çš„è¡¨çŽ°ã€‚å¯é—®é¢˜æ˜¯ï¼Œæ‹Ÿåˆè¿™äº›è§„å¾‹æœ¬èº«å°±éœ€è¦è·‘å¤§é‡pilotå®žéªŒï¼Œæˆæœ¬åŠ¨è¾„ç™¾ä¸‡ç¾Žå…ƒçº§åˆ«ã€‚è®ºæ–‡ä½œè€…æŠŠè¿™ä¸ªé—®é¢˜è½¬åŒ–ä¸ºé¢„ç®—æ„ŸçŸ¥çš„åºè´¯å®žéªŒè®¾è®¡ï¼Œæå‡ºä¸€ç§ä¸ç¡®å®šæ€§æ„ŸçŸ¥çš„ä¸»åŠ¨é€‰æ‹©ç–ç•¥ï¼Œç»“æžœæ˜¾ç¤ºåœ¨å¤šä¸ªåŸºå‡†ä»»åŠ¡ä¸Šï¼Œåªç”¨æ€»é¢„ç®—çš„10%å·¦å³ï¼Œå°±èƒ½æŽ¥è¿‘ç”¨å…¨é›†æ•°æ®æ‹Ÿåˆçš„å¤–æŽ¨å‡†ç¡®çŽ‡ã€‚ è¿™ä»¶äº‹å¬èµ·...

å‘å¸ƒæ—¶é—´ï¼š2026-07-01

Scaling Lawæ‹Ÿåˆä¸çš„ç›†åœ°ä¼°è®¡ä¸Žä¸ç¡®å®šæ€§é™ä½Žï¼šç”¨10%é¢„ç®—å®žçŽ°æ›´å¥½å¤–æŽ¨

Scaling Lawæ‹Ÿåˆé•¿æœŸä»¥æ¥è¢«è§†ä¸ºå¤§æ¨¡åž‹è®ç»ƒå‰çš„å¸¸è§„æ¥éª¤ï¼Œå´è¶Šæ¥è¶Šæˆä¸ºé¢„ç®—é»‘æ´žã€‚å¾ˆå¤šäººä»¥ä¸ºï¼Œåªè¦å¤šè·‘å‡ ç»„pilotå®žéªŒï¼ŒScaling Lawçš„é¢„æµ‹å°±ä¼šæ›´å‡†ã€‚å¯çŽ°å®žæ˜¯ï¼Œç»„è£…ä¸€å¥—è¶³å¤Ÿä¿¡æ¯é‡çš„å®žéªŒé›†æœ¬èº«å°±å¯èƒ½è€—è´¹æ•°ç™¾ä¸‡ç¾Žå…ƒï¼Œå°¤å…¶å½“ç›®æ ‡æ˜¯å¤–æŽ¨åˆ°é«˜æˆæœ¬åŒºåŸŸæ—¶ã€‚ arXivä¸Šè¿™ç¯‡é¢˜ä¸ºã€ŠSpend Less, Fit Better: Budget-Efficient Scaling Law Fitti...

å‘å¸ƒæ—¶é—´ï¼š2026-07-01

AIè®ç»ƒé¢„ç®—åƒç´§æ—¶ä»£ï¼ŒScaling Lawæ‹Ÿåˆå¦‚ä½•â€œå°‘èŠ±é’±å¤šåŠžäº‹â€ï¼Ÿ

Scaling Lawä¸€ç›´æ˜¯AIä»Žä¸šè€…è§„åˆ’å¤§æ¨¡åž‹è®ç»ƒçš„æ ¸å¿ƒå·¥å…·ã€‚å®ƒå¸®åŠ©å›¢é˜Ÿæ ¹æ®å°è§„æ¨¡å®žéªŒå¤–æŽ¨å¤§è§„æ¨¡æ€§èƒ½ï¼Œé¿å…ç›²ç›®ç ¸é’±è·‘å®Œæ•´è®ç»ƒã€‚ä½†å¾ˆå¤šäººå¿½ç•¥äº†ä¸€ä¸ªçŽ°å®žé—®é¢˜ï¼šæ‹ŸåˆScaling Lawæœ¬èº«å°±å¯èƒ½çƒ§æŽ‰ç™¾ä¸‡ç¾Žå…ƒçº§åˆ«çš„é¢„ç®—ã€‚ æœ€è¿‘arXivä¸Šçš„ä¸€ç¯‡è®ºæ–‡ã€ŠSpend Less, Fit Better: Budget-Efficient Scaling Law Fitting via Active Expe...

å‘å¸ƒæ—¶é—´ï¼š2026-07-01

å¦‚ä»Šå¤§æ¨¡åž‹è®ç»ƒè¶Šæ¥è¶Šçƒ§é’±ï¼Œä¸€æ¬¡å®Œæ•´è®ç»ƒè·‘ä¸‹æ¥å¾€å¾€éœ€è¦æ•°ç™¾ä¸‡ç”šè‡³æ›´å¤šç¾Žå…ƒã€‚è€ŒScaling Lawæ‹Ÿåˆæ£æ˜¯ç”¨æ¥è§„åˆ’è¿™äº›å¤§è§„æ¨¡è®ç»ƒçš„å…³é”®å·¥å…·ï¼Œå®ƒé€šè¿‡å°è§„æ¨¡pilotå®žéªŒæ¥é¢„æµ‹æ›´å¤§æ¨¡åž‹çš„è¡¨çŽ°ã€‚å¯æ˜¯ï¼Œæ‹Ÿåˆè¿‡ç¨‹æœ¬èº«å°±å¯èƒ½è€—è´¹å·¨é¢é¢„ç®—ã€‚åœ¨é¢„ç®—ç´§å¼ çš„çŽ°ä»£å¤§æ¨¡åž‹å·¥ä½œæµä¸ï¼Œå¦‚ä½•ç»„å»ºä¸€å¥—æœ‰æ•ˆçš„ä¿¡æ¯ä¸°å¯Œçš„pilotå®žéªŒé›†ï¼Œå·²ç»ä»Žä¾‹è¡Œé¢„å¤„ç†æ¥éª¤å˜æˆäº†çœŸæ£çš„é¢„ç®—åˆ†é…éš¾é¢˜ã€‚ æœ€è¿‘arXivä¸Šçš„ä¸€ç¯‡è®ºæ–‡ç›´æŽ¥æˆ³ä¸äº†è¿™ä¸ªç—›ç‚¹ã€‚è®º...

å‘å¸ƒæ—¶é—´ï¼š2026-07-01

10%é¢„ç®—æ‹ŸåˆScaling Lawï¼šæ–°æ–¹æ³•è®©ç™¾ä¸‡çº§å®žéªŒé¢„ç®—ç¼©æ°´90%

ä½œè€…ä¿¡æ¯

æ–‡ç« çƒ­åº¦

10%é¢„ç®—æ‹ŸåˆScaling Lawï¼šæ–°æ–¹æ³•è®©ç™¾ä¸‡çº§å®žéªŒé¢„ç®—ç¼©æ°´90%

ä½œè€…ä¿¡æ¯

æ–‡ç« çƒåº¦