岛国在线播放v片免费-岛国在线最新-第四色播日韩第一页-第四色视频-欧美在线黄-欧美在线观看你懂的

首頁  ?  新聞頻道  ?  國際新聞

新聞分析|全球科研團(tuán)隊競逐低成本AI模型研發(fā)新范式

2025-02-23 15:56:42

來源:新華網(wǎng)

  新華社北京2月23日電 新聞分析|全球科研團(tuán)隊競逐低成本AI模型研發(fā)新范式

  新華社記者彭茜

  美國斯坦福大學(xué)等機構(gòu)研究團(tuán)隊近日宣布,在基座大模型基礎(chǔ)上,僅耗費數(shù)十美元就開發(fā)出相對成熟的推理模型。盡管其整體性能尚無法比肩美國開放人工智能研究中心(OpenAI)開發(fā)的o1、中國深度求索公司的DeepSeek-R1等,但此類嘗試意味著企業(yè)可以較低成本研發(fā)出適合自身的AI應(yīng)用,AI普惠性有望增強。同時,其所應(yīng)用的“測試時擴(kuò)展”技術(shù)或代表一條更可持續(xù)的AI研發(fā)路徑。

  低成本玩轉(zhuǎn)高級推理

  美國斯坦福大學(xué)和華盛頓大學(xué)研究團(tuán)隊近日宣布研發(fā)出名為s1的模型,在衡量數(shù)學(xué)和編碼能力的測試中,可媲美o1和DeepSeek-R1等。研究團(tuán)隊稱,訓(xùn)練租用所需的計算資源等成本只需約幾十美元。

  s1的核心創(chuàng)新在于采用了“知識蒸餾”技術(shù)和“預(yù)算強制”方法。“知識蒸餾”好比把別人釀好的酒進(jìn)一步提純。該模型訓(xùn)練數(shù)據(jù)是基于谷歌Gemini Thinking Experimental模型“蒸餾”出的僅有1000個樣本的小型數(shù)據(jù)集。

  “預(yù)算強制”則使用了AI模型訓(xùn)練新方法——“測試時擴(kuò)展”的實現(xiàn)方式。“測試時擴(kuò)展”又稱“深度思考”,核心是在模型測試階段,通過調(diào)整計算資源分配,使模型更深入思考問題,提高推理能力和準(zhǔn)確性。

  “預(yù)算強制”通過強制提前結(jié)束或延長模型的思考過程,來影響模型的推理深度和最終答案。s1對阿里云的通義千問開源模型進(jìn)行微調(diào),通過“預(yù)算強制”控制訓(xùn)練后的模型計算量,使用16個英偉達(dá)H100 GPU僅進(jìn)行26分鐘訓(xùn)練便達(dá)成目標(biāo)。

  美國加利福尼亞大學(xué)伯克利分校研究團(tuán)隊最近也開發(fā)出一款名為TinyZero的精簡AI模型,稱復(fù)刻了DeepSeek-R1 Zero在倒計時和乘法任務(wù)中的表現(xiàn)。該模型通過強化學(xué)習(xí),實現(xiàn)了部分相當(dāng)于30億模型參數(shù)的大語言模型的自我思維驗證和搜索能力。團(tuán)隊稱項目訓(xùn)練成本不到30美元。

  “二次創(chuàng)造”增強AI普惠性

  清華大學(xué)計算機系長聘副教授劉知遠(yuǎn)接受記者采訪時說,部分海外研究團(tuán)隊使用DeepSeek-R1、o1等高性能推理大模型來構(gòu)建、篩選高質(zhì)量長思維鏈數(shù)據(jù)集,再用這些數(shù)據(jù)集微調(diào)模型,可低成本快速獲得高階推理能力。

  相關(guān)專家認(rèn)為,這是AI研發(fā)的有益嘗試,以“二次創(chuàng)造”方式構(gòu)建模型增強了AI普惠性。但有三點值得注意:

  首先,所謂“幾十美元的低成本”,并未納入開發(fā)基座大模型的高昂成本。這就好比蓋房子,只算了最后裝修的錢,卻沒算買地、打地基的錢。AI智庫“快思慢想研究院”院長田豐告訴記者,幾十美元成本只是最后一個環(huán)節(jié)的算力成本,并未計算基座模型的預(yù)訓(xùn)練成本、數(shù)據(jù)采集加工成本。

  其次,“二次創(chuàng)造”構(gòu)建的模型,整體性能尚無法比肩成熟大模型。TinyZero僅在簡單數(shù)學(xué)任務(wù)、編程及數(shù)學(xué)益智游戲等特定任務(wù)中有良好表現(xiàn),但無法適用于更復(fù)雜、多樣化的任務(wù)場景。而s1模型也只能通過精心挑選的訓(xùn)練數(shù)據(jù),在特定測試集上超過早期版本o1 preview,而遠(yuǎn)未超過o1正式版或DeepSeek-R1。

  最后,開發(fā)性能更優(yōu)越的大模型,仍需強化學(xué)習(xí)技術(shù)。劉知遠(yuǎn)說,就推動大模型能力邊界而言,“知識蒸餾”技術(shù)意義不大,未來仍需探索大規(guī)模強化學(xué)習(xí)技術(shù),以持續(xù)激發(fā)大模型在思考、反思、探索等方面的能力。

  AI模型未來如何進(jìn)化

  在2025年美國消費電子展上,美國英偉達(dá)公司高管為AI的進(jìn)化勾畫了一條路線圖:以智能水平為縱軸、以計算量為橫軸,衡量AI模型的“規(guī)模定律”呈現(xiàn)從“預(yù)訓(xùn)練擴(kuò)展”、到“訓(xùn)練后擴(kuò)展”,再到“測試時擴(kuò)展”的演進(jìn)。

  “預(yù)訓(xùn)練擴(kuò)展”堪稱“大力出奇跡”——訓(xùn)練數(shù)據(jù)越多、模型規(guī)模越大、投入算力越多,最終得到AI模型的能力就越強。目標(biāo)是構(gòu)建一個通用語言模型,以GPT早期模型為代表。而“訓(xùn)練后擴(kuò)展”涉及強化學(xué)習(xí)和人類反饋等技術(shù),是預(yù)訓(xùn)練模型的“進(jìn)化”,優(yōu)化其在特定領(lǐng)域的任務(wù)表現(xiàn)。

  隨著“預(yù)訓(xùn)練擴(kuò)展”和“訓(xùn)練后擴(kuò)展”邊際收益逐漸遞減,“測試時擴(kuò)展”技術(shù)興起。田豐說,“測試時擴(kuò)展”的核心在于將焦點從訓(xùn)練階段轉(zhuǎn)移到推理階段,通過動態(tài)控制推理過程中的計算量(如思考步長、迭代次數(shù))來優(yōu)化結(jié)果。這一方法不僅降低了對預(yù)訓(xùn)練數(shù)據(jù)的依賴,還顯著提升了模型潛力。

  三者在資源分配和應(yīng)用場景上各有千秋。預(yù)訓(xùn)練像是讓AI模型去學(xué)校學(xué)習(xí)基礎(chǔ)知識,而后訓(xùn)練則是讓模型掌握特定工作技能,如醫(yī)療、法律等專業(yè)領(lǐng)域。“測試時擴(kuò)展”則賦予了模型更強推理能力。

  AI模型的迭代還存在類似摩爾定律的現(xiàn)象,即能力密度隨時間呈指數(shù)級增強。劉知遠(yuǎn)說,2023年以來,大模型能力密度大約每100天翻一番,即每過100天,只需要一半算力和參數(shù)就能實現(xiàn)相同能力。未來應(yīng)繼續(xù)推進(jìn)計算系統(tǒng)智能化,不斷追求更高能力密度,以更低成本,實現(xiàn)大模型高效發(fā)展。

  • 相關(guān)閱讀
  • 中企承建的以色列最大抽水蓄能電站投入商業(yè)運行

      新華網(wǎng)耶路撒冷2月23日電(記者王卓倫 陳君清)經(jīng)過對兩臺172兆瓦抽水蓄能機組168小時的運行調(diào)試及復(fù)雜的驗收審批流程,由中國電力建設(shè)股份有限公司(簡稱“中國電建”)承建的以色列規(guī)模最大的抽水蓄能電站項目21...

    時間:02-23
  • 尼日利亞中部交通事故造成至少14人死亡

      新華社阿布賈2月23日電(記者楊喆)尼日利亞警方23日說,尼日利亞中部尼日爾州22日發(fā)生車輛相撞事故,造成至少14人死亡、6人受傷。  尼日爾州交警部門負(fù)責(zé)人說,22日下午,一輛客車在該州一條高速公路上試...

    時間:02-23
  • 《哪吒2》在斐濟(jì)上映 預(yù)售火爆臨時加映

      新華社蘇瓦2月23日電(記者郭鑫惠)斐濟(jì)首都蘇瓦市達(dá)莫達(dá)爾影院市場部經(jīng)理克利夫22日接受新華社記者采訪時表示,中國動畫電影《哪吒之魔童鬧海》(以下稱《哪吒2》)自20日在蘇瓦上映以來,票房表現(xiàn)出色,上座率超出預(yù)...

    時間:02-23
  • 武契奇最新表態(tài):沒有中國朋友 塞許多工程無法啟動

      塞爾維亞總統(tǒng)武契奇22日出席中企承建的“多瑙走廊”快速路項目主線部分路段通車儀式時說,這條為波扎雷瓦茨輸送投資的“動脈”通車后,將大幅提高整個地區(qū)的投資和旅游吸引力。  由山東高速集團(tuán)承...

    時間:02-23
  • 德國聯(lián)邦議院選舉投票開始

      2月23日,在德國北萊茵-威斯特法倫州阿恩斯貝格,選民在一處投票站投票。新華社記者 張帆 攝  新華社柏林2月23日電(記者邰思聰 李超)德國新一屆聯(lián)邦議院(議會下院)選舉投票于當(dāng)?shù)貢r間23日8時正式開始。...

    時間:02-23
  • 全球連線 | 40天1004公里 他們徒步穿越塔克拉瑪干

      近日,職業(yè)徒步者周揚和張治國完成一項壯舉,他們以全自助方式徒步40天,由東往西橫穿“死亡之海”塔克拉瑪干沙漠,總距離達(dá)1004公里,期間他們克服沙塵暴、寒潮、脫水等多重困難。周揚說他為這次穿越塔克拉瑪干沙...

    時間:02-23
  • 特朗普要馬斯克“更強勢” 馬斯克逼聯(lián)邦雇員交周報

      新華社華盛頓2月22日電(記者熊茂伶)美國總統(tǒng)特朗普22日要求政府效率部負(fù)責(zé)人埃隆·馬斯克“更強勢”。隨后,馬斯克要求所有聯(lián)邦雇員回復(fù)電子郵件匯報上周的工作進(jìn)展,并表示不回復(fù)郵件的人將被視為辭職。  特朗普當(dāng)...

    時間:02-23
  • 以借口“羞辱性儀式”推遲釋放巴方人員

      新華社北京2月23日電 巴勒斯坦伊斯蘭抵抗運動(哈馬斯)22日釋放6名以方被扣押人員后,以色列方面卻以哈馬斯釋放以方被扣押人員時舉行“羞辱性儀式”為由,未按照約定于當(dāng)天釋放600多名巴方在押人員。哈馬斯指責(zé)以色列公...

    時間:02-23
  • 舞獅少年 火到海外

      不久前,在英國倫敦舉行的2025年“四海同春”新春文化慶典活動上,由四川天府第七中學(xué)北獅隊一群平均年齡15歲的少年表演的節(jié)目“蜀獅幻變”驚艷四座。2017年成立的北獅隊,是天府第七中學(xué)組建的107個社團(tuán)之一...

    時間:02-23
免責(zé)聲明:本網(wǎng)對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。 本網(wǎng)站轉(zhuǎn)載圖片、文字之類版權(quán)申明,本網(wǎng)站無法鑒別所上傳圖片或文字的知識版權(quán),如果侵犯,請及時通知我們,本網(wǎng)站將在第一時間及時刪除。
主站蜘蛛池模板: 日韩经典精品日韩第一页| 小泽玛利亚久久| 国产伊人免费视频| 国产三级级精品九九| 乱子伦一区二区| 人妻精品久久无码专区84| 欧美乱偷一区二区三区在线| 蜜桃精品人妻一区二区二| 日本v韩国v国产v综合一区| 欧美日韩一区自| 三级片免费国产片午夜在线观看中文字幕| 中文成人字幕aV| 亚洲老色鬼精品网站在线观看| 99热久久久无码国产精品桃色| 国产精品国产免费无码专区不卡| 国产精品久久久久久久久久清纯 | 青青人亚洲AV永久无码精品无| 午夜精品无码免费| 亚洲欧美一区二区三区精品| 四虎成人日韩AV| 嫩草影院男人无码日本| 继攵女乱h在视频线观看| 九九九九精品九九九九| 蝌蚪窉成人精品视频51| 国产字幕无码精品久久| 黑人,人妻,久久| 波多野结衣一级影片| 一级一级一级毛片免费视频| 无码精品一区二区久久久,中文字一区 | 欧美一二区久久小说| 日本高清无码福利| 久久久无码人妻系列视频| 美脚丝袜91一区二区三区在线观看 | 国产又爽 又黄 免费网站| 999精品国产美女| 无码人妻av一区二区三区用会员| 欧美精品一区二区视频| 国产午夜乱码人妻一区二区三区| 53iucim日韩第二页| 一起看A片中文字幕视频 | 国产熟女精品网站|