導(dǎo)讀:據(jù)媒體報(bào)道,AI教母李飛飛等斯坦福大學(xué)和華盛頓大學(xué)研究人員近日以不到50美元的云計(jì)算費(fèi)用訓(xùn)練了一個(gè)名叫s1的人工智能推理模型。該模型在數(shù)...
據(jù)媒體報(bào)道,“AI教母”李飛飛等斯坦福大學(xué)和華盛頓大學(xué)研究人員近日以不到50美元的云計(jì)算費(fèi)用訓(xùn)練了一個(gè)名叫s1的人工智能推理模型。該模型在數(shù)學(xué)和編碼能力測(cè)試中的表現(xiàn)與OpenAI的o1和DeepSeek的R1等尖端推理模型類(lèi)似。
s1誕生標(biāo)志著高效AI模型訓(xùn)練的新時(shí)代。研究人員表示,s1是通過(guò)蒸餾法由谷歌推理模型Gemini2.0FlashThinkingExperimental提煉出來(lái)的。這種方法的核心在于如何有效地傳遞知識(shí),使得小模型不僅具備大模型的推理能力,而且在資源消耗上表現(xiàn)得極為優(yōu)越。
李飛飛團(tuán)隊(duì)的這一突破,不僅展現(xiàn)了技術(shù)的前瞻性,而且為更多科研機(jī)構(gòu)和創(chuàng)業(yè)公司提供了借鑒的藍(lán)本。同時(shí),s1所展現(xiàn)出價(jià)格優(yōu)勢(shì)的背后,其實(shí)也反映了未來(lái)AI領(lǐng)域的一個(gè)重要趨勢(shì):大模型的訓(xùn)練和應(yīng)用將愈發(fā)平民化。
此前DeepSeek發(fā)布一系列DeepSeek-R1模型,探索了將R1的推理能力蒸餾到更小模型中的潛力,通過(guò)知識(shí)蒸餾技術(shù),成功將大模型的推理能力傳遞給小模型,實(shí)現(xiàn)了小模型在推理任務(wù)上的顯著提升,引領(lǐng)了小模型的發(fā)展方向。