從開源神話到災難現場:Meta AI帝國如何在一年內搞砸Llama 4?

從開源神話到災難現場:Meta AI帝國如何在一年內搞砸Llama 4?

2025年10月底,Meta AI宣布裁員600人,核心研究總監、AI業務高管紛紛出走或被邊緣化,連圖靈獎得主Yann LeCun的處境都一度被認為岌岌可危。這則消息令人震驚——執行長祖克柏(Mark Zuckerberg)一方面用數億美元年薪瘋狂挖角AI人才,另一方面卻又如此果決地裁員,這矛盾行為背後究竟隱藏著什麼?我們訪問了前FAIR研究總監、Meta AI科學家田淵棟、參與Llama 3訓練的前Meta員工Gavin Wang,以及矽谷資深HR專家,試圖還原Meta Llama開源路線圖的驚天逆轉。為何曾驚艷世界的Llama 3,僅僅一年後的Llama 4卻淪為一場災難?Meta的開源路線,是否從一開始就注定是個錯誤?

2013年底,祖克柏開始組建Meta的AI團隊。當時,他邀請了AI三巨頭之一的Yann LeCun來領導AI發展。LeCun加入時提出了三個條件:不從紐約搬家、不辭去紐約大學的教職、以及「必須進行開放式研究,公開發表所有工作,並開源程式碼」。這奠定了Meta AI最初的開放基因。

LeCun隨後成立了基礎AI研究實驗室(FAIR Labs),專注於前沿探索,研究那些當下可能沒有重大應用,但未來可能引領突破的新思想、演算法與模型架構。然而,Meta的最終目標是將AI應用於產品。因此,一個名為「生成式AI」(GenAI)的部門應運而生,與FAIR並行。GenAI負責將FAIR的研究成果產品化,其中最關鍵的項目就是Llama模型。

理想狀態下,這是一個完美的平衡: - FAIR:專注前沿研究,追求通用人工智慧(AGI),產出突破性想法。 - GenAI:將FAIR的成果工程化、產品化,整合進Meta的應用中,創造商業價值。

前Meta AI科學家田淵棟回憶道:「我認為從我加入到2022年,FAIR都非常快樂。因為大語言模型出現後,算力成為關鍵因素,矛盾也隨之而來。每個人都想訓練一個非常大的模型,但GPU資源有限,僧多粥少,2023年之後的情況肯定不如以前了。」這個曾經的烏托邦,其前提是Meta的AI模型必須始終保持在開源領域的領先地位,然而這座理想的天秤,很快就失去了平衡。

Llama的榮光歲月:從奠基到巔峰

Llama系列的崛起,是Meta在AI領域最輝煌的篇章。

Llama 1 (2023年2月):奠定「小參數、高效能」的基礎。當時發布的13B模型,在多項基準測試上超越了175B參數的GPT-3。雖然官方僅供研究申請,但其權重在一周後被「意外洩漏」,反而點燃了整個開源社群的熱情,催生了無數的微調專案。這也讓「權重開源」(Open Weights)成為主流,意即公開模型訓練後的參數文件,而非完整的訓練數據與程式碼。

Llama 2 (2023年7月):與微軟聯手,宣告商業化可行。Llama 2不僅免費且可商用,徹底改變了行業格局。開發者不再受制於OpenAI的API速率限制,也不用向客戶解釋為何要按量付費。它迫使其他封閉模型巨頭變得更加開放,樹立了新的行業標準。

Llama 3 (2024年4月-9月):Meta的巔峰時刻。在短短半年內,Meta以「光速」迭代,接連發布了Llama 3 (8B, 70B)、Llama 3.1 (405B),以及針對終端設備的Llama 3.2 (1B, 3B)。其中405B版本被譽為「全球最強的開放可用基礎模型之一」,能力上極大拉近了與封閉模型的差距。

曾參與Llama 3團隊的Gavin Wang表示:「當時的感覺是,我們不僅在做一份工作,而是在真正支持AI最前沿的發展。每件事都非常有意義。我當時非常自豪,出去跟一些新創公司的創辦人說我在Llama 3團隊,他們都會說謝謝你們的努力。整個科技圈,特別是AI新創圈,都指望著Llama。」

滑鐵盧時刻:Llama 4的災難性潰敗

在Llama 3的巨大成功後,祖克柏對Llama 4寄予厚望,他曾公開表示:「我們Llama 3的目標是讓開源模型與最強的專有模型競爭,而Llama 4的目標是超越它們。」

然而,2025年4月5日發布的Llama 4,卻成了一場徹頭徹尾的災難。 Meta宣稱Llama 4在多模態和長文本能力上實現了巨大飛躍,並在宣傳中高調引用其在LMArena排行榜上僅次於Gemini 2.5 Pro的第二名成績。

但開發者社群的反饋卻極為負面,認為其性能遠低於預期。隨後,市場傳言四起,指控Meta在LMArena上提交的是一個經過對話增強訓練的「特調版」,涉嫌「作弊刷榜」,導致過擬合。儘管Meta高管迅速否認,但負面影響已無法挽回。媒體普遍將其視為一場「掛羊頭賣狗肉」的騙局,更先進的Behemoth版本也因此延遲發布,最終不了了之。

崩潰的內幕:產品導向如何壓垮前沿研究?

Llama 3到Llama 4之間,到底發生了什麼?答案是那座理想的天秤徹底失衡了。

隨著Llama 3的成功,Meta高層越來越強調「將AI用於自家產品」。2024年1月,Meta進行了一次重組,FAIR的兩位領導者被要求直接向Meta的產品長(CPO)Chris Cox匯報。這標誌著「產品優先」的戰略徹底壓倒了「研究優先」。

當時的領導層,包括祖克柏和CPO,認為LLM的價值必須從產品能力開始。因此,Llama 4的路線圖規劃完全集中在「產品整合」上,例如多模態能力,卻嚴重忽視了模型最核心的「推理能力」。一位受訪者指出:「公司許多中高層,如副總裁和高級總監,都是傳統基礎設施或電腦視覺背景,對大型語言模型缺乏深刻的理解。真正懂的人,反而是那些在一線工作的學術研究型博士。」

就在Meta埋頭於多模態工程時,外部世界風雲突變: - 2024年9月:OpenAI推出基於思維鏈(Chain of Thought)的o1系列模型。 - 2024年12月:中國的DeepSeek開源模型橫空出世,採用MoE(混合專家架構),在保持強大推理能力的同時大幅降低成本。

這些技術突破打了Meta一個措手不及。事實上,以田淵棟為首的FAIR科學家早已在進行思維鏈研究,但這種前沿探索並未及時傳遞給Llama的工程團隊。當DeepSeek引發轟動後,Meta高層才如夢初醒,臨時將田淵棟的FAIR團隊調去支援Llama 4,「救火式」地進行優化。

田淵棟對此深有感觸:「我學到一個很大的教訓是,你不能讓不懂的人來當這種項目的領導或是做規劃的人。如果出問題,大家應該一致同意那個時間點不能發布,應該往後延。但高層批准的死線(deadline)壓力非常大。」在極度緊迫的時程下,團隊成員疲憊不堪,甚至有人凌晨三點還在跨時區開會。最終,品質大幅下滑,災難已不可避免。

祖克柏的最後賭注:28歲的Alex Wang空降掌權

Llama 4的失敗,迫使祖克柏採取了極端手段。他收購了Scale AI,並將其年僅28歲的創辦人Alex Wang空降至Meta,領導全新的AI架構。

這次重組堪稱一場權力大洗牌: - Alex Wang帶領數十位高薪挖來的頂尖研究員,組建了一個名為「TBD」的特權小組。 - TBD、FAIR、GenAI共同組成「Meta超級智能實驗室」(MSL),直接向Alex Wang匯報,而Alex Wang則直接向祖克柏匯報。 - 這意味著,Yann LeCun現在需要向這位28歲的年輕人匯報。原GenAI負責人Ahmad被邊緣化,CPO Chris Cox也被排除在AI團隊的直接領導之外。

Alex Wang的空降在Meta內部引發了巨大爭議,TBD團隊享有「三年無績效考核」、「可無視所有VP訊息」等無限特權,引發了資深研究員的強烈不滿。但這場豪賭,或許是祖克柏贏得AI競賽的最後機會。Alex Wang提出了三大改革方向:強化核心基礎研究、加強產品與模型整合、建立統一的核心基礎設施團隊。這既是修正,也是集權。

Meta的故事,讓人想起貝爾實驗室、IBM華生研究中心等那些因無法平衡前沿研究與商業化而衰落的傳奇機構。FAIR曾是AI科學家的烏托邦,如今卻幾乎成為商業化的又一個犧牲品。祖克柏的這場豪賭能否讓Llama重回巔峰,或許很快就會有答案。

參考資料: https://www.youtube.com/watch?v=0mrko3cYqBs

Read more

長春藤名校只收百萬富翁?AI 將淘汰 80% 的不適任教師?三位專家的震撼預言

長春藤名校只收百萬富翁?AI 將淘汰 80% 的不適任教師?三位專家的震撼預言

在一場關於 AI 與教育未來的深度對談中,Minerva 大學創辦人 Ben Nelson、史丹佛大學未來實驗室的 Isabelle Hau,以及資深教育家 Esther Wojcicki 揭示了教育體系面臨的巨大挑戰與變革。他們不僅探討了 AI 作為個人化導師的潛力,更毫不留情地揭露了現行教育系統中的「魔鬼交易」,並預言在 AI 時代,傳統學位價值將崩潰,甚至高達 80% 的教師可能面臨被淘汰的殘酷現實。 Esther Wojcicki 興奮地指出 AI 的最大潛力在於成為「每個學生的專屬家教」。她說:「學生可以反覆提問,不必擔心自己看起來很笨,並且能立刻得到答案。我認為所有老師都應該在課堂上使用 AI 作為輔助導師。」 然而,Ben Nelson 提出了截然不同的警告,他稱之為教育界的「魔鬼交易」。他一針見血地指出:「老師或教授與學生之間存在一種心照不宣的默契,那就是雙方做得越少,彼此就越開心。而

By andy
Spotify收購的男人揭露:AI正讓那些「不可能」的消費型創業起死回生

Spotify收購的男人揭露:AI正讓那些「不可能」的消費型創業起死回生

前Lightspeed Ventures合夥人、Podcast平台Anchor創辦人Mike McNano,在Y Combinator的最新訪談中,深入剖析了AI如何徹底顛覆消費性新創的遊戲規則。McNano不僅是將Anchor成功出售給Spotify的創業家,更是投資了Neurolink、xAI、Suno等傳奇公司的頂尖投資人。他指出,過去十年,許多消費性產品的創業點子因技術限制、發行困難而被判了死刑,但AI的出現,正讓這些「不可能」的機會起死回生。 McNano以他投資的爆紅AI音樂生成應用Suno為例,闡述了AI如何打破創意產業的舊有壁壘。他回憶道:「在AI出現之前,沒有任何技術能真正降低音樂創作的門檻。相機讓攝影普及,麥克風讓Podcasting普及,但音樂創作始終是專業人士的領域。」 Suno的核心理念,就如同當年的Instagram之於攝影。Instagram不僅讓人們能輕鬆拍出好看的照片,更提供了一個發行渠道。Suno則利用AI達成了同樣的目標:「現在有了AI,任何人都能創作音樂。」 McNano觀察到一個前所未見的用戶行為:「人們正在為自己創作音樂,然後自己

By andy
Google AI產品主管親身示範:如何在20分鐘內,用AI完成市場研究、規格書、原型到行銷影片!

Google AI產品主管親身示範:如何在20分鐘內,用AI完成市場研究、規格書、原型到行銷影片!

Google AI 產品主管 Marilyn Nika,一位在AI領域深耕多年的專家,親身揭示了一套顛覆傳統的產品管理工作流程。當眾多AI工具如雨後春筍般湧現時,她思考的不是AI是否會取代PM,而是「如何成為一名『AI賦能的產品經理』?」她利用一個「智慧冰箱」的 hypothetical 案例,展示如何在短短20分鐘內,完成過去需要數週才能完成的市場研究、產品規格書(PRD)、互動原型,甚至是行銷影片的完整流程,徹底改變了產品開發的遊戲規則。 傳統上,產品經理進行市場研究,需要依賴公司的用戶研究部門(UXR)或聘請外部機構,過程耗時且成本高昂。然而,Nika展示了如何利用 AI 工具 Perplexity 在幾分鐘內洞察全球用戶的想法。 她分享了一個獨特的技巧:不僅僅是搜尋網路,而是專門篩選「Reddit」上的討論與意見。她下的指令是:「家庭用戶會對智慧冰箱感興趣嗎?」AI迅速整理出正反兩方的觀點、常見疑慮和採用的障礙。 但真正的精髓在於下一步。Nika 指示 AI:「創造兩個代理人,

By andy
馬斯克驚天預言:3年後通縮,20年內工作消失,金錢將被「能源」取代!

馬斯克驚天預言:3年後通縮,20年內工作消失,金錢將被「能源」取代!

伊隆·馬斯克 (Elon Musk) 在一場深度訪談中,再次拋出了足以顛覆我們對未來所有想像的震撼觀點。這場對話不僅僅是關於科技,更是對人類文明未來走向的全面預測。從人工智慧(AI)將如何終結傳統工作,到金錢體系的徹底瓦解,再到我們可能身處的「模擬現實」,馬斯克描繪了一幅既令人興奮又充滿挑戰的未來藍圖。 當被問及社會從週休二日走向三日的趨勢時,馬斯克的回答遠超於此。他斷言,這場變革將是根本性的:「我的預測是,在不到20年的時間裡,工作將成為一種選擇(optional)。」他甚至認為,這個時間點可能縮短至10到15年。 這背後的核心驅動力是AI與機器人技術的指數級發展。馬斯克形容這是一場「超音速海嘯」(supersonic tsunami),其帶來的生產力提升將達到前所未有的高度。未來社會將不再是我們熟悉的「全民基本收入」(UBI),而是「全民高收入」(UHI, Universal High Income)。 他解釋道:「未來,工作將會像一種嗜好。就像今天你可以選擇在自家花園種菜,也可以去商店購買一樣。這將是一種選擇。」在這個世界裡,AI和機器人將滿足人類所有的商品和服務需求

By andy