田忌賽馬大家都知道吧?哎,如果現在出現一個情況,就是你的上等馬已經被我的劣等馬(某金融公司的低成本副業)贏了,那怎麽辦?答案就是——不如重開吧。
1月27日,深度求索(DeepSeek)發布了最新的AI開源模型,性價比完爆ChatGPT,直接驚掉了整個矽谷和華爾街的下巴。所以你是在跟我說,一個金融公司的副業,用了幾十分之一成本,就超越了全國總龍頭(也就是openAI)?!哎,沒錯!不僅如此,好戲才剛剛開始!大家好,歡迎來到NAI熱投。今天我們就來嘮嘮最近卷起AI大風暴的小小模型——Deepseek。Deepseek這個模型啊它是開源的,而GPT是閉源的。開源就是我的操作方式方法都分享給大家,大夥一起攜手進步,而閉源一般就是準備圈地美美收租了,封閉技術嘛,下一步就是盈利。但閉源的前提是你模型世界第一,沒有第二家可以選,這樣你閉源人家才會繼續付費用給你嘛。這下倒好,Deepseek不僅開源,而且開源的程度幾乎完全透明:R1模型直接甩網上隨便下載,連訓練論文都公開,代碼權重全放出來,潛臺詞就是:不開源你怎麽知道我厲害?這一波操作,看似是技術上的慷慨解囊,實則是對美國金融市場的降維打擊。這OpenAI辛辛苦苦燒錢堆出來GPT,本想靠技術壟斷和股市泡沫大賺一筆,結果DeepSeek一開源,水平又那麽高,直接讓OpenAI的護城河變成了公共遊泳池,誰都能在池裏撒泡尿。反差感也是包有的,Deepseek(深度求索)來自一家名不見經傳的中國杭州公司。你說說看,這簡直幾乎把所有爽文該有的東西都拉滿了。
現在從斯坦福到麻省理工,DeepSeek幾乎一夜之間就成了美國頂尖大學研究人員的首選模型啊。矽谷已經炸了鍋,集體被端掉金飯碗的風險太大了。你說月薪三千失業了,咱大不了去開滴滴,月薪三百萬失業,我能開什麽滴滴補回來啊?Deepseek就像一柄利劍直插AI泡沫的核心,周一一舉掀翻了全體美國科技股。英偉達這艘最大的航空母艦直接被擊沈17個點,跟班小弟AMD也暴跌百分之六,AI領域的衍生品也受到重創。這個美股股民是一片哀嚎啊……哎,停!美股蒸發萬億美元不假,慘也確實慘,不過咱們也不要搞錯了,DeepSeek和這些市值下滑科技公司都沒有競爭關系。即便有競爭關系,一個初創公司也不可能對矽谷的巨無霸公司產生如此強烈的影響。例如英偉達,英偉達是幹什麽的?是賣鏟子的。DeepSeek也需要向英偉達買鏟子,越厲害越要買更多的鏟子。所以大家也不要高估DeepSeek的影響力,它爆紅本身是可以拉擡英偉達股價的,但它影響有限,正向賦能呢抵不過英偉達的其它負面預期,導致拉擡失效。
啊這時候就要有人問了,這個深度求索Deepseek真的這麽厲害?能改變全世界AI的發展格局?話不要說的這麽滿,事情分為宏觀和微觀兩塊,我們一個個說。首先宏觀層面,我們先達成個共識,就是AGI不會短期內實現——起碼十年以上,不會有一個全知全能的AGI模型出現。其次,訓練模型的主要成本在於預訓練階段,後訓練階段只占算力成本的10%不到。DeepSeek的這個最新模型V3開創了一種新範式,追逐理想的公司去訓練更大更好的模型,然後開源出來給各個行業利用,蒸餾各個領域的專用模型。具體的業務在這個基礎上做微調,做定製化和工程落地。而目前這樣的格局形成的最大可能在中國手上,真要如此的話中國的全產業鏈優勢也因此得以充分發揮。大夥要明白一件事啊,傳統大模型的運行需要巨量的算力,隨著美國對華算力製裁的加強,以後國內想從正規渠道獲取大量高性能算力卡是非常困難的。雖然Deepseek現在沒什麽顛覆性的手段,但是未來萬一掌握了某種非常高效的優化,那中國算力效率會連跳幾個臺階,到時候真的稱得上是「國運之光」這一名號了。
我們現在聚焦到微觀層面,來看看Deepseek這個模型到底如何。之前講過了啊,Deepseek一是中國本土特產,二是完全開源,這兩點給它本身上了不小的光環,也讓它跟「中美對賬」「中國國運」這些比較誇張的詞聯系到一起。但是大家千萬不要以為它就已經在技術層面超越GPT,Claude等大只佬登頂世界了,它采用的算法還是曾經OpenAI的開源PPO深度學習算法叠代,也就是站在「巨人」的肩膀上!Deepseek強調的是性價比,性能極度優越的同時成本極度低廉,在一眾開源模型裏領跑,但還到不了開宗立派的程度。具體Deepseek的用戶體驗大家可以去谷歌百度自行搜索啊,我們這裏就不多形容了,這裏就來看幾張圖。在數學與代碼方面,DeepSeek在MATH 500、Codeforces 這些任務上的表現尤其亮眼,遙遙領先!長文本處理能力方面,它在 DROP、FRAMES等測評中的表現也與主流模型非常接近。值得一提的是,它在中文測評中表現非常出色,體現了咱們中國團隊的優勢。不過,DeepSeek還不夠全面,它的功能相比主流模型更加單一,不會畫圖,也不能幫你生成PPT。同時,還有一些短期內根本無法解決的硬傷:市場容量小,硬件仍然限製於英偉達的芯片,技術不成熟。高端技術需要大量研發投入,訓練模擬,是一個長期改進和完善的過程。彎道超車可能性存在,但在特別嚴謹的行業領域裏,沒有較多鋪墊和積累,基本不存在這情況。咱們老實評價,Deepseek仍是「半成品」。在系統架構、精密度、準確率等方面,與國外較成熟產品仍有一定差距。
最後呢,話也說回來了。性價比都做到這個份上了,還要啥自行車,也許人家壓根兒也沒想做成一個「大而全」的模型,沒那個必要。除了模型本身的優秀,這次DeepSeek之所以這麽出圈,與它背後年輕的中國團隊也有很大的關系。雷軍開千萬年薪挖DeepSeek研究員羅福莉的傳聞大家應該都在小紅書上或多或少見過。DeepSeek的團隊都是中國本地各大高校的應屆生,甚至是在讀生,比如為MLA架構做出了關鍵創新的高華佐和曾旺丁,分別來自北大物理系和北郵。DeepSeek的創始人梁文鋒說,團隊主要看能力而非經驗,鼓勵自然分工和資源靈活調配。
所以,Deepseek到底有多猛?頂級性價比,國產大模型,開源超閉源,年輕團隊。即便現在已經火的不正常了,但不得不說DeepSeek現在深度擁抱「強化學習」,潛力十足,不會被輕易捧殺。27日周一,蘋果App Store中國區顯示DeepSeek已經成為第一了。這波啊,真的就是讓業界的AI大佬倍感壓力。中美之間的 AI 差距已經驟然縮小,2025年才剛剛開始呢!下一代Deepseek3.5或許真能追上o1,嘿嘿到時候我就把gpt會員停了。
更多精彩內容,盡在NAI500全新中文頻道 – NAI熱投!