- +1
英偉達的護城河

前幾天,一個炒股的朋友跑來問我:“英偉達是不是不行了?像是四面楚歌了。谷歌有TPU,OpenAI有Triton,華為有昇騰,AMD也在后面追著喊‘兄弟,等等我’?!?/p>
我說你先別急著替英偉達寫悼詞。你這問題,暴露了一個常見毛?。汉芏嗳税选白o城河”理解成知識產(chǎn)權、渠道、品牌、規(guī)模、網(wǎng)絡效應、用戶認知——這些都對,但在硬科技領域,它們往往只是“表面那層漆”。真正能擋人的,是一種不體面、沒有浪漫氣息、寫出來甚至有點像在給加班洗白的東西:工程積淀。
工程積淀是什么?
它不是某個天才的靈光一現(xiàn),更不是一紙專利。它更像是:你在一條路上走了二十年,沿途遇到幾十萬個坑。每個坑都不大,但都很貴、很煩、很臟。你填完一個坑,前面又冒出一個坑。你一邊填坑一邊罵街,一邊還得保證車繼續(xù)跑。最后這條路就成了高速公路——別人也想走,但他們要先把二十年的坑補齊。
這類東西有兩個特點:數(shù)量巨大,無法預測。
所以它很難被“鈔能力”瞬間復制。錢能買人,能買設備,能買流量,但買不到“曾經(jīng)踩過的坑”。這就像健身:你可以買蛋白粉,買私教,買器械,但你買不到別人已經(jīng)流過的汗。你甚至可以買到別人的汗——也沒用。
我們可以通俗地叫它“微創(chuàng)新”,但是它有兩個特點:數(shù)量巨大,無法預測。這意味著這類創(chuàng)新,幾乎只能通過實踐和時間長出來。英偉達如此,ASML、ARM也是如此。就像ARM一樣,指令集理論大家都知道,但是,要性能,要穩(wěn)定,要低功耗,只有ARM做得到。
英偉達的護城河里,最硬的兩塊石頭,大概是:CUDA和NVLink(以及它背后的整套集群網(wǎng)絡能力)。
先說CUDA。
CUDA最大的優(yōu)勢不是“先進”,而是“習慣”。習慣這東西很要命。你要讓全世界工程師換生態(tài),就像你要讓全世界改用一種新筷子——它也許更符合人體工程學,但大家已經(jīng)用舊筷子夾了二十年花生米。CUDA經(jīng)過二十年積累,形成了一套從編譯器、驅動、庫、算子到框架適配的“工程宇宙”。你以為你在買顯卡,其實你在買一個東西:跑起來的確定性。
工程師最怕的不是難,而是“難還沒意義”。他愿意為模型效果熬夜,但不愿意為了裝驅動熬夜。你讓他調參,他眼睛發(fā)光;你讓他配環(huán)境,他就會思考人生是不是該出家。
你隨便找個開源項目,很多都是PyTorch+CUDA。用英偉達,通常是:gitclone,pipinstall,回車,然后你就可以去泡咖啡——有時候連咖啡都不用泡,報錯會幫你醒腦。
不用英偉達呢?你會獲得一個“深度參與工程史詩”的機會:
第一天:裝驅動。
第二天:編譯依賴。
第三天:某個算子沒實現(xiàn)。
第四天:你寫了個替代版本,速度慢得像在用算盤訓練大模型。
第五天:老板問你“為什么還沒結果”,你說“我在和宇宙進行兼容性談判”。
這時候你會明白:英偉達賣的不是卡,是不折騰的權利。
再說NVLink和網(wǎng)絡那一套。
很多人看GPU只看單卡算力,這就像評價一個軍隊只看單兵格斗。訓練大模型不是單挑,是群毆,而且是那種“上萬個人要同時聽懂同一句口令”的群毆。單卡再猛,如果集群通信像村口小路堵車,你照樣跑不動。英偉達靠NVLink,再加上Mellanox那套網(wǎng)絡交換能力,把大量GPU變成一個能協(xié)同工作的整體。它不是簡單把顯卡堆在一起,而是給它們裝了神經(jīng)系統(tǒng)。
AMD這些年單卡確實追得很兇,這很好。但大規(guī)模集群這事,像寫一本長篇小說:你不能只寫好開頭就宣布自己贏了。《紅樓夢》最難的從來不是開篇,是你寫到八十回還能不崩。
那么,對手們有沒有機會?當然有。世界又不是只有一個主角,主角也會掉頭發(fā)。
谷歌TPU很強,但它的強有點像“自家廚房的神鍋”——特別適合谷歌的菜系。你在外面想買一口回來做飯,往往沒那么順。它更多是體系內優(yōu)勢,不是“廣泛可得、隨手可用”的大眾生態(tài)。
OpenAI的Triton很有野心,想做一種“萬能翻譯官”,讓你寫一次代碼,到處都能跑。聽起來很美,像世界語。問題是:理想世界里大家講世界語,現(xiàn)實世界里大家講英語——因為英語已經(jīng)形成了偷懶的規(guī)模優(yōu)勢。工程師的信仰不是“公平”,是“省事”。他寫代碼是為了跑模型,不是為了參與語言學實驗。
AMD的策略是“便宜大碗”。這也對,甚至很可能越來越對。但它現(xiàn)在經(jīng)常給人的感覺是:你買到的是一臺發(fā)動機很猛的車,變速箱、維修體系、加油站網(wǎng)絡還在建設中。你問銷售:“這車怎么樣?”他告訴你:“馬力真大。”你再問:“那我能從新加坡開到吉隆坡嗎?”他沉默了一下,回答說:“理論上可以?!?/p>
這就是工程積淀的殘酷:有些路必須一步一步走。
你可以加快,但不能跳過。就像生孩子——哪怕你是世界首富,雇最好的醫(yī)生,甚至雇十個孕婦,你也沒法在一個月里把孩子生出來。時間這東西很討厭,但它同時也是最可靠的護城河:它不接受辯論,只接受發(fā)生過。
有人說,AI芯片終將商品化。拉長時間看,大概率是對的。
但還有個更大的事實經(jīng)常被忽略:訓練側被擠壓,反而會把推理側抬起來;而推理側的需求很可能遠超訓練側。工業(yè)制造、具身智能、電動汽車、軍事防務、家庭智能中心……這些不是“互聯(lián)網(wǎng)應用”,它們更像把現(xiàn)實世界一寸一寸搬進計算里。你可以把它叫“物理世界自動化”。這塊蛋糕足夠大,大到你很難只用“訓練芯片會不會商品化”來判斷輸贏。
所以,我更愿意這么收束:英偉達的護城河,表層是CUDA、NVLink、生態(tài)慣性;深層是它二十年“填坑”的復利——而黃仁勛的厲害之處在于,他一直知道自己在填的不是某個坑,而是一條路。
你要短期打敗英偉達,不只是做出一張更快的卡。你得做出一種新的人類:不怕裝驅動,不怕編譯,不怕報錯,最好還喜歡寫算子。如果真有這種人類出現(xiàn),英偉達才算遇到天敵。
但我懷疑,人類進化沒那么快。
(作者魯漫為產(chǎn)品經(jīng)理,科技行業(yè)工作者)





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務許可證:31120170006
增值電信業(yè)務經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




