AI算力戰1/TPU撼動不了霸主GPU 市場將有4大變化 下一個發達的是記憶體?
TPU的崛起,並不意味着GPU地位動搖,而是顯示AI晶片市場正在從單一通用解法,逐步走向分工並存的結構。圖爲輝達執行長黃仁勳。路透
AI算力市場長期由輝達GPU主導,近期Google自研的張量處理器TPU卻被推到市場焦點,各界都在猜,在成本更低、效能更高的情況下,TPU是否將取代GPU在AI模型的獨霸地位。對此,ikala執行長程世嘉認爲,TPU與GPU,代表的並不是一場晶片對決,而是一個更深層的訊號:「AI算力需求正在改變」,市場結構因此出現分岔。
「TPU不是新東西,大家似乎有點誤解了。」採訪一開始,程世嘉先點破迷思。他提到,Google早在2013年就啓動TPU計劃,起點並非是爲了販售晶片,而是因應語音搜尋等消費型服務成長,預期AI運算量將快速暴增,才從應用需求反推算力設計。
這樣的出發點,也讓Google的TPU一開始就被定位爲,可支撐長時間、大規模運作的基礎設施,而非單純追逐效能極限的硬體產品。
程世嘉表示,過去十多年,AI算力的主戰場集中在模型訓練,龐大的算力需求高度集中於少數能負擔高昂成本的科技巨頭。巨頭們在訓練階段就需要極高效能的「通用型」晶片,這也是GPU能快速建立市場優勢的關鍵背景。
愛卡拉執行長程世嘉。記者葉信菉/攝影
觀察1、推論需求讓TPU路遙知馬力
但隨着通用模型逐漸成熟,市場結構開始鬆動。程世嘉指出,「訓練更像是一個準備過程,真正長期消耗算力的,是模型上線後與使用者互動的每一刻,也就是『推論』模型。」
他解釋,所有AI實際上在運作,就是在進行推論。」當AI被部署到要去搜尋、生成內容、開展語音互動與各式企業應用後,「算力需求不再是一次性爆發,而是持續且大量的消耗。」
在這樣的背景下,算力需求的成長曲線開始從通用型轉向推論型。程世嘉判斷,推論需求的成長速度相當快速,「到明年推論的需求就會超過六成」,長期來看,推論甚至可能成爲AI算力的主要來源。畢竟TPU的使用成本只有GPU的20%,在這樣的結構下,爲推論設計的TPU與通用型的GPU,在功耗與成本上自然形成差異。
儘管TPU在推論成本與能耗上具備優勢,但對多數企業而言,目前使用門檻仍然偏高,程世嘉說,主因在於Google尚未對外釋出晶片,只能透過雲端服務租用。Google目前並未對外銷售TPU晶片,僅透過雲端以租用方式提供服務,讓企業難以將其納入自建算力的固定成本配置。
深度內容中心/製作
觀察2、AI晶片市場將走向分工並存
在產量有限、供應鏈仍高度封閉的情況下,TPU短期內難以對既有市場結構造成實質衝擊。程世嘉進一步指出,輝達目前仍握有至少三年的優勢,除了晶片世代仍領先一到兩代,更重要的是其毛利高達75%左右,在硬體產業中極爲罕見,也代表在供不應求的市場環境下,尚未出現價格競爭壓力。
程世嘉形容,當前AI產業的獲利結構其實相當「畸形」。在這一波生成式AI競賽中,應用端爲了搶市佔率大量補貼使用者,反而把成本壓力轉嫁到算力需求上,最終讓提供AI原料的晶片廠商賺走絕大多數利潤。硬體公司卻擁有接近軟體業的高毛利,也顯示這個市場的價值分配,仍停留在尚未翻轉的階段。
不過,TPU的崛起,並不意味着GPU地位動搖,而是顯示AI晶片市場正在從單一通用解法,逐步走向分工並存的結構。通用型GPU仍將主導訓練與高階算力需求,而專爲推論設計的特化晶片,則開始在成本與能耗敏感的場景中尋找定位,市場結構也因此出現分岔。
他觀察,AI晶片產業正在從「一家獨大」走向「分工並存」。未來市場上,通用型晶片仍將扮演關鍵角色,但同時也會出現更多專爲推論、邊緣運算或特定場景設計的晶片,產業會因此變得更加多元。
觀察3、不只晶圓代工,臺廠封裝測試一路到PCB跟着旺
程世嘉指出,無論是GPU或TPU,最終都會回到製造業,包括先進製程、先進封裝、載板、PCB,以及後段的系統整合與散熱能力。算力需求持續擴張,讓整條供應鏈壓力提升,也同步擡升製造端的重要性。
程世嘉分析,過去市場主要競逐的是晶圓代工產能,如今瓶頸已一路延伸至先進封裝與關鍵材料,從晶圓製造、封裝測試到載板與PCB,幾乎所有與高階算力相關的產能都呈現供不應求,製造端的定價權也因此升高。
面對這樣的轉變,他認爲臺廠的佈局重點,已從單純追逐大客戶,轉向卡位「多種算力並存」的製造能力。隨着推論型與客製化晶片需求增加,IC設計服務、先進封裝整合,以及晶片間互聯能力,逐漸成爲新的競爭場域。
特別是在客製化晶片設計與封裝協同開發上,臺灣的設計服務與製造實力,有機會隨着科技巨頭自研晶片趨勢而深化參與。
觀察4、供應鏈新瓶頸出現
不過,即使製造端持續受惠,AI產業的下一道關卡也逐漸浮現。程世嘉指出,當前AI晶片最大的限制,已不再只是運算效能,而是記憶體頻寬、晶片間通訊,以及能源與散熱條件。
「現在AI晶片最大的技術瓶頸其實是來自於記憶體。」模型規模持續放大,使資料在晶片與晶片之間高速流動,頻寬與互聯反而成爲制約效能的關鍵。
在算力規模不斷擴張的過程中,能否突破記憶體與通訊瓶頸,並同步解決電力與散熱限制,將決定AI產業是否能順利進入下一個成長階段。對臺灣供應鏈而言,這不只是一場產能競賽,而是一段圍繞製程、封裝、材料與系統能力的長期結構調整。
編輯推薦