旺宏老董站臺!耐能發表Mamba晶片看好推論商機!子公司不排除在臺IPO
耐能創辦人劉峻誠。王鬱倫攝影
AI晶片公司Kneron耐能26日發表第七顆AI旗艦產品KL1140 ,號稱全球首款在終端完整執行Mamba架構模型的NPU,創辦人暨執行長劉峻誠表示未來兩年終端裝置LLM應用將出現爆發力,預告2026年會與國際大型生態玩家合作,切入穿戴裝置戰場,旺宏(2337)、鈺創、九元董事長都出席站臺。
AI晶片戰場不斷變化,NVIDIA帶頭開始切入系統供應鏈,晶片業者也紛紛效尤垂直整合,從晶片做到系統,從上游往下游應用解決方案延伸,拚完整生態系也拚效能,耐能26日舉行發表會,對外發布從終端到雲端的完整AI基礎設施計劃,劉峻誠也預告要從純AI晶片供應商進化爲AI基礎建設公司(AI Infrastructure Company)。
最特別的是,記者會現場出現幾位科技業大老站臺,包括旺宏董事長吳敏求、九元董事長汪秉龍、鈺創董事長盧超羣等,旺宏跟鈺創是耐能的記憶體供應商,九元則是測試夥伴,另外旺宏也是耐能股東之一。
耐能除發表首款能在終端完整執行Mamba的NPU「KL1140」,號稱業界第一顆可於終端設備完整運行Mamba神經網路的邊緣AI晶片,劉峻誠表示,看好未來1~2年將有許多智慧裝置在市場大量出現。
KL1140在能效上達到現有云端方案3倍效能、但成本下降10倍,劉峻誠表示,在雲的算力方面已被GPU主宰,但NPU在端的LLM應用上將具領先優勢。
劉峻誠表示,模型在雲端算力做訓練,但當大家模型訓練得差不多,後面就是推論的應用,但「現在大家用的是有史以來最貴的推論算力」。他表示,現在訓練需求讓GPU算力愈來愈大,但當推論需求快速主導市場時,GPU一點優勢都沒有。
耐能也發表Klink作爲晶片跟晶片間的傳輸技術,透過四顆KL1140並聯,可支援運行高達1,200億參數的模型,功耗僅爲傳統GPU的三分之一。劉峻誠看好未來兩年邊緣AI將因模型變小,與NPU算力出現黃金交叉,帶動邊緣AI應用大幅揚升。
劉峻誠也宣佈3年(至2028年)的高中低階多款新晶片規畫,總計達5~6顆,他透露這是因爲耐能終於打破重圍,與一家國際一線大廠合作,參與制訂生態系統,其次耐能也從模組做到軟體工具,第三是推出整合模型應用的系統,打入醫療院所及主權AI(國泰醫院、榮總、丹佛大學),雲則是獲得中華電信採用,最後是宣佈耐能已經成爲一個集團公司。
他表示,耐能跟臺達電併購兩家公司,包括安防公司Vatics及智慧座艙OTUS,另投資教育公司Innovedus,並與義大利Spark的臺灣分公司合作,打造基於耐能晶片的LLM伺服器。故目前已有4家子公司,目前也內部評估,讓符合臺灣上市櫃法規的子公司在臺灣上市,不過時機仍在評估,至於耐能本身2026年也會評估在美IPO時機。
Kneron耐能發表新一代AI系列晶片,全面構建從終端到雲端的完整AI基礎設施版圖。圖由左至右爲國立陽明交通大學榮譽教授呂學錦、旺宏電子董事長吳敏求、耐能創辦人暨執行長劉峻誠博士、臺灣人工智慧晶片聯盟會長盧超羣。耐能提供