字節跳動新模型推理高手 號稱科學測試成績與 Gemini 3 Pro 和 GPT 5.2相當

字節跳動。(微博照片)

字節跳動昨(14)日推出豆包大模型2.0,性能較前一代豆包1.8大幅提升,在科學領域知識測試成績與Gemini 3 Pro和GPT 5.2相當,其中,豆包2.0 Pro的收費價格平均比Gemini 3 Pro和GPT 5.2便宜高達75%。

財新網指出,字節跳動堪稱目前市場上算力資源最充裕、使用最充分的網路公司,豆包大模型1.0在2024年5月發佈,當時以比業界低99%的定價帶動企業和開發者接入使用,又在過去的一年迭代四個版本。

大陸國產大模型在農曆春節前接連發布,字節跳動在發佈Seedance 2.0影像模型、Seedream 5.0 Lite圖像模型後,再推出豆包大模型2.0(Doubao-Seed-2.0)系列。

豆包2.0系列包含Pro、Lite、Mini三款通用Agent模型,以及適用於程式設計的Code模型。

Pro面向深度推理與長鏈路任務執行場景,對標GPT 5.2與Gemini 3 Pro;Lite兼顧性能與成本,綜合能力超越上一代主力模型豆包1.8;Mini則鎖定低延遲、對成本更敏感的情境。

字節跳動表示,豆包2.0 Pro在基礎能力上,於IMO、CMO數學競賽與ICPC程式競賽拿下「金牌成績」,並稱其在Putnam基準測試上的表現優於Gemini 3 Pro,數學與推理能力達到世界頂尖水準。

在教育、娛樂、辦公等多種應用情境,豆包2.0也全面升級多模態理解能力,包含視覺推理、空間感知、長上下文理解等;針對動態場景,增強對時間序列與運動感知的理解能力,可用於即時影像分析、環境感知。

價格方面,豆包2.0 Pro依「輸入長度」區間定價,32k以內輸入爲人民幣3.2元/百萬tokens,輸出爲人民幣16元/百萬tokens;豆包2.0 Lite綜合性能超越上一代主力模型豆包1.8,百萬tokens輸入僅人民幣0.6元,更具價格優勢。

推出豆包2.0的背景在於,豆包大語言模型已經支撐豆包App成爲用戶量上億的C端產品,隨着AI Agent逐漸發揮價值,大模型將在科學研究、複雜軟體開發等任務中發揮更大作用。