DeepSeek V4春節前發表 號稱具強大程式設計能力

▲DeepSeek。(圖/路透)

記者蔡紹堅/綜合報導

據科技媒體The Information報導,DeepSeek將於2月發表新一代旗艦AI模型DeepSeek V4,該模型具備強大的程式設計能力,預計將對當前的AI競爭格局產生重大影響。

V4是DeepSeek繼2024年12月發表的V3模型之後的最新版本,兩位知情人士在報導中指出,DeepSeek內部的初步測試表明,V4在程式設計能力上超過了目前市場上的其他頂級模型,如Anthropic的Claude和OpenAI的GPT系列,這無疑是該公司在AI領域的又一重磅成果。

DeepSeek計劃在2025年春節前後發佈V4版本,發佈計劃可能會根據實際情況進行調整。

巧合的是,DeepSeek於2024年1月20日發佈了R1模型,恰逢春節前夕,在當時有效抓住了大衆的關注,這次的發表選在2月,也正好是春節之前。

據報導, V4在數據模式的理解上有所改進,能夠在整個訓練過程中保持高效穩定,避免了以往模型在長時間訓練下性能衰退的情況。