
(圖/ gemini AI )
中華雲新聞網 (文/記者 莊雲川)
根據《路透社》引述美國科技媒體《The Information》報導指出,DeepSeek目前正在研發的 V4模型,預計將在未來幾週內正式發布。
消息人士透露,為了確保模型能在國產算力平台上達到最佳效能,DeepSeek研發團隊近幾個月已與Huawei及Cambricon Technologies(寒武紀科技)密切合作,重新調整部分底層程式碼並進行密集壓力測試。
不同於AI產業常見流程,DeepSeek此次未將模型送交美國晶片廠商進行優化測試,而是優先開放給華為等本土供應商進行早期測試,顯示其技術策略更偏向建立本土化AI技術鏈。
三版本同步開發 打造自主AI技術鏈
消息指出,DeepSeek V4未來將推出三種不同功能優化版本,並全部基於國產晶片架構開發,目標是打造從AI模型到算力硬體完全自主可控的生態系。
業界人士分析,此舉不僅是技術選擇,也與地緣政治與科技供應鏈安全密切相關。近年來,美國對先進AI晶片出口中國採取限制措施,使中國科技企業加速尋求替代方案。
前代模型曾震撼市場 V4表現備受關注
事實上,DeepSeek先前推出的 V3與R1模型,因具備低成本、高效能特點,曾引發全球科技股市場震盪,讓投資人重新思考AI企業動輒投入數十億美元購買算力設備的必要性。
如今V4選擇走向「去美化算力架構」,其性能是否仍能維持前代水準,甚至挑戰全球AI產業格局,已成為科技界與資本市場高度關注的焦點。
國產晶片能否抗衡輝達仍待觀察
儘管市場普遍預期V4有望成為最強開源AI模型之一,但也有觀察人士指出,目前中國先進晶片製程大約停留在5奈米水準,與全球最先進技術仍存在差距。
在大模型實際運算環境中,華為AI晶片的穩定性、算力效率與軟硬體整合能力是否能與輝達GPU競爭,仍需等待V4正式推出並在真實應用場景中驗證。
此前中國媒體曾透露,V4預計在4月發布,雖可能成為開源模型中的強者,但「未必達到碾壓級領先」。
發表回覆
取消回覆投票表決
最新消息
獲取最新新聞
訂閱我們的新聞,以獲取最新新聞和獨家更新。