幻方量化全新系列模型DeepSeek-V3首個(gè)版本上線并同步開源,API服務(wù)已同步更新,接口配置無需改動(dòng)。當(dāng)前版本的DeepSeek-V3暫不支持多模態(tài)輸入輸出。據(jù)介紹,DeepSeek-V3為自研MoE模型,671B參數(shù),激活37B,在14.8Ttoken上進(jìn)行了預(yù)訓(xùn)練,其多項(xiàng)評(píng)測(cè)成績(jī)超越了Qwen2.5-72B和Llama-3.1-405B等其他開源模型,并在性能上和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
轉(zhuǎn)載請(qǐng)注明來自阿拉善凱拓戶外,本文標(biāo)題:《DeepSeek》