DeepSeek-V3.2-Exp模型正式發布並開源
2025-09-29 18:12:55
分享至

ChainCatcher 消息,DeepSeek-V3.2-Exp 模型今日正式發布並開源。模型引入稀疏 Attention 架構,這種架構能夠有效降低計算資源消耗並提升模型推理效率。目前,該模型已正式上架華為雲大模型即服務平台 MaaS,針對 DeepSeek-V3.2-Exp 模型,華為雲此次仍沿用大 EP 並行方案部署,基於稀疏 Attention 結構疊加實現長序列親和的上下文並行策略,並兼顧模型時延和吞吐性能。
最新快訊
Paradigm 聯創:零利率時代的結束催生了穩定幣超級周期
ChainCatcher
2025-10-06 16:31:53
數據:ETH 當前全網 8 小時平均資金費率為 0.0062%
ChainCatcher
2025-10-06 16:17:04
數據:BTC 當前全網 8 小時平均資金費率為 0.0032%
ChainCatcher
2025-10-06 16:17:02
CoinShares:上週數字資產投資產品淨流入 59.5 億美元,創最大單週流入記錄
ChainCatcher
2025-10-06 16:12:46
數據:過去 24 小時全網爆倉 2.54 億美元,多單爆倉 1.81 億美元,空單爆倉 7,226.51 萬美元
ChainCatcher
2025-10-06 16:00:21