DeepSeek-V3.2-Exp模型正式發布並開源
2025-09-29 18:12:55
分享至

ChainCatcher 消息,DeepSeek-V3.2-Exp 模型今日正式發布並開源。模型引入稀疏 Attention 架構,這種架構能夠有效降低計算資源消耗並提升模型推理效率。目前,該模型已正式上架華為雲大模型即服務平台 MaaS,針對 DeepSeek-V3.2-Exp 模型,華為雲此次仍沿用大 EP 並行方案部署,基於稀疏 Attention 結構疊加實現長序列親和的上下文並行策略,並兼顧模型時延和吞吐性能。
最新快訊
美元指數 DXY 日內漲幅達 0.5%,現報 98.6
ChainCatcher
2025-10-08 03:22:47
歐元兌美元日內跌幅達 0.5%,現報 1.1651
ChainCatcher
2025-10-08 03:22:39
銀行準備金下降,暗示美聯儲或接近結束縮表
ChainCatcher
2025-10-08 03:00:41
數據:若 ETH 突破 4,685 美元,主流 CEX 累計空單清算強度將達 19.7 億美元
ChainCatcher
2025-10-08 02:03:25
數據:若 BTC 突破 126,845 美元,主流 CEX 累計空單清算強度將達 34.25 億美元
ChainCatcher
2025-10-08 02:03:23