DeepSeek-V3.2-Exp模型正式發布並開源
2025-09-29 18:12:55
分享至

ChainCatcher 消息,DeepSeek-V3.2-Exp 模型今日正式發布並開源。模型引入稀疏 Attention 架構,這種架構能夠有效降低計算資源消耗並提升模型推理效率。目前,該模型已正式上架華為雲大模型即服務平台 MaaS,針對 DeepSeek-V3.2-Exp 模型,華為雲此次仍沿用大 EP 並行方案部署,基於稀疏 Attention 結構疊加實現長序列親和的上下文並行策略,並兼顧模型時延和吞吐性能。
最新快訊
EPHYRA 獲得 200 萬美元戰略投資,估值達 1 億美元,加速 AI 娛樂生態佈局
ChainCatcher
2025-10-07 22:20:46
Crunch Lab 完成 500 萬美元戰略融資,Galaxy Ventures 和 Road Capital 聯合領投
ChainCatcher
2025-10-07 22:20:02
數據:BTC 跌破 123000 美元
ChainCatcher
2025-10-07 22:10:02
數據:若 ETH 跌破 4,456 美元,主流 CEX 累計多單清算強度將達 24.97 億美元
ChainCatcher
2025-10-07 22:03:28
數據:若 BTC 突破 129,690 美元,主流 CEX 累計空單清算強度將達 26.96 億美元
ChainCatcher
2025-10-07 22:03:25