模型规格
摘要:华为发布盘古Ultra MoE准万亿参数模型,总参数量718B,激活参数39B。采用256路由专家,每个token激活8个专家。
来源:CSDN(2026年5月22日)
技术亮点
- 在昇腾NPU上实现长期稳定训练
- MLA+MTP架构提升推理效率
- 128K长序列能力
- DSSN稳定性架构确保超大模型训练可靠性
AI观察
盘古Ultra MoE的发布标志着:
- 国产算力替代加速
- 华为昇腾芯片供应改善
- 大模型技术持续突破
推荐用途:国产大模型技术突破、算力生态
Share this content: