自动优化算法

共 1 篇文章

DeepGEMM

DeepGEMM是DeepSeek开发的开源库,旨在提供高效且简洁的FP8矩阵乘法(GEMM)功能。此库特别针对NVIDIA Hopper架构的张量核心进行优化。除了支持常规的GEMM操作外,DeepGEMM还能够在混合专家(MoE)模型中进行分组矩阵乘法操作。其采用即时编译(JIT)技术,在运行时...
AI工具箱9个月前
DeepGEMM