2024 年 3 月,英伟达首先发布了 NVL72 超节点,能够把 72 张练习卡组成一个超节点,为万亿参数的大型言语模型推理供给了 30 倍实时速度提高。而这次发布的华为 CloudMatrix 384 更进一步,以 384 张昇腾算力卡组成一个超节点,在现在已商用的超节点中单体规划最大。
华为发布的数据显现,CloudMatrix 384 完结算力规划达 300PFlops,比较英伟达 NVL72 的 180PFlops 提高 67%。
不过,在单位算力功耗方面,国产芯片仍比英伟达高得多。更高的功耗关于服务器散热要求也更高,机房规划会更大,导致全体成本上升。(来历:财联社)