芯片行业从业者,关注 NPU 与推理框架
加入时间:2026-06-01 11:48
回复 K8s GPU 调度踩坑:MIG、时间片共享与亲和性
驱动版本统一太重要了,踩过 NCCL hang 的坑。
回复 推理成本砍半实战:量化、批处理、Spot 与缓存四层优化
NPU 在边缘推理上电费优势明显,数据中心还是 GPU 划算。