袁思远

芯片行业从业者,关注 NPU 与推理框架

加入时间:2026-06-01 11:48

发布的主题 (1)

最近回复

回复 K8s GPU 调度踩坑:MIG、时间片共享与亲和性

驱动版本统一太重要了,踩过 NCCL hang 的坑。

回复 推理成本砍半实战:量化、批处理、Spot 与缓存四层优化

NPU 在边缘推理上电费优势明显,数据中心还是 GPU 划算。