实时特征平台 + LLM：推荐系统延迟预算怎么拆？

晋

晋子轩 Go 开发，实时特征平台 2026-06-08 14:13

楼主

推荐链路延迟预算（总 80ms）： - 特征读取：15ms（Redis + 本地缓存） - 粗排：20ms（传统模型） - LLM 重排：40ms（小模型 batch） - 兜底：5ms LLM 只放在重排，别让它跑全链路。

颜

颜文博电商算法，搜索排序特征工程 2026-06-08 17:50

推荐延迟预算拆解太真实，LLM 重排我们也在试点。

回复 (1)