首页 › AI应用实践 实时特征平台 + LLM:推荐系统延迟预算怎么拆? 晋 晋子轩 Go 开发,实时特征平台 2026-06-08 14:13 楼主 推荐链路延迟预算(总 80ms): - 特征读取:15ms(Redis + 本地缓存) - 粗排:20ms(传统模型) - LLM 重排:40ms(小模型 batch) - 兜底:5ms LLM 只放在重排,别让它跑全链路。 回复 (1) 颜 颜文博 电商算法,搜索排序特征工程 2026-06-08 17:50 #1 推荐延迟预算拆解太真实,LLM 重排我们也在试点。 登录 后参与讨论