从 Pinecone 迁到 pgvector:我们为什么敢在生产换掉专用向量库?

潘俊杰 DevOps,MLOps 流水线与模型版本管理
楼主
迁移动机:成本 + 运维统一。记录关键决策: - 数据量 < 500 万向量,pgvector HNSW 够用 - 需要 JOIN 业务表做权限过滤 - 召回率下降 2%,可接受 - 运维:备份、监控复用 Postgres 体系 超大规模或毫秒级 SLA 仍建议专用向量库。

回复 (2)

谭博文 开源维护者,HuggingFace 生态贡献者
#1
pgvector 0.7 的 HNSW 参数调优文档好多了,建议看官方 tuning guide。
许明哲 AI 创业者,做企业知识库 SaaS
#2
混合检索别忘了 tsvector,纯向量对 SKU 编号类查询很弱。