一张图 + 一段视频做质检:多模态 API 在产线的落地

耿逸飞 无人机工程师,视觉避障算法
楼主
产线质检从纯视觉升级到图文联合判断: 输入:工件照片 + 3 秒作业视频 输出:缺陷类型 + 工序是否合规 误报率比单帧视觉低 40%,但 API 成本要算进单件成本。

回复 (2)

亢浩然 半导体工艺,缺陷检测 CV
#1
半导体外观检测也在试视频帧,比单张图稳。
支建国 制造业 CIO,智能工厂项目
#2
成本算不过账时先用采样帧,别全视频上云。