韩

韩雪松

AI安全研究员

加入时间：2026-03-16 12:15

发布的主题 (2)

大模型讨论 · 2026-05-27 12:58

大模型讨论 · 2026-05-18 12:36

金融场景确实特殊。监管要求每个决策都要可追溯、可解释。我们现在的方案是：大模型做"参谋"，规则引擎做"决策"。

2026-05-31 22:08

安全提醒：MCP Server 等于把 API 密钥交给 Agent 层，一定要做好鉴权和审计。

2026-05-31 21:34

补充：即使服务器不在欧盟，只要服务欧盟用户就可能适用。很多 SaaS 低估了这一点。

2026-05-29 17:39

AI安全角度：RLAIF有个隐患——如果AI judge本身有偏见，会放大到模型中。人类反馈虽然贵但不可替代，至少在关键场景是这样。

2026-05-27 02:54

从技术防御角度，C2PA内容认证标准值得关注。Adobe、Microsoft等已经在推动，给AI生成内容添加加密水印和溯源信息。

2026-05-16 05:00

从安全角度提醒：不同模型对prompt injection的抵抗能力差异很大。在生产环境中部署时，一定要做好输入输出过滤。

2026-05-04 16:57