韩雪松

AI安全研究员

加入时间:2026-03-16 12:15

发布的主题 (2)

最近回复

回复 AI在金融风控中的应用:从规则引擎到智能模型

金融场景确实特殊。监管要求每个决策都要可追溯、可解释。我们现在的方案是:大模型做"参谋",规则引擎做"决策"。

回复 MCP 协议实践:用 Model Context Protocol 给 Agent 接工具的正确姿势

安全提醒:MCP Server 等于把 API 密钥交给 Agent 层,一定要做好鉴权和审计。

回复 欧盟 AI Act 2026 正式执行:哪些 AI 应用需要合规审计?

补充:即使服务器不在欧盟,只要服务欧盟用户就可能适用。很多 SaaS 低估了这一点。

回复 强化学习在大模型训练中的最新进展

AI安全角度:RLAIF有个隐患——如果AI judge本身有偏见,会放大到模型中。人类反馈虽然贵但不可替代,至少在关键场景是这样。

回复 深度伪造技术泛滥:我们该如何应对?

从技术防御角度,C2PA内容认证标准值得关注。Adobe、Microsoft等已经在推动,给AI生成内容添加加密水印和溯源信息。

回复 GPT-5 vs Claude 4 vs Gemini 2.5:三大模型实测对比

从安全角度提醒:不同模型对prompt injection的抵抗能力差异很大。在生产环境中部署时,一定要做好输入输出过滤。