成员动态| 京东全球科技探索者大会直击：JoySafety 开源，揭秘 AI 时代安全防护新逻辑

首页 > 关于我们 > 新闻中心 > 成员动态| 京东全球科技探索者大会直击：JoySafety 开源，揭秘 AI 时代安全防护新逻辑

2025.10.14
4289

2025年9月25日，主题为“Enjoy AI”的JDDiscovery-2025京东全球科技探索者大会在北京举行。京东集团CCO体系信息安全部AI安全负责人在大会上进行了“AI时代下安全新范式：JoySafety+ 安全Agent”的主题演讲，以下为内容节选。

（JoySafety开源地址：https://github.com/jd-opensource/JoySafety）文末附演讲报告完整版。

AI时代安全风险和挑战

1. AI时代的安全，带来了哪些新的风险？

提示词注入已经从最早的“奶奶漏洞类”的“聊天越狱”演变到了“Agent劫持”，黑客可以通过Agent窃取商业机密（如邮件内容）、执行任意命令等。
AI投毒，从最初的训练数据投毒已经演变到基于MCP工具的恶意代码投毒， MCP工具中嵌入恶意代码或者恶意shell，会造成数据泄漏及恶意攻击。
据统计全球大模型安全事件造成的损失持续攀升，预计2025年将突破235亿美元。

2. AI时代的安全，带来了哪些新挑战？

黑客可快速生成钓鱼邮件、恶意代码，甚至通过深度伪造（Deepfake）实施精准欺诈，攻击者借助开源AI工具，让网络攻击的门槛大幅降低，攻击规模变得更大，攻击行为更具持续性和精准性。
7*24小时运行的AI攻击工具也让响应时效也从“回合战”转为了“实时战”。
攻防不对等局面加大。

JoySafety：全链守护AI

如何破局？也就是今天要和大家分享的主要内容：AI时代下安全新范式：JoySafety + 安全Agent。两者共同构筑AI时代安全新范式。

JoySafety：AI的“守护者”，保障大模型安全运行
安全Agent：传统安全的“创新者”，重塑防御体系

1. JoySafety为AI提供全链的守护

基于AI对抗AI的思路构建基于“训练数据安全、大模型安全测评、Prompt实时检测、生成内容实时识别”四道安全防线，对内容安全、业务安全、信息安全（数据安全、提示词注入）等安全风险进行实时检测和识别，实现大模型生命周期全链的安全防护。

截止现在共支持了100+应用，每天亿级别请求的实时检测，平均检测及响应时间均在50ms以内，最长响应时间在150MS以内，可有效降低攻击95%以上，并在提示词注入、歧视性内容及社会主义核心价值观维度风险防御能力优于其他模型。目前Joysafety已全面覆盖，为京东内部大模型应用保驾护航。

2. 安全Agent：安全数字员工

我们的另一个目标是通过Agent，打造安全数字员工，重塑安全体系。遇到的问题：

通用大模型针对专业、精准率高的安全场景是否适配？
大模型在哪些场景可打破传统安全瓶颈？

为解决上述问题，我们推出JSL安全大模型2.0: Model as Agent。安全大模型在对安全任务、指令训练的基础上，增加对安全Agent的训练及微调。经多个评测集验证， JSL安全大模型2.0在指令遵循、内容安全、威胁情报、流量安全、终端安全等多个场景表现较好。

基于JSL安全大模型我们打造了4个数字员工(JSLSafeter)：代码漏洞检测与修复Agent(JSL-CodeSafeter)、渗透测试Agent(JSL-PenTester)、入侵研判Agent(JSL-AlertTriager)、威胁情报Agent(JSL-ThreatIntelliger)，更多的Agent 我们还在探索中～

AI时代下安全展望

AI时代下安全未来图景是什么样的？我们认为主要有以下三个方向：