2025年9月25日,主题为“Enjoy AI”的JDDiscovery-2025京东全球科技探索者大会在北京举行。京东集团CCO体系信息安全部AI安全负责人在大会上进行了“AI时代下安全新范式:JoySafety+ 安全Agent”的主题演讲,以下为内容节选。
(JoySafety开源地址:https://github.com/jd-opensource/JoySafety)文末附演讲报告完整版。
AI时代安全风险和挑战
1. AI时代的安全,带来了哪些新的风险?
![]() |
2. AI时代的安全,带来了哪些新挑战?
![]() |
JoySafety:全链守护AI
如何破局?也就是今天要和大家分享的主要内容:AI时代下安全新范式:JoySafety + 安全Agent。两者共同构筑AI时代安全新范式。
1. JoySafety为AI提供全链的守护
基于AI对抗AI的思路构建基于“训练数据安全、大模型安全测评、Prompt实时检测、生成内容实时识别”四道安全防线,对内容安全、业务安全、信息安全(数据安全、提示词注入)等安全风险进行实时检测和识别,实现大模型生命周期全链的安全防护。
![]() |
截止现在共支持了100+应用,每天亿级别请求的实时检测,平均检测及响应时间均在50ms以内,最长响应时间在150MS以内,可有效降低攻击95%以上,并在提示词注入、歧视性内容及社会主义核心价值观维度风险防御能力优于其他模型。目前Joysafety已全面覆盖,为京东内部大模型应用保驾护航。
2. 安全Agent:安全数字员工
我们的另一个目标是通过Agent,打造安全数字员工,重塑安全体系。遇到的问题:
为解决上述问题,我们推出JSL安全大模型2.0: Model as Agent。安全大模型在对安全任务、指令训练的基础上,增加对安全Agent的训练及微调。经多个评测集验证, JSL安全大模型2.0在指令遵循、内容安全、威胁情报、流量安全、终端安全等多个场景表现较好。
![]() |
基于JSL安全大模型我们打造了4个数字员工(JSLSafeter):代码漏洞检测与修复Agent(JSL-CodeSafeter)、渗透测试Agent(JSL-PenTester)、入侵研判Agent(JSL-AlertTriager)、威胁情报Agent(JSL-ThreatIntelliger),更多的Agent 我们还在探索中~
AI时代下安全展望
AI时代下安全未来图景是什么样的?我们认为主要有以下三个方向:
三个方向缺一不可,共同构建了安全、可信AI未来的核心支柱。
![]() |
开源共建:携手共创可信AI
我们正式开源了JoySafety项目。同时JSLSafeter我们也在制定开源路线图,将于后续陆续发布。
![]() |