首页   >  关于我们   >  新闻中心   >  成员动态| 京东全球科技探索者大会直击:JoySafety 开源,揭秘 AI 时代安全防护新逻辑
返回
成员动态| 京东全球科技探索者大会直击:JoySafety 开源,揭秘 AI 时代安全防护新逻辑
  • 2025.10.14
  • 1906

2025年9月25日,主题为“Enjoy AI”的JDDiscovery-2025京东全球科技探索者大会在北京举行。京东集团CCO体系信息安全部AI安全负责人在大会上进行了AI时代下安全新范式:JoySafety+ 安全Agent的主题演讲,以下为内容节选。

JoySafety开源地址:https://github.com/jd-opensource/JoySafety)文末附演讲报告完整版。


AI时代安全风险和挑战

 

1. AI时代的安全,带来了哪些新的风险?

 
  • 提示词注入已经从最早的“奶奶漏洞类”的“聊天越狱”演变到了“Agent劫持”,黑客可以通过Agent窃取商业机密(如邮件内容)、执行任意命令等。
  • AI投毒,从最初的训练数据投毒已经演变到基于MCP工具的恶意代码投毒, MCP工具中嵌入恶意代码或者恶意shell,会造成数据泄漏及恶意攻击。
  • 据统计全球大模型安全事件造成的损失持续攀升,预计2025年将突破235亿美元。
 
 

2. AI时代的安全,带来了哪些新挑战?

 

  • 黑客可快速生成钓鱼邮件、恶意代码,甚至通过深度伪造(Deepfake)实施精准欺诈,攻击者借助开源AI工具,让网络攻击的门槛大幅降低,攻击规模变得更大,攻击行为更具持续性和精准性。
  • 7*24小时运行的AI攻击工具也让响应时效也从“回合战”转为了“实时战”。
  • 攻防不对等局面加大。
 


JoySafety:全链守护AI

 

如何破局?也就是今天要和大家分享的主要内容:AI时代下安全新范式:JoySafety  + 安全Agent。两者共同构筑AI时代安全新范式。

 

  • JoySafety:AI的“守护者”,保障大模型安全运行
  • 安全Agent:传统安全的“创新者”,重塑防御体系

 

1. JoySafety为AI提供全链的守护

 

基于AI对抗AI的思路构建基于“训练数据安全、大模型安全测评、Prompt实时检测、生成内容实时识别”四道安全防线,对内容安全、业务安全、信息安全(数据安全、提示词注入)等安全风险进行实时检测和识别,实现大模型生命周期全链的安全防护。
 

 

截止现在共支持了100+应用,每天亿级别请求的实时检测,平均检测及响应时间均在50ms以内,最长响应时间在150MS以内,可有效降低攻击95%以上,并在提示词注入、歧视性内容及社会主义核心价值观维度风险防御能力优于其他模型。目前Joysafety已全面覆盖,为京东内部大模型应用保驾护航。

 

2. 安全Agent:安全数字员工

 

我们的另一个目标是通过Agent,打造安全数字员工,重塑安全体系。遇到的问题:

 

  • 通用大模型针对专业、精准率高的安全场景是否适配?
  • 大模型在哪些场景可打破传统安全瓶颈?

 

为解决上述问题,我们推出JSL安全大模型2.0:  Model as Agent。安全大模型在对安全任务、指令训练的基础上,增加对安全Agent的训练及微调。经多个评测集验证, JSL安全大模型2.0在指令遵循、内容安全、威胁情报、流量安全、终端安全等多个场景表现较好。

 
 

基于JSL安全大模型我们打造了4个数字员工(JSLSafeter):代码漏洞检测与修复Agent(JSL-CodeSafeter)、渗透测试Agent(JSL-PenTester)、入侵研判Agent(JSL-AlertTriager)、威胁情报Agent(JSL-ThreatIntelliger),更多的Agent 我们还在探索中~

 

AI时代下安全展望

 

AI时代下安全未来图景是什么样的?我们认为主要有以下三个方向:

 

  • JoySafety为代表的“AI守护者”,为大模型的安全运行和合规使用提供保障;
  • JSLSafeter为代表的传统安全的“创新者”,重塑信息安全防御体系;
  • JLBoost为代表的AI“助力器”,在大模型训练数据获取、幻觉方面提供支撑,提升大模型输出可靠性和可信度。

 

三个方向缺一不可,共同构建了安全、可信AI未来的核心支柱。
 

 

开源共建:携手共创可信AI

 

我们正式开源了JoySafety项目。同时JSLSafeter我们也在制定开源路线图,将于后续陆续发布。

 

GitHub开源地址:https://github.com/jd-opensource/JoySafety
本网站使用Cookies以使您获得最佳的体验。为了继续浏览本网站,您需同意我们对Cookies的使用。想要了解更多有关于Cookies的信息,或不希望当您使用网站时出现cookies,请阅读我们的Cookies声明隐私声明
全 部 接 受
拒 绝