当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”

9个月前 (02-24)Deepseek最新资讯423

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”” 的相关文章

deepseek仿冒网站大量出现-奇安信:仿冒DeepSeek网站已超两千个,六成IP在美国

deepseek仿冒网站大量出现-奇安信:仿冒DeepSeek网站已超两千个,六成IP在美国

随着国产AI公司深度求索的大模型DeepSeek爆红,各类仿冒网站也层出不穷,带来安全隐患。2月6日,澎湃新闻记者从奇安信XLab实验室方面获悉,仿冒DeepSeek的网站、钓鱼网站已经超过2000个...

公元:DeepSeek只打开一扇门,大模型远没到终局

公元:DeepSeek只打开一扇门,大模型远没到终局

谁会先迈出下一只脚?DeepSeek如何改变中国AI投资?具身智能距离清晰商业化还要多久?这些热门话题吸引了众多资深投资人热烈讨论。在 “第19届中国投资年会·年度峰会”上,投中网主编曹玮钰与红杉中国...

DeepSeek融入闽企智能化生产

DeepSeek融入闽企智能化生产

东南网2月28日讯(福建日报见习记者 汤海波) 日前,泉州汇成针织有限公司成功打造福建省首个纺织专用设备行业深度融合国产AI大模型DeepSeek的智能化生产体系。这家位于泉州洛江的制造业企业,通过将...

DeepSeek开源周这次又打开了什么魔盒?将如何影响AI开发?

DeepSeek开源周这次又打开了什么魔盒?将如何影响AI开发?

国产人工智能企业深度求索开发的大模型DeepSeek开源周落下帷幕。2月28日,DeepSeek最新宣布,开源面向DeepSeek全数据访问的推进器3FS(Fire-Flyer File System...

重庆首个“DeepSeek+市场监管”成果投入一线应用

重庆首个“DeepSeek+市场监管”成果投入一线应用

本报讯 (何艾彬 记者谢 旺)日前,市民张女士前去重庆市江津区市场监管局办事,恰逢局长办公日,张女士发现,通过“津市通”,即可了解药店办理地址变更的所有流程。这也是重庆首个“DeepSeek+市场监管...

DeepSeek-R2大模型上线在即,当贝AI或率先接入

DeepSeek-R2大模型上线在即,当贝AI或率先接入

4月30日凌晨DeepSeek更新Prover-V2大模型,据多方消息透露,国内AI技术领军企业深度求索(DeepSeek)计划于5月发布新一代旗舰大模型DeepSeek-R2,预计比GPT-4成本下...