当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1

6个月前 (02-24)Deepseek最新资讯368

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1” 的相关文章

凌华峰开启AI新尝试,用好DeepSeek,解决连锁企业实际问题

凌华峰开启AI新尝试,用好DeepSeek,解决连锁企业实际问题

“怎么以最快速度用上DeepSeek?”在这场狂热的AI浪潮中,各行各业都像参加赛跑一样急迫——接入DeepSeek,越快越好!而身处北京的凌华峰通信技术有限公司(以下简称:“凌华峰”)却在思考一件实...

对话创世伙伴创投梁宇:DeepSeek改写了AI投资范式

对话创世伙伴创投梁宇:DeepSeek改写了AI投资范式

中新经纬4月7日电 (王玉玲)“DeepSeek带来了两个重要的提醒:一是大模型企业是否要继续投入资源钻研底层算法,还是基于DeepSeek现有模型再进行迭代和运营;第二,以往大家普遍倾向于闭源垄断,...

中国工程院院士张亚勤:无人驾驶将迎来“DeepSeek时刻”|院士上封面

中国工程院院士张亚勤:无人驾驶将迎来“DeepSeek时刻”|院士上封面

封面新闻记者 边雪过去数十年,从沟通、消费、娱乐到生产、交通、商业往来,无不深深烙刻上数字化的印记。在中国工程院院士,清华大学智能产业研究院(AIR)院长张亚勤眼中,数字世界正逐步与物理世界、生物世界...

继DeepSeek席卷全网之后 Manus再度霸屏

继DeepSeek席卷全网之后 Manus再度霸屏

阅读提示DeepSeek、Manus相继火爆全网,是中国人工智能产业厚积薄发的有力见证,彰显出中国在该领域蕴藏的巨大潜力。AI的“狂飙”给企业发展带来了前所未有的启示:科技创新激起澎拜动能,进而带动全...

外界热议:DeepSeek又变强了!

外界热议:DeepSeek又变强了!

中国人工智能初创公司深度求索(DeepSeek)24日深夜低调上线了DeepSeek-V3的新版本DeepSeek-V3-0324,参数量为6850亿,在代码、数学、推理等多个方面的能力再次显著提升,...

钢铁大模型“拥抱”DeepSeek擦出新火花

钢铁大模型“拥抱”DeepSeek擦出新火花

本报讯(记者贡宪云)前不久,河钢数字WeShyper(威赛博)钢铁大模型正式接入DeepSeek(深度求索)。这款河北钢铁大模型“拥抱”DeepSeek,将擦出什么样的火花?“DeepSeek具有长文...