当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1

4个月前 (02-24)Deepseek最新资讯247

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1” 的相关文章

中美Robotaxi狂飙量产:自动驾驶进入DeepSeek时刻

中美Robotaxi狂飙量产:自动驾驶进入DeepSeek时刻

打造可复制的商业模板,成为自动驾驶领域的DeepSeek,或许才是Momenta在L4的目标。作者|杨 铭编辑|刘珊珊无人驾驶出租车撕开雨幕,在城市高楼林立间疾驰,成为城市出行重要参与者——这是人类对...

光迅科技:Deepseek应用将推动高速光模块需求

光迅科技:Deepseek应用将推动高速光模块需求

金融界4月2日消息,有投资者在互动平台向光迅科技提问:您好,请问deekseep的崛起对公司有哪些利好?公司芯片能否用在deekseep上是否有合作?公司回答表示:Deepseek的广泛应用将有力推动...

400亿参数大模型:分布式算力,DeepSeek架构,3090单卡部署

400亿参数大模型:分布式算力,DeepSeek架构,3090单卡部署

闻乐 发自 凹非寺量子位 | 公众号 QbitAI打破科技巨头算力垄断,个人开发者联手也能训练超大规模AI模型?Nous Research宣布推出Psyche Network,可以将全球算力整合起来训...

大厂接入DeepSeek,自己的大模型怎么办?

大厂接入DeepSeek,自己的大模型怎么办?

现在还要没有接入DeepSeek的科技大厂吗?盘点下来,好像还真没有了。从国外的英伟达、亚马逊、微软等头部大厂,到国内的BAT、华为和字节跳动,DeepSeek出圈后不就,但凡叫得上名的科技大厂都做出...

放大 AI 商业价值,企业快成长 DeepSeek 行业深度应用创新论坛华北站圆满落幕

放大 AI 商业价值,企业快成长 DeepSeek 行业深度应用创新论坛华北站圆满落幕

 DeepSeek 一经问世便迅速赢得了众多用户的青睐,彼时,公众对 AI 的强烈需求直接体现在了注册数量上。经过多次迭代,DeepSeek-R1 和 DeepSeek-V3 现已发展成为能够进行深度...

DeepSeek到底给中国TO B服务带来了什么?|产业深度

DeepSeek到底给中国TO B服务带来了什么?|产业深度

DeepSeek引发的技术地震只是序章。当潮水退去,最终留在舞台中央的,必是那些完成“价值操作系统”升级的破壁者。作者|斗斗出品|产业家DeepSeek的出现,仿佛在平静的湖面上投入了一颗石子,激起了...