当前位置:首页 > Deepseek最新资讯 > 正文内容

被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了

2个月前 (08-14)Deepseek最新资讯213

  Mistral最新模型疑似直接蒸馏自DeepSeek,却对外包装成RL成功案例,并刻意歪曲基准测试结果。

  说到Mistral,这家公司被誉为欧洲版OpenAI,是全球开源明星玩家之一,模型性能一直备受好评。

  结果半年过去,剧情反转:Mistral不仅没跑赢DeepSeek,还被曝“借”了人家的成果。

  就像我们开头提到的,推特博主Sam Peach通过分析模型输出中过度使用的词汇模式(Slop),发现了Mistral-small-3.2与DeepSeek-v3之间令人惊讶的高度相似性。

  这种相似性通常很难通过独立训练偶然出现,所以很可能就是蒸馏(distillation)的结果:

  他先统计了模型在创意写作(creativewriting)的输出中,比人类文本更常出现的词和n-gram(词组)。

  最后把这些高频特征进行层次聚类(hierarchicalclustering),生成了一张“相似性图”。

  通过比较相似性图中模型的远近位置,就可以发现Mistral-small-3.2和DeepSeek-v3在图中非常接近,这就表明了它们的输出模式高度相似。

  最新的爆料则进一步指明,Mistral模型和DeepSeek相似不是巧合,而是可能使用了蒸馏。

  离职员工说,Mistral这样做是在假装自家模型的强化学习有效,这不仅歪曲了基准测试结果,而且误导公众。

  而在上一轮融资中(2024年6月),Mistral完成了一轮由General Catalyst领投的6亿欧元(6.45亿美元)的融资,这使其估值上升至58亿欧元(62亿美元),排名全球第四(美国湾区外排名第一)。

  从公司成立以来,Mistral一直保持开源路线,今年开源的模型就包括轻量级模型Mistral Small和主打编程的Mistral Code等。

  相较于主流的大语言模型,主打开源、小快灵的Mistraldeepseek,在多语言处理和推理能力方面具备相当的竞争力,在大模型市场中占据着独特的地位。

  同时他们也推出了自家聊天机器人LeChat,对标ChatGPT,内置深度研究模式、原生多语言推理和高级图像编辑等功能。

  截至目前,Mistral官方还没有回应,就在昨天他们还发布了新模型Mistral Medium V3.1。原文出处:被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了,感谢原作者,侵权必删!

标签: deepseek

“被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了” 的相关文章

讲个鬼故事:霍伊伦加盟曼联就进过1粒头球,而塞斯科同期进了8粒!

讲个鬼故事:霍伊伦加盟曼联就进过1粒头球,而塞斯科同期进了8粒!

  除了几个很抽象的单刀 我觉得抢点还可以 射门有时候超神有时候抽象 他有练好头球的条件 但是意愿强不强不知道   除了几个很抽象的单刀 我觉得抢点还可以 射门有时候超神...

Deepseek推荐全国旅游百强区第3名:云南昆明市盘龙区

Deepseek推荐全国旅游百强区第3名:云南昆明市盘龙区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价,并发布了天和2...

623 万、DeepSeek 大模型大单

623 万、DeepSeek 大模型大单

  随着社会信息化和智能化的快速发展,警务工作面临着日益复杂的挑战。传统的警务工作模式已难以应对现代社会的需求。苏州市姑苏区作为苏州市的核心区域,人口密集、经济活动频繁,社会治安管理任务繁...

恒扬数据携手华为发布智能计算新品 共筑算力新生态

恒扬数据携手华为发布智能计算新品 共筑算力新生态

  [中国,深圳,2025年8月15日]以“鲲鹏昇腾无处不在,成就商业好生意”为主题的2025华为深圳政企&恒扬数据新品推介会暨展车体验活动成功举办,百余位行业嘉宾齐聚一堂,共同探...

机构:豆包月活超越DeepSeek,跻身8月中国原生AI App月活第一

机构:豆包月活超越DeepSeek,跻身8月中国原生AI App月活第一

  据QuestMobile最新发布的AI行业发展数据,今年8月份,原生App、In-App AI及手机厂商AI助手均持续保持稳定增速,整体规模分别达6.45亿和5.29亿;PC端未如预期...

《DeepSeek即时通:提示词重塑AI生产力》:学会向DS提问

《DeepSeek即时通:提示词重塑AI生产力》:学会向DS提问

  人到中年,学习和理解能力都有一定的下滑,但是为了工作和生活,学习仍然不能停歇。年初DeepSeek横空出世后,这方面的学习资料也选了一些,包括清华大学出版社推出的《DeepSeek即时...