当前位置:首页 > Deepseek应用场景 > 正文内容

OpenAI罕见宣布将开源推理模型,DeepSeek给逼的

7个月前 (04-01)Deepseek应用场景445

就在刚刚,OpenAI CEO Sam Altman正式宣布,将在未来几个月内推出一款具备推理能力的强大开放权重语言模型,并期待与开发者共同探索如何最大化其潜力。


据Altman透露,这是自GPT-2以来OpenAI首次计划发布开放权重语言模型。


他坦言,虽然这一想法已酝酿许久,但此前其他优先事项占据了主导地位。如今,发布这款模型的时机变得尤为重要。



作为参考,开放权重(open weight)是指将AI模型(尤其是神经网络)的训练参数(即权重)公开,供公众使用、检查或进一步开发。


用户可以在这些权重的基础上进行修改,并将修改后的权重重新分发。


虽然开放权重不能完全等同于开源,是一种介于完全闭源和完全开源之间的折中方案,但它是开源理念在AI领域的一种延伸和部分实现,包括此前宣称开源的DeepSeek V3/R1同样只开放了权重。


在正式发布前,OpenAI将依据其“准备框架”对模型进行评估,确保其安全性与可靠性。


考虑到模型发布后可能被修改,团队还将开展额外测试与优化工作。


为进一步完善开发流程,OpenAI计划举办一系列开发者活动,以收集反馈并展示早期原型。首场活动将于数周后在旧金山启动,随后在欧洲和亚太地区陆续展开。


有兴趣参与的开发者可通过链接报名:
https://openai.com/open-model-feedback



OpenAI研究员约翰内斯·海德克(Johannes Heidecke)对此补充道:


“安全性是我们开发开放权重模型的核心。从预训练到发布,我们都会遵循严格的准备框架,确保不会推出可能引发灾难性风险的模型。尽管开放模型面临独特挑战,我们对此充满信心。”


目前,Altman的评论区已经乱成一锅粥了。


网友呼声最高的模型是OpenAI o1 mini,全球最大AI开源社区Hugging Face CEO Clément Delangue也现身评论区。



谈到开源,自然绕不开DeepSeek。R1和R2的身影也充斥着整个评论区。




网友是懂Sam Altman的。毕竟GPT-5也说是“未来几个月”发布,但至今未见踪影。



Altman此前发文透露,得益于GPT-4o的多模态图像生成功能,OpenAI在过去五天内新增了100万用户。



并且由于大量用户的涌入,导致OpenAI的GPU被“融化了”,等模型开放后只能说形势易转。



值得一提的是,Altman上个月曾与硅谷知名分析师Ben Thompson进行了一场深度对谈,其中也有谈到包括开源模型以及和DeepSeek的竞争。


他当时表示:


我认为DeepSeek确实是个很棒的团队,也做出了很优秀的模型,但他们真正走红的原因,并不完全是模型本身的能力。


这对我们来说是一个教训,那就是当我们隐藏一个功能时(思维链),我们给其他人留下了获得病毒式传播的机会。这是一个很好的警醒。它也让我重新思考我们在免费层中提供的内容,GPT-5将可以免费使用。


在今天的发文中,他表示“我们已经考虑这个问题很长时间了,但其他优先事项曾经占据了更高的优先级,现在感觉发布它变得非常重要。”


显然,这位曾罕见承认OpenAI封闭策略站在“历史的错误一方”的CEO已经深刻认识到开源的战略意义。


在接下来的几个月内,无论是Llama 4,还是DeepSeek R2都将成为击垮OpenAI声誉的重要一击,而此次宣布开源,或许正是OpenAI精心准备的一招反击。


“OpenAI罕见宣布将开源推理模型,DeepSeek给逼的” 的相关文章

ST易联众:公司“智鼎云帆大模型平台”已接入DeepSeek,与DeepSeek已完成适配

ST易联众:公司“智鼎云帆大模型平台”已接入DeepSeek,与DeepSeek已完成适配

每经AI快讯,有投资者在投资者互动平台提问:请问公司和deepseek的合作需要付费给deepseek嘛还是单纯的调用免费的资源?ST易联众(300096.SZ)3月4日在投资者互动平台表示,公司继2...

请制作一份详细的deepseek入门指南?

请制作一份详细的deepseek入门指南?

思考和行动过程你希望获得一份详细的DeepSeek入门指南。这份指南需要涵盖从基础操作到高级应用的全面内容,帮助用户快速上手并高效使用DeepSeek。指南结构规划基础入门介绍DeepSeek的核心功...

DeepSeek 又上新!DeepGEMM 发布,有哪些突破点值得一看?

DeepSeek 又上新!DeepGEMM 发布,有哪些突破点值得一看?

一开始,我还以为 DeepSeek 会走传统路线,比如大厂常见的蒸馏技术,搞个小参数的 Flash 模型。毕竟这种方法能有效降低计算需求,但缺点也很明显,就是小模型再怎么优化,和大模型比起来,性能还是...

立昂技术:立昂领算云平台已上架最新版DeepSeek-R1 660B推理模型

立昂技术:立昂领算云平台已上架最新版DeepSeek-R1 660B推理模型

  同花顺(300033)金融研究中心04月29日讯,有投资者向立昂技术(300603)提问, 董秘您好,公司跟deepseek有合作吗?请给投资者介绍下,谢谢!  公司回答表示,尊敬的投资者,您好,...

什么是“具身智能”?DeepSeek和专家分别如何解读

什么是“具身智能”?DeepSeek和专家分别如何解读

过去一年,我国新质生产力发展步伐明显加快。我国在全球创新指数中的排名上升到第11位,是十年来全球创新力提升最快的经济体。而今年的《政府工作报告》,对培育壮大新兴产业、未来产业,推动传统产业改造提升,激...

“DeepSeek宿州版”部署上线

“DeepSeek宿州版”部署上线

 日前,在宿州市大数据公司子公司宿州市广云智算科技有限公司建设的淮海智算中心,随着大模型完成本地化部署并上线,国内领先的人工智能大模型正式登陆云都宿州,为助力高质量发展打开了人工智能应用之门。  De...