当前位置:首页 > Deepseek应用场景 > 正文内容

OpenAI罕见宣布将开源推理模型,DeepSeek给逼的

3个月前 (04-01)Deepseek应用场景210

就在刚刚,OpenAI CEO Sam Altman正式宣布,将在未来几个月内推出一款具备推理能力的强大开放权重语言模型,并期待与开发者共同探索如何最大化其潜力。


据Altman透露,这是自GPT-2以来OpenAI首次计划发布开放权重语言模型。


他坦言,虽然这一想法已酝酿许久,但此前其他优先事项占据了主导地位。如今,发布这款模型的时机变得尤为重要。



作为参考,开放权重(open weight)是指将AI模型(尤其是神经网络)的训练参数(即权重)公开,供公众使用、检查或进一步开发。


用户可以在这些权重的基础上进行修改,并将修改后的权重重新分发。


虽然开放权重不能完全等同于开源,是一种介于完全闭源和完全开源之间的折中方案,但它是开源理念在AI领域的一种延伸和部分实现,包括此前宣称开源的DeepSeek V3/R1同样只开放了权重。


在正式发布前,OpenAI将依据其“准备框架”对模型进行评估,确保其安全性与可靠性。


考虑到模型发布后可能被修改,团队还将开展额外测试与优化工作。


为进一步完善开发流程,OpenAI计划举办一系列开发者活动,以收集反馈并展示早期原型。首场活动将于数周后在旧金山启动,随后在欧洲和亚太地区陆续展开。


有兴趣参与的开发者可通过链接报名:
https://openai.com/open-model-feedback



OpenAI研究员约翰内斯·海德克(Johannes Heidecke)对此补充道:


“安全性是我们开发开放权重模型的核心。从预训练到发布,我们都会遵循严格的准备框架,确保不会推出可能引发灾难性风险的模型。尽管开放模型面临独特挑战,我们对此充满信心。”


目前,Altman的评论区已经乱成一锅粥了。


网友呼声最高的模型是OpenAI o1 mini,全球最大AI开源社区Hugging Face CEO Clément Delangue也现身评论区。



谈到开源,自然绕不开DeepSeek。R1和R2的身影也充斥着整个评论区。




网友是懂Sam Altman的。毕竟GPT-5也说是“未来几个月”发布,但至今未见踪影。



Altman此前发文透露,得益于GPT-4o的多模态图像生成功能,OpenAI在过去五天内新增了100万用户。



并且由于大量用户的涌入,导致OpenAI的GPU被“融化了”,等模型开放后只能说形势易转。



值得一提的是,Altman上个月曾与硅谷知名分析师Ben Thompson进行了一场深度对谈,其中也有谈到包括开源模型以及和DeepSeek的竞争。


他当时表示:


我认为DeepSeek确实是个很棒的团队,也做出了很优秀的模型,但他们真正走红的原因,并不完全是模型本身的能力。


这对我们来说是一个教训,那就是当我们隐藏一个功能时(思维链),我们给其他人留下了获得病毒式传播的机会。这是一个很好的警醒。它也让我重新思考我们在免费层中提供的内容,GPT-5将可以免费使用。


在今天的发文中,他表示“我们已经考虑这个问题很长时间了,但其他优先事项曾经占据了更高的优先级,现在感觉发布它变得非常重要。”


显然,这位曾罕见承认OpenAI封闭策略站在“历史的错误一方”的CEO已经深刻认识到开源的战略意义。


在接下来的几个月内,无论是Llama 4,还是DeepSeek R2都将成为击垮OpenAI声誉的重要一击,而此次宣布开源,或许正是OpenAI精心准备的一招反击。


“OpenAI罕见宣布将开源推理模型,DeepSeek给逼的” 的相关文章

我问Deepseek,人如何才能大彻大悟,看完答案我醒了

我问Deepseek,人如何才能大彻大悟,看完答案我醒了

原创 洞见 洞见洞见(DJ00123987)——不一样的观点,不一样的故事,2000万人订阅的微信大号。点击标题下蓝字“洞见”关注,我们将为您提供有价值、有意思的延伸阅读。作者:洞见yimo钱塘江上潮...

周鸿祎:建议对DeepSeek“幻觉”给予适度包容

周鸿祎:建议对DeepSeek“幻觉”给予适度包容

 中国青年报客户端北京3月5日电(中青报·中青网记者 周围围 李华锡)今年全国两会,全国政协委员、360集团创始人周鸿祎关注大模型话题。他认为,DeepSeek通过大模型技术范式的重大突破,让大模型加...

北京城市副中心多家医院布局DeepSeek!医生有了“智能助理”

北京城市副中心多家医院布局DeepSeek!医生有了“智能助理”

日前,北京市多家医院完成DeepSeek接入,通州融媒记者走访副中心多家完成DeepSeek部署的医院,了解人工智能可以为医疗带来哪些变化。快速信息整理北京安贞医院率先在北京电信健康云平台,成功落地D...

零一万物打算用DeepSeek赚钱了

零一万物打算用DeepSeek赚钱了

花费更多GPU和资源烧万亿参数大模型,还是做一个可以赚钱的商业公司,零一万物选择了后者,也因此成为“AI六小虎”中最早转向的公司。如今,零一万物朝着这一目标加速前进。3月17日,零一万物举办了一场线上...

DeepSeek开源第五弹:宣布开源3FS,所有Deepseek数据访问的助推器

DeepSeek开源第五弹:宣布开源3FS,所有Deepseek数据访问的助推器

每经快讯,2月28日,DeepSeek开源周第五天,DeepSeek在官方X账号宣布开源3FS,它是所有Deepseek数据访问的助推器。每日经济新闻...

DeepSeek在政务服务智能审批中有哪些应用场景

DeepSeek在政务服务智能审批中有哪些应用场景

DeepSeek在政务服务智能审批中有多个应用场景,这些场景充分展示了其在提升政务服务效率和质量方面的潜力。以下是DeepSeek在政务服务智能审批中的主要应用场景:1. 智能咨询服务全方位智能咨询:...