当前位置:首页 > Deepseek最新资讯 > 正文内容

OpenAI发布低成本模型 与

2个月前 (08-06)Deepseek最新资讯216

  OpenAI周二发布了自2019年推出GPT-2以来首批开放权重语言模型。这两款纯文本模型分别命名为gpt-oss-120b和gpt-oss-20b,旨在为开发者、研究人员和企业提供更易运行和定制的低成本选项。

  当人工智能模型的参数(即训练过程中优化输出和预测能力的要素)公开可用时,该模型即被视为开放权重。此类模型虽能提供透明度和控制权,但不同于开源模型——后者允许用户完全获取并修改源代码。

  近年来,Meta、微软支持的Mistral AI以及中国初创企业DeepSeek等公司也相继发布了开放权重模型。

  OpenAI总裁格雷格·布罗克曼在简报会上表示,见证这个生态系统的成长令人振奋,我们很荣幸能参与其中并推动技术边界,进而观察其发展轨迹。该公司与英伟达、超威半导体、Cerebras及Groq合作deepseek,确保模型能在多种芯片上稳定运行。

  OpenAI向世界展示了基于英伟达AI技术的可能性,如今他们正在开源软件领域推动创新,英伟达CEO黄仁勋在声明中评价道。

  此次发布备受期待,部分原因是公司曾多次推迟上线。OpenAI CEO萨姆·奥尔特曼七月在X平台发文称需要更多时间进行额外安全测试并审查高风险领域,此前六月他也明确表示模型不会当月发布。

  OpenAI周二声明已对开放权重模型实施全面安全训练与测试。在预训练阶段清除了有害的化学、生物、放射性与核武器相关数据,并模拟了恶意行为者可能进行的模型微调。

  测试表明,经恶意调优的模型无法达到其准备框架设定的高能力阈值——这是该公司衡量和防范危害的评估体系。OpenAI还透露已邀请三个独立专家团队对恶意微调评估提供反馈。

  用户可通过Hugging Face和GitHub等平台依据Apache 2.0许可证下载模型权重,并借助LM Studio、Ollama等程序在个人电脑运行。亚马逊云、Baseten和微软云也将提供模型服务。

  这两款模型均具备高级推理、工具调用和思维链处理能力,适配从消费级硬件到云端乃至终端设备的各种环境。例如gpt-oss-20b可在笔记本电脑运行,作为能检索文件和辅助写作的个人助手。

  我们很荣幸将这项耗资数十亿美元的研究成果开放给全世界,让尽可能多的人掌握AI技术,奥尔特曼在周二的声明中表示。原文出处:OpenAI发布低成本模型 与,感谢原作者,侵权必删!

标签: deepseek

“OpenAI发布低成本模型 与” 的相关文章

DeepSeek母公司总监被查!套取上亿佣金

DeepSeek母公司总监被查!套取上亿佣金

  幻方量化,是今年在科技圈惊艳四座的DeepSeek母公司,它们的创始人都是梁文锋。成立仅十年,其便因市场总监的行为卷入亿元级风暴。   据报道,李橙曾任职于招商证券,...

DeepSeek母公司亿元返佣案持续发酵,涉及招商证券

DeepSeek母公司亿元返佣案持续发酵,涉及招商证券

  作为DeepSeek的母公司,幻方量化近年来备受关注。在去年11月,就有消息盛传,称“幻方量化市场总监李橙涉券商返佣被带走”。   据近日报道,李橙在2018—202...

“DeepSeek问世半年影响仍在,改写了业界思维方式”

“DeepSeek问世半年影响仍在,改写了业界思维方式”

  【文/观察者网 柳白】半年多前,中国人工智能应用DeepSeek横空出世,在全球科技界掀起轩然大波。   英国广播公司(BBC)8月10日发文写道,DeepSeek震...

DeepSeek引领AI创新突破:建筑设计行业技术革新深度解析

DeepSeek引领AI创新突破:建筑设计行业技术革新深度解析

  行业专家普遍觉得,跟着深度进修模型的赓续优化和硬件算力的继续提升,未来,开启了“智能设计”新期间。更标志着AI在专业设计领域的深度交融,赞助设计师实现“从草稿到成品”的高效转变。经由历...

腾讯元宝接入DeepSeek V3.1,Kimi模型速度达每秒100 Token

腾讯元宝接入DeepSeek V3.1,Kimi模型速度达每秒100 Token

  8月23日AI智榜日报: 腾讯元宝接入新版DeepSeek V3.1,AI响应速度再升级; Kimi平台推出性能更强的kimi-k2-turbo-preview模型,输出速度飙升至每秒...

数据对比告诉你:为什么霍伊伦进球了,但塞斯科还得买!

数据对比告诉你:为什么霍伊伦进球了,但塞斯科还得买!

  昨晚开始传出实质性的消息,DO也跟进了,基本就是看最后怎么谈了。虽然纽卡也将塞斯科列为头号目标,但以目前放出的风声,塞斯科会优先选择曼联。   今夏真正跟曼联传出过实...