当前位置:首页 > Deepseek最新资讯 > 正文内容

百度发布两款大模型,对标DeepSeek、聚焦多模态

5个月前 (03-16)Deepseek最新资讯378

3月16日,在文心一言正式发布两周年后,百度发布了多模态大模型文心4.5和对标DeepSeek的文心X1。

今日文心大模型4.5在百度智能云千帆大模型平台上线,输入价格为0.004元/千tokens;文心大模型X1输入价格0.002元/千tokens,为DeepSeek R1一半。

百度曾是国内最早一批发布大模型的厂商之一,在过去两年时间里,大模型领域国内大模型赛道竞争异常激烈,DeepSeek-R1以颠覆性姿态“杀”了进来,其开源+低价策略引发的"鲇鱼效应",迫使全球大模型厂商重新校准竞争维度。第一财经记者了解到,李彦宏在今年内部讲话中透露,百度将于下半年发布文心大模型的5.0版本,并加大AI应用商业化实践。接下来,百度还将在6月30日正式将文心大模型开源。

今日上午记者体验了百度原生多模态大模型文心4.5,用户可上传包括文档、图片、音频、视频的文件,让AI进行解读。记者上传了一张《哪吒》电影视频截图,就此询问文心4.5,但AI没能给出正确答案,而是称这是来自迪士尼动画电影《公主与青蛙》中的场景。不过在逻辑测试中,AI能准确识别脑筋急转弯的陷阱并给出回答,针对数学物理题、益智问答基本能给出准确回答。

文心大模型X1为深度思考模型,运用到的关键技术包括递进式强化学习、基于思维链和行动链的端到端训练、多元统一的奖励系统等,百度称在性能上对标DeepSeek-R1,具备“长思维链”。记者体验看到,除了联网搜索外,增加了多模态能力和多工具调用,能理解和生成图片,调用工具生成代码、图表等。目前DeepSeek-R1支持上传的附件仅识别文字。

在文本创作上,过去文心4.0的观点较为“端水”,4.5擅长写“锐评”;在图片理解方面,当记者再次拿出《哪吒》电影截图考考X1时,AI给出的答案是《快乐池塘》。记者在进一步的对话中告诉X1答错了,这是电影《哪吒》 场景后,AI表示感谢指正,经过分析后表示提供的图片场景确实出自电影《哪吒》。事实上AI每次错误都在拓宽技术边界,它的视觉理解也将在"犯错-修正"的螺旋中不断改进。

随着人工智能技术从基础问答向复杂推理跃迁,除了百度外,近期包括阿里旗下AI应用夸克、字节旗下豆包、腾讯混元等都陆续上线了“深度思考”功能。这也意味着生成式AI的竞争已从早期的信息整合、简单逻辑推导转向“认知重构”,试图让AI突破表层语义匹配,建立因果推理、价值判断及跨领域知识迁移能力。这种竞争不仅体现在模型性能上,各家更通过云计算捆绑、行业解决方案等生态卡位争夺B端市场。

(本文来自第一财经)


“百度发布两款大模型,对标DeepSeek、聚焦多模态” 的相关文章

教师分享:DeepSeek的深度使用攻略

教师分享:DeepSeek的深度使用攻略

在数字化时代,教育领域正经历深刻变革,高校教师肩负着提升教学质量、推动科研创新和高效管理学生的重任。DeepSeek 作为一款强大的人工智能工具,为教师提供了多维度的支持,能有效优化教学流程、加速科研...

山东移动济南分公司与山东第一医科大学合作DeepSeek项目

山东移动济南分公司与山东第一医科大学合作DeepSeek项目

近日,中国移动通信集团山东有限公司济南分公司与山东第一医科大学达成合作,成功落地DeepSeek项目,为学校部署DeepSeek-R1“满血”版大模型,标志着山东移动济南分公司在“AI+教育”领域迈出...

DeepSeek,带动AI进入“中国时刻”

DeepSeek,带动AI进入“中国时刻”

“海谈科技”核心观点DeepSeek在底层的训练模型的架构优化、基于强化学习的训练策略优化等多个方面的技术突破,均可圈可点;客户寻求AI算力及解决方案的热情非常高,AI在政务、教育等多个领域的落地正在...

引力传媒:公司已完成DeepSeek-R1的本地化部署

引力传媒:公司已完成DeepSeek-R1的本地化部署

每经AI快讯,有投资者在投资者互动平台提问:请问贵公司是真的已经完成deepseek本地化部署了吗引力传媒(603598.SH)2月24日在投资者互动平台表示,公司已完成DeepSeek-R1的本地化...

锚定“技术+场景”融合|中国电信新疆吐鲁番分公司成功举办DeepSeek大模型应用交流论坛

锚定“技术+场景”融合|中国电信新疆吐鲁番分公司成功举办DeepSeek大模型应用交流论坛

当DeepSeek大模型技术遇上丝绸之路明珠,会碰撞出怎样的火花?近日,中国电信新疆吐鲁番分公司以“智创未来·共赢发展”为主题,成功举办DeepSeek人工智能大模型交流论坛。活动汇聚各单位机构、行业...

1200行代码逆袭!DeepSeek工程师开源轻量级vLLM,吞吐量逼近原版

1200行代码逆袭!DeepSeek工程师开源轻量级vLLM,吞吐量逼近原版

机器之心报道机器之心编辑部开源社区的人应该对 vLLM 不陌生,它是一个由加州大学伯克利分校团队开发的高性能、开源 LLM 推理和服务引擎,核心目标是提升 LLM 的推理速度(吞吐量)和资源利用率(尤...