当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新专利“一种广度数据采集的方法及其系统”公布,可减少数据采集时网络资源消耗

4个月前 (04-02)Deepseek最新资讯365

国家知识产权局官网显示,4月1日,DeepSeek关联公司杭州深度求索人工智能基础技术研究有限公司申请的“一种广度数据采集的方法及其系统”专利公布。

摘要显示,本发明涉及数据采集领域,尤其涉及一种广度数据采集的方法及其系统,包括:建立网页元信息库;确定每日调度单元下载配额及当日下载总额度;从网页元信息库中选取相应数量的链接,分配下载额度;下载过程控制;下载文本进行后处理及数据清洗后进入回灌队列,通过信息回灌实现网页元信息库更新。本发明的有益效果在于:发现尽可能多的网页链接,并减少对网站的流量冲击;对已经下载的内容进行分析,对未下载的连接进行质量推断,通过择优下载分配额度的方式,减少低质量网页下载和重复下载,提高数据质量及下载效率,减少在数据采集过程中网络资源的消耗;采用单独的信息回灌队列,保证网页元信息库修改操作的原子性和稳定性。


“DeepSeek新专利“一种广度数据采集的方法及其系统”公布,可减少数据采集时网络资源消耗” 的相关文章

床垫界也有“DEEPSEEK”?慕思床垫AI升级引发全球科技圈关注

床垫界也有“DEEPSEEK”?慕思床垫AI升级引发全球科技圈关注

在DEEPSEEK爆火,各式各样的AI技术被嵌入生活中各种场景的当下,一场关于“睡眠”的智能化革命悄然升温。近日,在全球消费电子领域的“风向标”CES 2025展会上,慕思床垫凭借最新发布的...

DeepSeek与财富管理:慧眼识机,决胜千里

DeepSeek与财富管理:慧眼识机,决胜千里

在数字化浪潮席卷各行各业的今天,传统的财富管理模式正面临前所未有的挑战。财富管理不仅需要处理大量复杂的信息和数据,还需面对市场波动的风险和客户需求的多样化。然而,随着人工智能技术的飞速发展,尤其是De...

平安健康与DeepSeek深度融合,加速医疗智能化进程

平安健康与DeepSeek深度融合,加速医疗智能化进程

2025年初,全球AI领域迎来了一场革命性的技术突破,开源大模型DeepSeek迅速崛起,成为众多企业竞相部署的关键技术。在中国市场,平安健康作为互联网医疗领域的领军企业,宣布已完成DeepSeek的...

互联网正在沦为“信息垃圾场”,真的是DeepSeek们的错吗?

互联网正在沦为“信息垃圾场”,真的是DeepSeek们的错吗?

“那是最美好的时代,那是最糟糕的时代;那是智慧的年头,那是愚昧的年头……”一百多年前,狄更斯在《双城记》开篇写下的句子,精准描绘出两次工业革命交替之际希望与危机并存的矛盾局面。如今,在人工智能的浪潮中...

DeepSeek助你复试,复试秒杀!

DeepSeek助你复试,复试秒杀!

想必大家都开始准备复试了吧!今天来教大家如何深入的利用DeepSeek拿捏复试,给大家准备好指令,速来领取!一、生成系统复试学习计划向DeepSeek提供你的基础信息,如目标院校、专业、当前学习进度、...

暴击GPT-4.5,DeepSeek-V3-0324官方报告出炉!系统提示、最佳温度全放出

暴击GPT-4.5,DeepSeek-V3-0324官方报告出炉!系统提示、最佳温度全放出

【新智元导读】只有660B参数的开源模型,在数学和编程性能上击败了GPT-4.5和Claude 3.7。DeepSeek-V3-0324新版本的发布让全球网友为之疯狂,推理能力提升近20%,模型权重已...