列表格式显示
热搜词:winrar ftp office photoshop 输入法 ghost win7
广告招商中...... 联系方式!
私信 +好友
1: bget_pub.rar
网络神采电脑版 是为用户提供网页数据采集的应用工具,体积比较小巧,无需安装即可使用,功能丰富强大,能够支持多任务、多线程同时运行,可以精准采集数据,进行数据分析以及处理,方便大家找到扩展销售推广渠道。
《网络神采》是一款用于网页数据采集的工具软件,用于快速采集、下载网页数据。支持智能采集(不用配规则)、可视化采集(不用看源文件),支持二次开发、分布式部署。为用户的大数据分析、信息化平台,提供稳定、持续、准确的数据资源。
1、运行稳定
系统运行稳定,要求“0 bug”。
2、流程化
支持定时采集,任务定时启动。通过插件开发,实现流程化的数据采集、数据分析与处理。
3、规模化
支持任务多级分类、批量管理。支持分布式部署,支持团队协作。
4、采集速度
支持多任务、多线程。多任务同时运行,每个任务支持多线程,确保运行效率。
5、采集强度
支持js解析、post分页、模拟点击、跨层采集。对于疑难采集页面,有成熟的解决方案。
1、操作方便快捷,支持可视化的配置界面。
2、软件简单好用,5-10分钟可配置一个采集任务。
3、为用户的大数据分析、信息化平台,提供稳定、持续、准确的数据资源。
4、支持插件开发,通过插件开发,可扩展软件功能。
1、本软件为绿色软件,不需要安装,解压后即可使用
2、双击运行“bget.exe”即可打开
3、免费版,无条数限制、无时间限制
可视化采集配置,操作细节:
1、废除选项:复制xpath时覆盖现有,改为:复制xpath时,按shift键可覆盖现有内容
2、显示完整xpath:选中后,不再取消当前元素,而是直接切换
3、gecko内核:换回 xulrunner_60.0.26,低版本 xulrunner_45.0.34 仍会出现 com 断开,体验太差
可视化采集配置,放大、缩小范围时:
1、循环采集:按shift键,支持连续 * 号
2、提取下一网址:默认为连续 * 号,按ctrl键为单个 * 号
3、多个 * 号时,加亮显示
修复bug:
1、循环采集:整条数据或“关键规则”采集失败后,url被回收多次
2、切换动态层:从当前层切换到动态层时,如果动态层使用了“模拟点击”,而当前层未使用,会导致“提取下一层xpath时出错: 未将对象引用设置到对象的实例”。
本页Html网址:/htmlsoft/3612.html
本页aspx网址:/soft.aspx?id=3612&bianhao=20231230_235943_336616&kind1=01网络软件&kind2=站长工具
上一篇:奇奇seo优化软件
下一篇:interbase数据库
增加