网友评分:
9.7分
飞腾反黄软件 V2.3.0.1010 官方版
全能模拟王自动点击软件 V17.1.1 绿色最新版
Sangfor WebShellKiller(网站暗链检测工具) V3.3.0.2 绿色免费版
Easy Web Editor(可视化网页制作软件) V2016.40.1 官方版
Google Web Designer(网页编辑器) V8.0.3.0603 官方版
Advanced PDF Page Extractor(PDF页面提取软件) V1.5 官方版
Fiddler4网页抓包软件 V5.0.2 官方版
我要看vip视频Chrome插件 V1.4.1 绿色版
网页信息收集器是一款绿色小巧,功能实用的网页信息采集软件,可以很方便的针对某个网站的信息内容进行收集。需要的快来下载使用吧!
1、执行任务
根据已建立的任务信息保存、提取网页,也可通过“双击”某项任务启动此功能
2、新建、复制、修改、删除任务
新建、复制、修改、删除任务信息
3、默认选项
设置默认工作路径(默认为当前程序目录下的WorkDir文件夹)
设置默认提取测试数 (默认为10)
设置默认文本分隔符 (默认为 *)
4、新建、编辑任务信息
任务名称:在默认的工作文件夹下生成以此命名的文件夹。
登录地址:针对某些需要登录才能查看其网页内容的网站,填写登录页面地址。在执行任务时,软件会打开此登录页面让您登录该网站
序数格式类型网页、非序数格式类型网:
这里的序数格式、非序数格式主要是指提取地址是否仅仅是数字的变化。例如类似于:
①http://xxx.com/1.html 和 http://xxx.com/2.html 就属于序数格式
②http://xxx.com/abc.html 和 http://xxx.com/def.html 则属于非序数格式
列表地址:在类型为“非序数格式类型网”时,第一页列表的链接地址
提取地址:由实际保存的网页地址共同部分 + * 号组成。
例如要提取:
①http://xxx.com/1.html 和 http://xxx.com/2.html 则提取地址为 http://xxx.com/*.html
②http://abc.xxx.com/abc.html 和 http://test.xxx.com/def.html 则提取地址为 http://*.xxx.com/*.html
翻页地址:为列表网页上的“下一页”链接地址,将其中变化的部分用 * 号代替。
页数起始:要开始提取的页数
页数截止:要停止提取的页数
当前页数:当前已经提取到的页数
已保存网页数:已经保存的网页数
任务详细描述:该任务的详细描述信息
标签: 网页信息