Fork me on GitHub

hawk

hawk

注:有时候网页采集器中的url获取不到真实数据,就不能抓到数据。

网页采集器

搜索字符=>属性名=>手气不错

就可以抓到数据,有时候要多试几次。

数据清洗

生成区间数=>选择区间(也就是页数)
合并多列=>填写输出列的名称=>Format 填写utl(0)。
从爬虫转换=>一般不用 填爬虫选择
写入数据表=>给数据定义名字
数据库操作
导出=>串行模式/并行模式。

-------------本文结束感谢您的阅读-------------