爬虫房价交易数据
这是一个作者毕业设计的爬虫,爬取58同城、赶集网、链家、安居客、我爱我家网站的房价交易数据。关于AWK文的使用方法 File_catalog.awk提供了一套处理爬虫数据的算法。算法使用GNU工具awk语言实现
应用介绍
这是一个作者毕业设计的爬虫,爬取58同城、赶集网、链家、安居客、我爱我家网站的房价交易数据
#关于AWK文的使用方法 File_catalog.awk提供了一套处理爬虫数据的算法。算法使用GNU工具awk语言实现。 使用awk程序用此算法处理后数据可以按月和房屋类型拆分为不同文件。 使用方法: Linux/Unix(或者其他可以使用awk程序的平台) awk -f [File_catalog.awk的位置] [需要处理的爬虫数据(文件名必须包含xinfang/ershoufang/zufang,数据第一列必须为年月的六位数字如201604)]
©版权声明:本文内容由互联网用户自发贡献,版权归原创作者所有,本站不拥有所有权,也不承担相关法律责任。如果您发现本站中有涉嫌抄袭的内容,欢迎发送邮件至: www_apollocode_net@163.com 进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
转载请注明出处: apollocode » 爬虫房价交易数据
文件列表(部分)
名称 | 大小 | 修改日期 |
---|---|---|
File_catalog.awk | 0.21 KB | 2016-05-04 |
scrapy.cfg | 0.19 KB | 2016-05-04 |
items.py | 0.30 KB | 2016-05-04 |
items.pyc | 0.38 KB | 2016-05-04 |
pipelines.py | 1.08 KB | 2016-05-04 |
pipelines.pyc | 1.23 KB | 2016-05-04 |
settings.py | 1.20 KB | 2016-05-04 |
settings.pyc | 0.27 KB | 2016-05-04 |
city.py | 0.38 KB | 2016-05-04 |
city.pyc | 0.56 KB | 2016-05-04 |
ershoufang.py | 1.21 KB | 2016-05-04 |
ershoufang.pyc | 1.31 KB | 2016-05-04 |
startURL.py | 144.79 KB | 2016-05-04 |
startURL.pyc | 0.67 KB | 2016-05-04 |
startURL_cs.py | 0.31 KB | 2016-05-04 |
startURL_cs.pyc | 0.67 KB | 2016-05-04 |
startURL_quanguo.py | 144.79 KB | 2016-05-04 |
startURL_quanguo.pyc | 145.68 KB | 2016-05-04 |
zufang.py | 1.08 KB | 2016-05-04 |
zufang.pyc | 1.25 KB | 2016-05-04 |
__init__.py | 0.13 KB | 2016-05-04 |
__init__.pyc | 0.12 KB | 2016-05-04 |
__init__.py | 0.00 KB | 2016-05-04 |
__init__.pyc | 0.12 KB | 2016-05-04 |
startURL.txt~ | 172.67 KB | 2016-05-04 |
startURL_quanguo.txt~ | 90.19 KB | 2016-05-04 |
scrapy.cfg | 0.19 KB | 2016-05-04 |
items.py | 0.30 KB | 2016-05-04 |
items.pyc | 0.35 KB | 2016-05-04 |
items.py~ | 0.30 KB | 2016-05-04 |
发表评论 取消回复