百木园-与人分享,
就是让自己快乐。

2016-2020Chinese-Weather-Analysis(二)

天气后报网——数据爬取(Scrapy框架)

 

1.创建天气后报网爬虫

  在开始编程之前,我们首先要根据项目需求对天气后报网站进行分析。目标是提取2016-2020年每个城市的每天的温度、天气状况、风力风向等数据。首先来到天气后报网(http://www.tianqihoubao.com/lishi/)。如图1所示。

  

  

              图 1

  可以看到列表中每个省份下的城市信息,以北京市为例,点击进去,进入二级页面。

、              图 2 

   以2011年1月北京天气为例,进入三级页面(详情页面),其中可以看到日期、天气状况、气温、风力风向等所需的信息。

               图 3

  以上将整个爬虫项目的流程分析完成,编程可以开始了。首先在命令行中切换到用于存储项目的路径,然后输入下面命令创建爬虫项目和爬虫模块:

1 scrapy startproject tqhbCrawl
2 cd tqhbCrawl
3 scrapy genspider -t crawl tqhb_spider \"tianqihoubao.com/lishi/\"

来源:https://www.cnblogs.com/chyhoo/p/14581518.html
图文来源于网络,如有侵权请联系删除。

未经允许不得转载:百木园 » 2016-2020Chinese-Weather-Analysis(二)

相关推荐

  • 暂无文章