百木园-与人分享,
就是让自己快乐。

selenium实战:窗口化爬取*宝数据(附源码链接)

完整代码&火狐浏览器驱动下载链接:https://pan.baidu.com/s/1pc8HnHNY8BvZLvNOdHwHBw 提取码:4c08

双十一刚过,想着某宝的信息看起来有些少很难做出购买决定。于是就有了下面的设计:​

 

既然有了想法那就赶紧说干就干趁着双十二还没到

 

 

 

 

 

 

一、准备工作:安装 :selenium 和 tkinter

pip install selenium

pip install tkinter

下载火狐浏览器驱动

二、网站分析发现web端如果不登录就不能进行查找商品

 

 

登录后查找口红

发现url竟然张这样

https://s.taobao.com/search?q=口红&imgfile=&js=1&stats_click=search_radio_all%3A1&initiative_id=staobaoz_20211117&ie=utf8&bcoffset=1&ntoffset=1&p4ppushleft=2%2C48&s=44

通过观察发现url中的q=**表示的是搜索的内容 s=**表示页数

接下来确定网页中我们将要采集的数据

 

 

 

 

采集的数据有:商品价格;付款人数;商品标题;店铺url;店家地址;

三、代码编写1、类库引用

import json
import pandas as pd
from selenium import webdriver
import time
from tkinter import *
import tkinter.messagebox

来源:https://www.cnblogs.com/t-dashuai/p/15570839.html
图文来源于网络,如有侵权请联系删除。

未经允许不得转载:百木园 » selenium实战:窗口化爬取*宝数据(附源码链接)

相关推荐

  • 暂无文章