请稍候,加载中....

淘宝网热门商品

项目要求:

  1. 自动登陆淘宝
  2. 自动填充搜索关键字
  3. 自动翻页
  4. 提取商品信息
  5. 将提取的商品信息存入到数据库

项目分析:

  1. 淘宝网的登陆,需要拖动验证图片进行人机识别,因此可以使用selenium框架完成此操作
  2. 使用selenium完成搜索、翻页、提取即可
  3. 抓取的数据存入mysql中
  4. 爬虫调试完毕后,可以使用selenium的无头模式进行运行

 

详细过程,参考课件视频


Python学习手册-