项目要求: 自动登陆淘宝 自动填充搜索关键字 自动翻页 提取商品信息 将提取的商品信息存入到数据库 项目分析: 淘宝网的登陆,需要拖动验证图片进行人机识别,因此可以使用selenium框架完成此操作 使用selenium完成搜索、翻页、提取即可 抓取的数据存入mysql中 爬虫调试完毕后,可以使用selenium的无头模式进行运行 详细过程,参考课件视频
讨论区