1. 首页
  2. Python

简单应用Selenium+PhantomJS来抓取煎蛋网妹子图

“u003Cdivu003Eu003Cpu003Eu003Cimg src=”http:u002Fu002Fp3.pstatp.comu002Flargeu002Fpgc-imageu002F1521606163978d7431975a4″ img_width=”1280″ img_height=”848″ alt=”简单应用Selenium+PhantomJS来抓取煎蛋网妹子图” inline=”0″u003Eu003Cu002Fpu003Eu003Cpu003E那天有朋友找我一起抓妹子图片,像我这么正派的人,肯定是要抱着学习的目的……打开网页,哇!又…又要上火了。。。。u003Cu002Fpu003Eu003Cpu003Eu003Cimg src=”http:u002Fu002Fp3.pstatp.comu002Flargeu002Fpgc-imageu002F1521606186746152ce322da” img_width=”550″ img_height=”318″ alt=”简单应用Selenium+PhantomJS来抓取煎蛋网妹子图” inline=”0″u003Eu003Cu002Fpu003Eu003Cpu003E话不多说,先看看网页吧!u003Cu002Fpu003Eu003Cpu003Eu003Cimg src=”http:u002Fu002Fp3.pstatp.comu002Flargeu002Fpgc-imageu002F1521606201972eca50b33fc” img_width=”550″ img_height=”284″ alt=”简单应用Selenium+PhantomJS来抓取煎蛋网妹子图” inline=”0″u003Eu003Cu002Fpu003Eu003Cpu003E熟练的打开网页,找到妹子图,然后 F12打开开发者工具,定位,ok,图片地址找到了,so easy~!我们写入代码看看u003Cu002Fpu003Eu003Cpu003Eu003Cimg src=”http:u002Fu002Fp1.pstatp.comu002Flargeu002Fpgc-imageu002F152160622587797d36f2d3c” img_width=”548″ img_height=”194″ alt=”简单应用Selenium+PhantomJS来抓取煎蛋网妹子图” inline=”0″u003Eu003Cu002Fpu003Eu003Cpu003EWTF~!u003Cu002Fpu003Eu003Cpu003E返回了个空列表?加了 header也是这样,为啥呢,来打开源码看看u003Cu002Fpu003Eu003Cpu003Eu003Cimg src=”http:u002Fu002Fp3.pstatp.comu002Flargeu002Fpgc-imageu002F1521606240896c350ebe6b0″ img_width=”1214″ img_height=”101″ alt=”简单应用Selenium+PhantomJS来抓取煎蛋网妹子图” inline=”0″u003Eu003Cu002Fpu003Eu003Cpu003E原来是 js数据,这就麻烦了,难道先去学习下 js语法,拿 js文件,分析逻辑,找最终的 url吗?u003Cu002Fpu003Eu003Cpu003Eu003Cimg src=”http:u002Fu002Fp1.pstatp.comu002Flargeu002Fpgc-imageu002F152160626607428e627d3d0″ img_width=”555″ img_height=”291″ alt=”简单应用Selenium+PhantomJS来抓取煎蛋网妹子图” inline=”0″u003Eu003Cu002Fpu003Eu003Cpu003E让我们用 selenium+PhantomJS试试吧!u003Cu002Fpu003Eu003Cpu003E安装请自行百度(有些麻烦,需要下载各种浏览器的相关驱动文件,网上一堆教程)u003Cu002Fpu003Eu003Cpu003E我们先获取源码后找找刚才的标签看看效果!u003Cu002Fpu003Eu003Cpu003Eu003Cimg src=”http:u002Fu002Fp1.pstatp.comu002Flargeu002Fpgc-imageu002F1521606276076494f2cb2dc” img_width=”958″ img_height=”84″ alt=”简单应用Selenium+PhantomJS来抓取煎蛋网妹子图” inline=”0″u003Eu003Cu002Fpu003Eu003Cpu003E吼吼~乖乖的出现了吧!u003Cu002Fpu003Eu003Cpu003E下面的流程就简单了,找到 URL中翻页按钮,循环它,直到没有为止!然后写个获取图片并下载的函数,不到 40行代码搞定!剩下的就是静静等待了!u003Cu002Fpu003Eu003Cpu003Eu003Cimg src=”http:u002Fu002Fp3.pstatp.comu002Flargeu002Fpgc-imageu002F15216063843371f83e8e833″ img_width=”534″ img_height=”361″ alt=”简单应用Selenium+PhantomJS来抓取煎蛋网妹子图” inline=”0″u003Eu003Cu002Fpu003Eu003Cpu003E完整代码和下载效果如下:u003Cu002Fpu003Eu003Cpu003Eu003Cimg src=”http:u002Fu002Fp1.pstatp.comu002Flargeu002Fpgc-imageu002F152160642168734a1a831d9″ img_width=”545″ img_height=”532″ alt=”简单应用Selenium+PhantomJS来抓取煎蛋网妹子图” inline=”0″u003Eu003Cu002Fpu003Eu003Cpu003Eu003Cimg src=”http:u002Fu002Fp1.pstatp.comu002Flargeu002Fpgc-imageu002F152160642174747d8fa4f58″ img_width=”785″ img_height=”395″ alt=”简单应用Selenium+PhantomJS来抓取煎蛋网妹子图” inline=”0″u003Eu003Cu002Fpu003Eu003Cpu003Eu003Cimg src=”http:u002Fu002Fp1.pstatp.comu002Flargeu002Fpgc-imageu002F1521606422109d94c9e21f3″ img_width=”1032″ img_height=”607″ alt=”简单应用Selenium+PhantomJS来抓取煎蛋网妹子图” inline=”0″u003Eu003Cu002Fpu003Eu003Cpu003Eu003Cimg src=”http:u002Fu002Fp3.pstatp.comu002Flargeu002Fpgc-imageu002F15216064218542a1186a041″ img_width=”486″ img_height=”321″ alt=”简单应用Selenium+PhantomJS来抓取煎蛋网妹子图” inline=”0″u003Eu003Cu002Fpu003Eu003Cpu003E需要源码或者想一起学习的小伙伴可以私信我发送”源码”哦!u003Cu002Fpu003Eu003Cu002Fdivu003E”

原文始发于:简单应用Selenium+PhantomJS来抓取煎蛋网妹子图

主题测试文章,只做测试使用。发布者:战鹰,转转请注明出处:http://www.cxybcw.com/13332.html

联系我们

13687733322

在线咨询:点击这里给我发消息

邮件:1877088071@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

QR code