1. 首页
  2. Python

每天一个python爬虫练习,抓取落网音乐信息!小众音乐必备

“u003Cdivu003Eu003Cp class=”正文”u003Eu003Cimg src=”http:u002Fu002Fp3.pstatp.comu002Flargeu002F66b300003533e451ec82″ img_width=”1024″ img_height=”949″ alt=”每天一个python爬虫练习,抓取落网音乐信息!小众音乐必备” inline=”0″u003Eu003Cu002Fpu003Eu003Cp class=”正文”u003E最近浏览网站的时候,偶尔发现了一个非常棒的音乐网站,先给大家分享下:u003Cu002Fpu003Eu003Cp class=”正文”u003Eu003Cimg src=”http:u002Fu002Fp1.pstatp.comu002Flargeu002F66b300003534ca5f0082″ img_width=”709″ img_height=”426″ alt=”每天一个python爬虫练习,抓取落网音乐信息!小众音乐必备” inline=”0″u003Eu003Cu002Fpu003Eu003Cp class=”正文”u003E非常不错的一个音乐网站,做为一个热爱音乐而且正在学习python的新手,怎么能不爬一下呢~!u003Cu002Fpu003Eu003Cp class=”正文”u003E先来分析下网站u003Cu002Fpu003Eu003Cp class=”正文”u003Eu003Cimg src=”http:u002Fu002Fp1.pstatp.comu002Flargeu002F66b00001ac83d410a9de” img_width=”461″ img_height=”109″ alt=”每天一个python爬虫练习,抓取落网音乐信息!小众音乐必备” inline=”0″u003Eu003Cu002Fpu003Eu003Cp class=”正文”u003Eu003Cimg src=”http:u002Fu002Fp1.pstatp.comu002Flargeu002F66ae00056dd9b6a404ea” img_width=”570″ img_height=”99″ alt=”每天一个python爬虫练习,抓取落网音乐信息!小众音乐必备” inline=”0″u003Eu003Cu002Fpu003Eu003Cp class=”正文”u003E打开期刊,可以看到有许多的分类,每一个分类下又存在很多的专辑,我们随便进入一个专辑,很明显,音乐数据就在这里,先用F12打开开发者工具,然后点击音乐看看u003Cu002Fpu003Eu003Cp class=”正文”u003Eu003Cimg src=”http:u002Fu002Fp1.pstatp.comu002Flargeu002F66b20000fe0c851dd547″ img_width=”744″ img_height=”497″ alt=”每天一个python爬虫练习,抓取落网音乐信息!小众音乐必备” inline=”0″u003Eu003Cu002Fpu003Eu003Cp class=”正文”u003E很明显,我们找到音乐的标签了,但是href的属性是js格式,而不是我们所熟悉的url,那怎么办呢,我们点击开发者工具的网络抓下包看看吧!u003Cu002Fpu003Eu003Cp class=”正文”u003Eu003Cimg src=”http:u002Fu002Fp1.pstatp.comu002Flargeu002F66b20000fe0d1763ee08″ img_width=”1188″ img_height=”535″ alt=”每天一个python爬虫练习,抓取落网音乐信息!小众音乐必备” inline=”0″u003Eu003Cu002Fpu003Eu003Cp class=”正文”u003E这里要注意一点,就是我们也可以抓到整个网页的json格式数据,但是里面并没有音乐的url地址,所以我们直接找媒体选项,然后抓到了它的url(需要缓存几秒)。我们复制几条url来分析下u003Cu002Fpu003Eu003Cp class=”正文”u003E这里可以看到,mp3的地址很规律,但是url中间的884是什么呢?到源码中找找u003Cu002Fpu003Eu003Cp class=”正文”u003Eu003Cimg src=”http:u002Fu002Fp1.pstatp.comu002Flargeu002F66b100017f247e377b67″ img_width=”682″ img_height=”392″ alt=”每天一个python爬虫练习,抓取落网音乐信息!小众音乐必备” inline=”0″u003Eu003Cu002Fpu003Eu003Cp class=”正文”u003E果然在源码中找到了(第二个884是在网页最后的说明文字中间含有,不用理会!)u003Cu002Fpu003Eu003Cp class=”正文”u003EOk,网页分析完毕u003Cu002Fpu003Eu003Cp class=”正文”u003E接下来制定我们的目标:首先我们直接建立一个文件夹存放url(为了不给网站造成压力,就不直接下载mp3了,将mp3的url保存下来,有需要的话,自行下载即可)u003Cu002Fpu003Eu003Cp class=”正文”u003E然后按期刊分类建立txt文档,在将专辑名、歌曲名、演唱者、歌曲url依次存入文档u003Cu002Fpu003Eu003Cp class=”正文”u003E好了,过程就不一一说明了,直接上代码和结果!相关的说明都已经注释了。u003Cu002Fpu003Eu003Cp class=”正文”u003Eu003Cimg src=”http:u002Fu002Fp3.pstatp.comu002Flargeu002F66b20000fe0ef00f7b53″ img_width=”1278″ img_height=”1557″ alt=”每天一个python爬虫练习,抓取落网音乐信息!小众音乐必备” inline=”0″u003Eu003Cu002Fpu003Eu003Cp class=”正文”u003Eu003Cimg src=”http:u002Fu002Fp9.pstatp.comu002Flargeu002F66ae00056ddc677022b2″ img_width=”592″ img_height=”193″ alt=”每天一个python爬虫练习,抓取落网音乐信息!小众音乐必备” inline=”0″u003Eu003Cu002Fpu003Eu003Cp class=”正文”u003Eu003Cimg src=”http:u002Fu002Fp3.pstatp.comu002Flargeu002F66b300003538466abda0″ img_width=”706″ img_height=”465″ alt=”每天一个python爬虫练习,抓取落网音乐信息!小众音乐必备” inline=”0″u003Eu003Cu002Fpu003Eu003Cp class=”正文”u003Eu003Cimg src=”http:u002Fu002Fp1.pstatp.comu002Flargeu002F66b3000035398d33fcae” img_width=”512″ img_height=”721″ alt=”每天一个python爬虫练习,抓取落网音乐信息!小众音乐必备” inline=”0″u003Eu003Cu002Fpu003Eu003Cp class=”正文”u003E我们来验证下结果:u003Cu002Fpu003Eu003Cp class=”正文”u003Eu003Cimg src=”http:u002Fu002Fp1.pstatp.comu002Flargeu002F66ad00057e7d1a858c6e” img_width=”1155″ img_height=”695″ alt=”每天一个python爬虫练习,抓取落网音乐信息!小众音乐必备” inline=”0″u003Eu003Cu002Fpu003Eu003Cpu003E喜欢就关注下呗~!需要源码或者更多资料的可以私信我,发送”资料”即可!u003Cu002Fpu003Eu003Cu002Fdivu003E”

原文始发于:每天一个python爬虫练习,抓取落网音乐信息!小众音乐必备

主题测试文章,只做测试使用。发布者:醒百年,转转请注明出处:http://www.cxybcw.com/13354.html

联系我们

13687733322

在线咨询:点击这里给我发消息

邮件:1877088071@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

QR code