技术 | Python的从零开始系列连载(三十三)

  • 时间:
  • 浏览:1
  • 来源:uu直播快3平台

3.把每另一一个MM的写真图片按照文件夹保存到本地

2)写入文本

1)写入图片

3.代码完善

主要的知识点不可能 在前面都涉及到了,不可能 没那么人前面的章节都不可能 看到,完成这名爬虫找不到话下,具体的详情在此不再赘述,直接帖代码啦。

2.抓取简要信息

相信没那么人经过上几个的实战,对抓取和提取页面的地址不可能 非常熟悉了,这里没哪些地方地方难度了,没那么人首先抓取本页面的MM详情页面地址,姓名,年龄等等的信息打印出来,直接贴代码如下

1.URL的格式

在这里没那么人用到的URL是 http://mm.taobao.com/json/request_top_list.htm?page=1,

问号前面是基地址,上端的参数page是代表第几页,可不不需要 随意更换地址。点击开就让 ,会发现有有些淘宝MM的简介,并附有超链接链接到各人详情页面。

没那么人须要抓取本页面的头像地址,MM姓名,MM年龄,MM居住地,以及MM的各人详情页面地址。

4.熟悉文件保存的过程

2.抓取每另一一个MM的资料简介以及写真图片

运行结果如下



2.文件写入简介

在这里,没那么人有写入图片和写入文本本身措施

3)创建新目录

以上另一一个文件若果所有的代码内容,运行一下试试看,那叫另一一个酸爽啊



看看文件夹上端哪些地方地方变化





不知不觉,海量的MM图片不可能 进入了你的电脑,还不快快去试试看!!

本篇目标

1.抓取淘宝MM的姓名,头像,年龄

原文发布时间为:2018-12-21

本文作者:灯塔大数据

本文来自云栖社区商务商务合作伙伴“灯塔大数据”,了解相关信息可不不需要 关注“DTbigdata”微信公众号