搜索
简帛阁>技术文章>python3 爬取图片的实例代码

python3 爬取图片的实例代码

具体代码如下所示:

#coding=utf8
from urllib import request
import re
import urllib,os
url='http://tieba.baidu.com/p/3840085725'
def get_image(url):
  #获取页面源码
  page = urllib.request.urlopen(url)
  html = page.read()
  #解码,否则报错
  html = html.decode('utf8')
  #正则匹配获取()的内容
  reg = r'src="(https.+?.[jpg,png])"'
  imge = re.compile(reg)
  # 获取正则匹配的数据,"(.+?.jpg)" 的数据,返回一个list
  imglist = imge.findall(html)
  return imglist
def save_img(imglist):
  dir = os.path.join(os.path.dirname(__file__),'img')
  i=1
  for img in imglist:
    #python3格式化字符串的另一种写法
    imgpath = f'{dir}\\image{i}.jpg'
    try:
      #urlretrieve下载图片并保存到本地
      urllib.request.urlretrieve(img,imgpath)
      i += 1
      print(u'图片开始下载')
    except Exception:
      print(f'image:{img}下载失败')
      continue
imglist = get_image(url)
save_img(imglist)

总结

具体代码如下所示:codingutf8fromurllibimportrequestimportreimporturllib,osurl'http://tiebabaiducom/p/38400857
所谓其实就是获取链接内容保存到本地。所以之前需要先知道要链接是什么。要爬取页面是这个:http://findiconscom/pack/2787/beautiful_flat_icons
虫思路初步尝试我先查看了network,并没有发现有可用API;然后又用bs4去分析英雄列表页,但是请求到html里面,并没有英雄列表,在英雄列表节点上,只有“正在加载中”这样字样;同样方法
这篇文章主要介绍了Python爬虫煎蛋网图片代码实例,文中通过示例代码介绍非常详细,对大家学习或者工作具有一定参考学习价值,需要朋友可以参考下今天,试着爬取了煎蛋网图片。用到包:url
说明:这里仅展示在已经获取图片链接后下载方式,对于爬虫获取链接部分参考前面文章1、利用文件读写方式下载图片第一种:用urllib2模块下载importurllib2link''headers{}
本文环境是python3,采用是urllib,BeautifulSoup搭建。说下思路,这个项目分为管理器,url管理器,下载器,解析器,html文件生产器。各司其职,在管理器进行调度。最后将解析
encoding:utf8importre使用正则匹配想要数据importrequests使用requests得到网页源码这个函数是用来得到源码得到主函数传入链接defgetHtmlText(ur
时候我们会需要从网络上爬取一些图片,来满足我们形形色色直至不可描述需求。一个典型简单爬虫项目步骤包括两步:获取网页地址和提取保存数据。这里是一个简单图片url收集图片例子,可以成为一个小小
本文实例主要是实现一个网页上图片地址,具体如下。读取一个网页源代码:importurllibrequestdefgetHtml(url):htmlurllibrequesturlopen(ur
们先以一个最简单实例来了解模拟登录后页面抓取过程,其原理在于模拟登录后Cookies维护。1本节目标本节将讲解以GitHub为例来实现模拟登录过程,同时登录后才可以访问页面信息,如好友