python获取网页中所有图片并筛选指定分辨率的方法-侯体宗的博客

python获取网页中所有图片并筛选指定分辨率的方法
Python / 管理员发布于 8年前 258

压测时，图片太少，想着下载网页中的图片，然后过滤指定分辨率，但网页中指定分辨率的图片太少了（见下）
后使用格式工厂转换图片

import urllib.request   # 导入urllib模块import re     # 导入re模块import osfrom PIL import Imagehtmlurl = 'http://www.win4000.com/wallpaper_detail_134824_3.html'downloadpath = 'C:\\Users\\yaowanjun\\Desktop\\img\\'def getHTML(htmlurl):  req = urllib.request.urlopen(htmlurl)  buf = req.read()  return buf.decode('utf-8')def downloadImg(buf):  req = r'src="https:/article/(.+?\.jpg)"' #正则表达式，匹配图片格式  imgreq = re.compile(req) #编译正则表达式  imglist = re.findall(imgreq, buf)  # print(imglist)  x = 0  if not os.path.isdir(downloadpath):#若没有则创建    os.makedirs(downloadpath)  paths = downloadpath  for imgurl in imglist:    f = open(paths + str(x) +'.jpg',"wb")  #打开文件    req = urllib.request.urlopen(imgurl)    buf = req.read()       #读出文件    f.write(buf)    f.close()    x = x + 1  return imglistdef saveImg():  for filenumber in os.walk(downloadpath):    # print(filenumber[2])    for files in filenumber[2]:      # print(files)      singleimg = Image.open(downloadpath + files)      singleimg.close()      #print(singleimg.size, singleimg.width, singleimg.height)      if singleimg.size == (1920, 1080):        print(singleimg)      else:        os.remove(downloadpath + files)buf = getHTML(htmlurl)downloadImg(buf)saveImg()

执行结果：

指定网页所有图片

不符合指定分辨率的图片删除后

以上这篇python获取网页中所有图片并筛选指定分辨率的方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

上一条：
使用Python读取安卓手机的屏幕分辨率方法
下一条：
python如何将图片转换为字符图片

0条评论 (评论内容有缓存机制,请悉知!)

最新最热

近期评论
test1 在
opencode + Oh-my-openagent,我的第一个免费的ai编程智能体管家:Sisyphus中评论 test..
122 在
学历：一种延缓就业设计，生活需求下的权衡之选中评论工作几年后，报名考研了，到现在还没认真学习备考，迷茫中。作为一名北漂互联网打工人..
Zita 在
Google AI Studio升级全栈 vibe coding体验，可直接构建带登录和数据库的应用中评论 111222..
123 在
Clash for Windows作者删库跑路了，github已404中评论按理说只要你在国内，所有的流量进出都在监控范围内，不管你怎么隐藏也没用，想搞你分..
原梓番博客在
在Laravel框架中使用模型Model分表最简单的方法中评论好久好久都没看友情链接申请了，今天刚看，已经添加。..

Top