Python爬取百度图片(支持关键词搜索)
import argparse #用于命令项选项与参数解析
import os #整理文件和目录
import re #正则表达式 进行文字匹配
import sys #argparse 将会从 sys.ar 中解析出这些参数,并自动生成帮助和使用信息。
import urllib
import
import argparse #用于命令项选项与参数解析 import os #整理文件和目录 import re #正则表达式 进行文字匹配 import sys #argparse 将会从 sys.ar 中解析出这些参数,并自动生成帮助和使用信息。 import urllib import json import socket import urllib.request #制定url,获取网页数据 import urllib.parse #将url解析为组件 import #可以捕获由 urllib.request 产生的异常。 import time # 设置超时 timeout = 5 socket.setdefaulttimeout(timeout) #防止爬虫爬取某个页面时间过长,导致程序卡置不前 class Crawler: __time_sleep = 0.1 # 睡眠时长 __amount = 0 __start_amount = 0 __counter = 0 headers = {'User-Agent': 'Mozilla/5.0 (Windows T 6.1; WOW64; rv:2.0) Gecko/20100101 Firefox/2.0', 'Cookie': ''} #模拟浏览器头部信息,向服务器发送消息 __per_page = 0 # 获取图片url内容等 # t 下载图片时间间隔 def __init__(self, t=0.1): _sleep = t @staticmethod def get_suffix(name): m = re.search(r'\.[^\.]*$', name) if m.group(0) and len(m.group(0)) <= 5: return m.group(0) else: return '.jpeg' # 获取后缀名 @staticmethod def handle_baidu_cookie(original_cookie, cookies): """ :param string original_cookie: :param list cookies: :return string: """ if not cookies: return original_cookie result = original_cookie for cookie in cookies:
#感谢您对电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格的认可,转载请说明来源于"电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格
上传时间: 2025-07-17 09:22:16
推荐阅读
留言与评论(共有 11 条评论) |
本站网友 黑龙江工商职业学院 | 30分钟前 发表 |
向服务器发送消息 __per_page = 0 # 获取图片url内容等 # t 下载图片时间间隔 def __init__(self | |
本站网友 麻杏甘石汤 | 15分钟前 发表 |
import time # 设置超时 timeout = 5 socket.setdefaulttimeout(timeout) #防止爬虫爬取某个页面时间过长 | |
本站网友 排泄物 | 13分钟前 发表 |
""" if not cookies | |
本站网友 曲池穴 | 17分钟前 发表 |
return m.group(0) else | |
本站网友 四川外国语学院成都学院 | 0秒前 发表 |
name) if m.group(0) and len(m.group(0)) <= 5 | |
本站网友 pubmed影响因子 | 7分钟前 发表 |
''} #模拟浏览器头部信息 | |
本站网友 东方男子医院 | 25分钟前 发表 |
return m.group(0) else | |
本站网友 公积金贷款额度计算器 | 8分钟前 发表 |
2.0) Gecko/20100101 Firefox/2.0' | |
本站网友 先到 | 22分钟前 发表 |
本站网友 邻二甲苯 | 30分钟前 发表 |
""" |