Python爬取百度图片（支持关键词搜索）

2025-07-21 11:16:02

import argparse #用于命令项选项与参数解析 import os #整理文件和目录 import re #正则表达式进行文字匹配 import sys #argparse 将会从 sys.ar 中解析出这些参数，并自动生成帮助和使用信息。 import urllib import

import argparse         #用于命令项选项与参数解析
import os               #整理文件和目录
import re               #正则表达式  进行文字匹配
import sys              #argparse 将会从 sys.ar 中解析出这些参数，并自动生成帮助和使用信息。
import urllib
import json
import socket
import urllib.request   #制定url，获取网页数据
import urllib.parse     #将url解析为组件
import      #可以捕获由 urllib.request 产生的异常。
import time             # 设置超时

timeout = 5
socket.setdefaulttimeout(timeout)  #防止爬虫爬取某个页面时间过长，导致程序卡置不前

class Crawler:
    __time_sleep = 0.1  # 睡眠时长
    __amount = 0
    __start_amount = 0
    __counter = 0
    headers = {'User-Agent': 'Mozilla/5.0 (Windows T 6.1; WOW64; rv:2.0) Gecko/20100101 Firefox/2.0', 'Cookie': ''}
    #模拟浏览器头部信息，向服务器发送消息
    __per_page = 0

    # 获取图片url内容等
    # t 下载图片时间间隔
    def __init__(self, t=0.1):
        _sleep = t

    @staticmethod
    def get_suffix(name):
        m = re.search(r'\.[^\.]*$', name)
        if m.group(0) and len(m.group(0)) <= 5:
            return m.group(0)
        else:
            return '.jpeg'
                                 # 获取后缀名
    @staticmethod
    def handle_baidu_cookie(original_cookie, cookies):
        """
        :param string original_cookie:
        :param list cookies:
        :return string:
        """
        if not cookies:
            return original_cookie
        result = original_cookie
        for cookie in cookies:

#感谢您对电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格的认可，转载请说明来源于"电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格

本文地址：http://www.dnpztj.cn/biancheng/1115471.html

推荐阅读

留言与评论（共有 11 条评论）

本站网友黑龙江工商职业学院	30分钟前发表
向服务器发送消息 __per_page = 0 # 获取图片url内容等 # t 下载图片时间间隔 def __init__(self
本站网友麻杏甘石汤	15分钟前发表
import time # 设置超时 timeout = 5 socket.setdefaulttimeout(timeout) #防止爬虫爬取某个页面时间过长
本站网友排泄物	13分钟前发表
""" if not cookies
本站网友曲池穴	17分钟前发表
return m.group(0) else
本站网友四川外国语学院成都学院	0秒前发表
name) if m.group(0) and len(m.group(0)) <= 5
本站网友 pubmed影响因子	7分钟前发表
''} #模拟浏览器头部信息
本站网友东方男子医院	25分钟前发表
return m.group(0) else
本站网友公积金贷款额度计算器	8分钟前发表
2.0) Gecko/20100101 Firefox/2.0'
本站网友先到	22分钟前发表

本站网友邻二甲苯	30分钟前发表
"""

Python爬取百度图片（支持关键词搜索）

亚利桑那州核桃沟站点上空采集的机载次冠层和次表层微波观测站（AirMOSS）雷达仪器的 1 (L1) 级极坐标雷达反向散射系数

机载次冠层和次表层微波观测站（AirMOSS）雷达仪器在北美十个站点采集的多深度、90 米空间分辨率的 2/3 级根区土壤湿度（RZSM）估算值

慧天卓特：2024年12月基于FYDI

北美七个站点的地面传感器（L2）每小时容积（立方厘米/立方厘米）土壤水分剖面图