您现在的位置是:首页 > 编程 > 

Python爬取百度图片(支持关键词搜索)

2025-07-21 11:16:02
import argparse #用于命令项选项与参数解析 import os #整理文件和目录 import re #正则表达式 进行文字匹配 import sys #argparse 将会从 sys.ar 中解析出这些参数,并自动生成帮助和使用信息。 import urllib import
import argparse         #用于命令项选项与参数解析
import os               #整理文件和目录
import re               #正则表达式  进行文字匹配
import sys              #argparse 将会从 sys.ar 中解析出这些参数,并自动生成帮助和使用信息。
import urllib
import json
import socket
import urllib.request   #制定url,获取网页数据
import urllib.parse     #将url解析为组件
import      #可以捕获由 urllib.request 产生的异常。
import time             # 设置超时

timeout = 5
socket.setdefaulttimeout(timeout)  #防止爬虫爬取某个页面时间过长,导致程序卡置不前

class Crawler:
    __time_sleep = 0.1  # 睡眠时长
    __amount = 0
    __start_amount = 0
    __counter = 0
    headers = {'User-Agent': 'Mozilla/5.0 (Windows T 6.1; WOW64; rv:2.0) Gecko/20100101 Firefox/2.0', 'Cookie': ''}
    #模拟浏览器头部信息,向服务器发送消息
    __per_page = 0

    # 获取图片url内容等
    # t 下载图片时间间隔
    def __init__(self, t=0.1):
        _sleep = t

    @staticmethod
    def get_suffix(name):
        m = re.search(r'\.[^\.]*$', name)
        if m.group(0) and len(m.group(0)) <= 5:
            return m.group(0)
        else:
            return '.jpeg'
                                 # 获取后缀名
    @staticmethod
    def handle_baidu_cookie(original_cookie, cookies):
        """
        :param string original_cookie:
        :param list cookies:
        :return string:
        """
        if not cookies:
            return original_cookie
        result = original_cookie
        for cookie in cookies:
 

#感谢您对电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格的认可,转载请说明来源于"电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格

本文地址:http://www.dnpztj.cn/biancheng/1115471.html

相关标签:无
上传时间: 2025-07-17 09:22:16
留言与评论(共有 11 条评论)
本站网友 黑龙江工商职业学院
30分钟前 发表
向服务器发送消息 __per_page = 0 # 获取图片url内容等 # t 下载图片时间间隔 def __init__(self
本站网友 麻杏甘石汤
15分钟前 发表
import time # 设置超时 timeout = 5 socket.setdefaulttimeout(timeout) #防止爬虫爬取某个页面时间过长
本站网友 排泄物
13分钟前 发表
""" if not cookies
本站网友 曲池穴
17分钟前 发表
return m.group(0) else
本站网友 四川外国语学院成都学院
0秒前 发表
name) if m.group(0) and len(m.group(0)) <= 5
本站网友 pubmed影响因子
7分钟前 发表
''} #模拟浏览器头部信息
本站网友 东方男子医院
25分钟前 发表
return m.group(0) else
本站网友 公积金贷款额度计算器
8分钟前 发表
2.0) Gecko/20100101 Firefox/2.0'
本站网友 先到
22分钟前 发表
本站网友 邻二甲苯
30分钟前 发表
"""