您现在的位置是:首页 > 编程 > 

AI批量下载网页中的mp音频

2025-07-23 23:55:32
AI批量下载网页中的mp音频 这个网页中有多个mp音频 查看源代码,到mp文件:.mp<audio controls="" controlslist="nodownload"><source src=".mp" type="audio/mpeg">Your browser does

AI批量下载网页中的mp音频

这个网页中有多个mp音频

查看源代码,到mp文件:

.mp

<audio controls="" controlslist="nodownload">

<source src=".mp" type="audio/mpeg">

Your browser does not support the audio element.</audio>

在deepseek中输入提示词:

你是一个Python编程专家,写一个Python脚本,完成任务如下:

打开网页:

定位源代码中所有audio标签,然后定位其中的<source >标签,提取其src属性,这是MP下载链接;

下载所有的mp音频,保存到文件夹:F:\aivideo

注意:每一步都要输出信息到屏幕上

要完成这个任务,我们可以使用Python的requests库来下载网页内容,使用BeautifulSoup库来解析HTML并提取所需的音频链接,最后使用requests库来下载这些MP文件。以下是一个完整的Python脚本:

import os

import requests

from bs4 import BeautifulSoup

# 定义目标网页和保存路径

url = ";

save_folder = r"F:\aivideo"

# 确保保存文件夹存在

if not os.(save_folder):

(save_folder)

print(f"Created folder: {save_folder}")

# 下载网页内容

print(f"Fetching content from {url}...")

respe = requests.get(url)

respe.raise_for_status() # 检查请求是否成功

# 解析HTML内容

print("Parsing HTML content...")

soup = BeautifulSoup(, 'html.parser')

# 查所有的<audio>标签

audio_tags = soup.find_all('audio')

print(f"Found {len(audio_tags)} <audio> tags.")

# 遍历每个<audio>标签,查其中的<source>标签并提取src属性

mp_links = []

for audio in audio_tags:

source_tags = audio.find_all('source')

for source in source_tags:

src = source.get('src')

if src and ('.mp'):

mp_links.append(src)

print(f"Found MP link: {src}")

# 下载所有的MP文件

for mp_link in mp_links:

print(f"Downloading {mp_link}...")

mp_respe = requests.get(mp_link)

mp_respe.raise_for_status()

# 提取文件名

file_name = os.path.join(save_folder, os.path.basename(mp_link))

# 保存文件

with open(file_name, 'wb') as f:

f.write(mp_)

print(f"Saved {file_name}")

print("All MP files downloaded successfully.")

代码说明:

导入库:我们导入了os、requests和BeautifulSoup库。

定义目标网页和保存路径:url是目标网页的URL,save_folder是保存MP文件的文件夹路径。

创建保存文件夹:如果文件夹不存在,我们使用创建它。

下载网页内容:使用requests.get下载网页内容,并检查请求是否成功。

解析HTML内容:使用BeautifulSoup解析HTML内容。

查所有的<audio>标签:使用soup.find_all('audio')查所有的<audio>标签。

提取MP链接:遍历每个<audio>标签,查其中的<source>标签,并提取src属性中的MP链接。

下载MP文件:遍历所有提取的MP链接,使用requests.get下载文件,并保存到指定文件夹。

注意事项:

确保你已经安装了requests和BeautifulSoup库。如果没有安装,可以使用以下命令安装:

pip install requests beautifulsoup4

该脚本假设所有的MP链接都是直接可访问的。如果链接需要身份验证或其他特殊处理,可能需要进一步调整脚本。

该脚本会覆盖文件夹中同名的MP文件。如果需要避免覆盖,可以在保存文件时添加一些唯一的标识。

本文参与 腾讯云自媒体同步曝光计划,分享自。原始发表:2025-01-18,如有侵权请联系 cloudcommunity@tencent 删除audiomp遍历脚本音频

#感谢您对电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格的认可,转载请说明来源于"电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格

本文地址:http://www.dnpztj.cn/biancheng/1166843.html

相关标签:无
上传时间: 2025-07-21 04:13:39
留言与评论(共有 12 条评论)
本站网友 手脚冰凉是什么原因
0秒前 发表
如果没有安装
本站网友 武汉佳源花都
30分钟前 发表
可以在保存文件时添加一些唯一的标识
本站网友 上海移动网站
4分钟前 发表
提取其src属性
本站网友 虹口龙之梦地址
1分钟前 发表
最后使用requests库来下载这些MP文件
本站网友 林某
29分钟前 发表
requests和BeautifulSoup库
本站网友 东塘租房网
27分钟前 发表
source_tags = audio.find_all('source')for source in source_tags
本站网友 哪种浏览器最好用
0秒前 发表
mp_links.append(src)print(f"Found MP link
本站网友 高桥良一
5分钟前 发表
\aivideo"# 确保保存文件夹存在if not os.(save_folder)
本站网友 新文
26分钟前 发表
下载MP文件:遍历所有提取的MP链接
本站网友 点解啊
11分钟前 发表
src = source.get('src')if src and ('.mp')
本站网友 百度选车
15分钟前 发表
完成任务如下:打开网页:定位源代码中所有audio标签