AI批量下载网页中的mp音频
AI批量下载网页中的mp音频
这个网页中有多个mp音频
查看源代码,到mp文件:
.mp
<audio controls="" controlslist="nodownload">
<source src=".mp" type="audio/mpeg">
Your browser does not support the audio element.</audio>
在deepseek中输入提示词:
你是一个Python编程专家,写一个Python脚本,完成任务如下:
打开网页:
定位源代码中所有audio标签,然后定位其中的<source >标签,提取其src属性,这是MP下载链接;
下载所有的mp音频,保存到文件夹:F:\aivideo
注意:每一步都要输出信息到屏幕上
要完成这个任务,我们可以使用Python的requests库来下载网页内容,使用BeautifulSoup库来解析HTML并提取所需的音频链接,最后使用requests库来下载这些MP文件。以下是一个完整的Python脚本:
import os
import requests
from bs4 import BeautifulSoup
# 定义目标网页和保存路径
url = ";
save_folder = r"F:\aivideo"
# 确保保存文件夹存在
if not os.(save_folder):
(save_folder)
print(f"Created folder: {save_folder}")
# 下载网页内容
print(f"Fetching content from {url}...")
respe = requests.get(url)
respe.raise_for_status() # 检查请求是否成功
# 解析HTML内容
print("Parsing HTML content...")
soup = BeautifulSoup(, 'html.parser')
# 查所有的<audio>标签
audio_tags = soup.find_all('audio')
print(f"Found {len(audio_tags)} <audio> tags.")
# 遍历每个<audio>标签,查其中的<source>标签并提取src属性
mp_links = []
for audio in audio_tags:
source_tags = audio.find_all('source')
for source in source_tags:
src = source.get('src')
if src and ('.mp'):
mp_links.append(src)
print(f"Found MP link: {src}")
# 下载所有的MP文件
for mp_link in mp_links:
print(f"Downloading {mp_link}...")
mp_respe = requests.get(mp_link)
mp_respe.raise_for_status()
# 提取文件名
file_name = os.path.join(save_folder, os.path.basename(mp_link))
# 保存文件
with open(file_name, 'wb') as f:
f.write(mp_)
print(f"Saved {file_name}")
print("All MP files downloaded successfully.")
代码说明:
导入库:我们导入了os、requests和BeautifulSoup库。
定义目标网页和保存路径:url是目标网页的URL,save_folder是保存MP文件的文件夹路径。
创建保存文件夹:如果文件夹不存在,我们使用创建它。
下载网页内容:使用requests.get下载网页内容,并检查请求是否成功。
解析HTML内容:使用BeautifulSoup解析HTML内容。
查所有的<audio>标签:使用soup.find_all('audio')查所有的<audio>标签。
提取MP链接:遍历每个<audio>标签,查其中的<source>标签,并提取src属性中的MP链接。
下载MP文件:遍历所有提取的MP链接,使用requests.get下载文件,并保存到指定文件夹。
注意事项:
确保你已经安装了requests和BeautifulSoup库。如果没有安装,可以使用以下命令安装:
pip install requests beautifulsoup4
该脚本假设所有的MP链接都是直接可访问的。如果链接需要身份验证或其他特殊处理,可能需要进一步调整脚本。
该脚本会覆盖文件夹中同名的MP文件。如果需要避免覆盖,可以在保存文件时添加一些唯一的标识。
#感谢您对电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格的认可,转载请说明来源于"电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格
上一篇:AI批量下载播客转录的文本
推荐阅读
留言与评论(共有 12 条评论) |
本站网友 手脚冰凉是什么原因 | 0秒前 发表 |
如果没有安装 | |
本站网友 武汉佳源花都 | 30分钟前 发表 |
可以在保存文件时添加一些唯一的标识 | |
本站网友 上海移动网站 | 4分钟前 发表 |
提取其src属性 | |
本站网友 虹口龙之梦地址 | 1分钟前 发表 |
最后使用requests库来下载这些MP文件 | |
本站网友 林某 | 29分钟前 发表 |
requests和BeautifulSoup库 | |
本站网友 东塘租房网 | 27分钟前 发表 |
source_tags = audio.find_all('source')for source in source_tags | |
本站网友 哪种浏览器最好用 | 0秒前 发表 |
mp_links.append(src)print(f"Found MP link | |
本站网友 高桥良一 | 5分钟前 发表 |
\aivideo"# 确保保存文件夹存在if not os.(save_folder) | |
本站网友 新文 | 26分钟前 发表 |
下载MP文件:遍历所有提取的MP链接 | |
本站网友 点解啊 | 11分钟前 发表 |
src = source.get('src')if src and ('.mp') | |
本站网友 百度选车 | 15分钟前 发表 |
完成任务如下:打开网页:定位源代码中所有audio标签 |