搜索
简帛阁>技术文章>美女视频都想下载,今天我们就来批量下载它们~

美女视频都想下载,今天我们就来批量下载它们~

前言

嗨喽!大家好呀

第三方模块:

  • requests >>> pip install requests

模块安装问题:

如果安装python第三方模块:

  1. win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests) 回车
  2. 在pycharm中点击Terminal(终端) 输入安装命令



    class="image-caption"> 

如何配置pycharm里面的python解释器?

  1. 选择file(文件) >>> setting(设置) >>> Project(项目) >>> python interpreter(python解释器)
  2. 点击齿轮, 选择add
  3. 添加python安装路径

pycharm如何安装插件?

  1. 选择file(文件) >>> setting(设置) >>> Plugins(插件)
  2. 点击 Marketplace 输入想要安装的插件名字 比如:翻译插件 输入 translation / 汉化插件 输入 Chinese
  3. 选择相应的插件点击 install(安装) 即可
  4. 安装成功之后 是会弹出 重启pycharm的选项 点击确定, 重启即可生效

Python: 编程语言()

用计算机语言(0 1): 用来跟计算机进行交互的语言

翻译 英文单词翻译成 0 或者 1 python 3.8

实现一系列操作

代码编辑器: pycharm 2021.2

解答、资料、源码点击领取~


 

Python: 工具

内置模块

第三方模块


环境介绍:

  • python 3.8 解释器
  • pycharm 编辑器
  • ffmpeg 音视频合成软件

抓数据 (当前视频链接,音频链接)

Request URL: https://www.ixigua.com/7057054074503430693
Request Method: GET

代码实现:

  1. 发送请求 (访问网站)
  2. 获取数据
  3. 解析数据 (base64解码)
  4. 保存数据 (视频 音频)
  5. 音视频合并

 

代码

导入模块

import requests     # 发送请求 第三方
import re           # 内置模块
import json
import base64
import subprocess
import os

  

加一个伪装

headers = {
    'cookie': 'MONITOR_WEB_ID=c27b9f4a-4917-4256-be93-e948308467e3; ttcid=0cbb8baca16443e8b2320dfcb0ebd3ab24; __gads=ID=b750d35ceb3b300e-22f59bfba5d0002a:T=1645008733:RT=1645008733:S=ALNI_MZSPYii3eywVYfjuGdExhE-Dw3tLw; BD_REF=1; support_webp=true; support_avif=true; _tea_utm_cache_1300=undefined; s_v_web_id=verify_l2kdgr6l_ZlYcneu1_fb24_4lQM_A1cp_pBZKlKxvJKzJ; passport_csrf_token=7e1f1777c680a1dd9f163d6916212e62; passport_csrf_token_default=7e1f1777c680a1dd9f163d6916212e62; sid_guard=880626da6250e5535bcc3b35a5804a5c%7C1651232961%7C3023999%7CFri%2C+03-Jun-2022+11%3A49%3A20+GMT; uid_tt=d87f79c88dc25ca91c644549863616c8; uid_tt_ss=d87f79c88dc25ca91c644549863616c8; sid_tt=880626da6250e5535bcc3b35a5804a5c; sessionid=880626da6250e5535bcc3b35a5804a5c; sessionid_ss=880626da6250e5535bcc3b35a5804a5c; sid_ucp_v1=1.0.0-KGE4ZTdhODI0MjQ3Y2IyY2Y2ZmQwYjkzYTFhNDljYjdjYjdhM2U3OTgKFAjo5IrYFxDBoa-TBhgYIAw4CEAFGgJsZiIgODgwNjI2ZGE2MjUwZTU1MzViY2MzYjM1YTU4MDRhNWM; ssid_ucp_v1=1.0.0-KGE4ZTdhODI0MjQ3Y2IyY2Y2ZmQwYjkzYTFhNDljYjdjYjdhM2U3OTgKFAjo5IrYFxDBoa-TBhgYIAw4CEAFGgJsZiIgODgwNjI2ZGE2MjUwZTU1MzViY2MzYjM1YTU4MDRhNWM; odin_tt=ab7eaf992f0e5cc3871fd8fde7797f8253548498d52cd8f6320c1d408d8fb5f853f6b88fe9d3e249e91b0baac908955a; tt_scid=yZBs23biytSrdLbhg4PwtQsnp5iRak5-8X3Y.rM36zEzqMDW4OWKwf0CAfb4Sa8r725a; ttwid=1%7Cbki1kBY9AbTODWRF62oQmAFNNd1E9JpOrWrMnRcIdwY%7C1651234433%7C69cbf75423181a837f3739e9b73665b4dc82f1070d93934d5843d3ece167b776; __ac_nonce=0626bd85f00123bbca353; __ac_signature=_02B4Z6wo00f010qt8RAAAIDCKacxeDkkRtdKifWAALDLGZ5UTxtgNht0fiirvQ84GFg6fgEpzmKoOpzBna11K-91eblu7vLsme2e9DrawirS.iQkhzxxQA-2FbYMTkKz.zBC6phs4yeOUKGUc6; ixigua-a-s=3; msToken=wDc7U1VNr5xcJOObHh92pRLYNHcJkoa27rC9g9KpqtmyPZRHrp8KwNXRK82rkr2w-XEzqsGab7i_YSSrqQLCbvxl9etcaF4ElWGCvfE9-94Wyw4v8Fuq-LcizatEUIE=',
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.41 Safari/537.36'
}
url = 'https://www.ixigua.com/7090467065097617931'

  

1. 发送请求 (访问网站)

response = requests.get(url, headers=headers)
# 乱码
response.encoding = 'utf-8'
# <Response [200]>: 访问成功

  

2. 获取数据

html_data = response.text

  

3. 解析数据 (base64解码)

# _SSR_HYDRATED_DATA=(.*?)</script>
# (.*?): 匹配任何字符 换行符除外
json_str = re.findall('_SSR_HYDRATED_DATA=(.*?)</script>', html_data)[0]
# undefined 替换为 null
json_str = json_str.replace('undefined', 'null')
json_dict = json.loads(json_str)
title = json_dict['anyVideo']['gidInformation']['packerData']['video']['title']
title = title.replace(' ', '')
video_url = json_dict['anyVideo']['gidInformation']['packerData']['video']['videoResource']['dash']['dynamic_video']['dynamic_video_list'][-1]['main_url']
audio_url = json_dict['anyVideo']['gidInformation']['packerData']['video']['videoResource']['dash']['dynamic_video']['dynamic_audio_list'][-1]['main_url']
video_url = base64.b64decode(video_url)
audio_url = base64.b64decode(audio_url)
video_url = video_url.decode()
audio_url = audio_url.decode()

  

4. 保存数据 (视频 音频)

video_data = requests.get(video_url).content
with open(f'{title}.mp4', mode='wb') as f:
    f.write(video_data)
audio_data = requests.get(audio_url).content
with open(f'{title}.mp3', mode='wb') as f:
    f.write(audio_data)
ffmpeg = r'ffmpeg -i ' + title + '.mp4 -i ' + title + '.mp3 -acodec copy -vcodec copy ' + title + '-out.mp4'
subprocess.run(ffmpeg)
os.remove(f'{title}.mp3')
os.remove(f'{title}.mp4')

 

尾语

好了,我的这篇文章写到这里就结束啦!

有更多建议或问题可以评论区或私信我哦!一起加油努力叭(ง •_•)ง

喜欢就关注一下博主,或点赞收藏评论一下我的文章叭!!!

前言嗨喽!大家好呀第三方模块:requests>>>pipinstallrequests模块安装问题:如果安装python第三方模块:win+R输入cmd点击确定,输入安装命令pip
背景由于同学每周要通过邮箱收数学建模作业,100多人给她发附件,她要一个个地点着下载。太麻烦了,所以用程序实现下载附件的功能。在网上查资料后,最终实现了稍为简单的下载附件功能,代码有些细节还不是很了
介绍一下遥感图像批量下载的方法,主要是针对Landsat和Sentinel数据进行下载。两种数据在USGS上都能找到,速度比较慢。Sentinel数据还可以在https://scihubcopern
更新记录201806301。添加存在文件跳过逻辑2。非法文件路径名字去除逻辑的添加*coding:utf8*@Time:2018/11/1610:02AM@Author:cxa@File:cosmic
downloadFileForm:function(fid){varurlhttps://filexxxxcom/fileDownloaddo;varinputs<inputtype'hidde
案例故事:之前我们做Android手机测试的时候,市场部希望我们测试部进行Top1000app(排名前1000的app)的兼容性测试,以确保我们的手机是可以安装并正常运行这么多好用的app,且市场部
2015年开始使用魅族手机,16G存储,当时应该是很普遍的配置,以为平时不玩游戏也够用。2017年因为打王者太卡了,换了另外一台CPU和内存更高的魅族,64G存储。后面用到2020年,华为被老M欺负(
步骤一:创建项目npminit步骤二:安装request,cheerio,async三个模块request用于请求地址和快速下载图片流。https://githubcom/request/reques
需求如下:下载选中的TXT文件,前提:存在TXT文件HTML<elbuttonstylemarginleft:0;iconelicondownload@clickdownloadTxt>下
里发现一个可以下歌的工具pymusicdl,很好用,当然付费歌曲是下不来的,集成了很多音乐库的歌曲首先安装pymusicdlpipinstallpymusicdl仔细发现会知道,其实这个pip安装