Python3——根据m3u8下载视频（下）之requests

下半场ING，好吧，本来准备明天写的（拖延真快乐.gif），请然而,,,早上八点多跑公司加班（看书+学习）去，发现大门上挂着一把大锁，我只想说门禁是拿来看的嘛，加啥破锁o（╥﹏╥）o，严重打击了好员工的加班热情[○·`Д'·○]，所以滚回来写博客了，忧伤，写了点代码还踩了半天坑（偷懒惹的祸），忧伤10086 ...

7.31号上午，也就是离职那天，机智的我突然想到，requests.get（）下载文件实际是获取到的二进制内容然后写入到自己创建的文件中，以此来实现下载图片，文档，视频和等等，既然如此，那我直接打开已有的视频文件将新获取的二进制内容添加到后面，不就可以更直接的解决ts流合并的问题了嘛，机智如我，立刻进行了尝试，特意注意了文件打开和写入时的编码问题，果然搞定了,,,然后下午跑去签离职协议，完美收工。

运行环境：windows和linux（注意修改下路径），python36

代码如下：



# !/user/bin/env python

# -*- coding: utf-8 -*-

# au: caopeiya

# 201808011

import os, shutil

import urllib.request, urllib.error, requests

# 打开并读取网页内容

def getUrlData(url):

    try:

        urlData = urllib.request.urlopen(url, timeout=20)  # .read().decode('utf-8', 'ignore')

        # urlData = requests.get(url, timeout=20)  # .read().decode('utf-8', 'ignore')

        return urlData

    except Exception as err:

        print(f'err getUrlData({url})\n', err)

        return -1

# 下载文件-requests

def getDown_reqursts(url, file_path):

    try:

        header = {"User-Agent":"Mozilla/5.0 (Windows NT 6.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"}

        response = requests.get(url, timeout=120, headers=header)

        with open(file_path, mode='ab+') as f:

            f.write(response.content)

        # 下载文件较大时，使用循环下载

        # with open(file_path, mode='wb') as f:

        #     for content in response.iter_content(1024):

        #         f.write(content)

        print("down successful!")

    except Exception as e:

        print(e)

def getVideo_requests(url_m3u8, path, videoName):

    print('begin run ~~\n')

    urlData = getUrlData(url_m3u8)

    tempName_video = os.path.join(path, f'{videoName}.ts')  # f'{}' 相当于'{}'.format() 或 '%s'%videoName

    open(tempName_video, "wb").close()  # 清空(顺带创建)tempName_video文件，防止中途停止，继续下载重复写入

    # print(urlData)

    for line in urlData:

        # 解码decode("utf-8")，由于是直接使用了所抓取的链接内容，所以需要按行解码，如果提前解码则不能使用直接进行for循环，会报错

        url_ts = str(line.decode("utf-8")).strip()  # 重要：strip()，用来清除字符串前后存在的空格符和换行符

        if not '.ts' in url_ts:

            continue

        else:

            if not url_ts.startswith('http'):  # 判断字符串是否以'http'开头，如果不是则说明url链接不完整，需要拼接

                # 拼接ts流视频的url

                url_ts = url_m3u8.replace(url_m3u8.split('/')[-1], url_ts)

        print(url_ts)

        getDown_reqursts(url=url_ts, file_path=tempName_video)  # 下载视频流

    filename = os.path.join(path, f'{videoName}.mp4')

    shutil.move(tempName_video, filename)

    print(f'Great, {videoName}.mp4 finish down!')

if __name__ == '__main__':

    url_m3u8 = 'http://wscdn.alhls.xiaoka.tv/201886/2f5/75a/HoHdTc1LjUaBjZbJ/index.m3u8'

    path = r'D:\\'

    videoName = url_m3u8.split('/')[-2]

    getVideo_requests(url_m3u8, path, videoName)

    # getDown_reqursts('http://wscdn.alhls.xiaoka.tv/201886/2f5/75a/HoHdTc1LjUaBjZbJ/147.ts', f'D:/videos/84.ts')

要注意以下几点：

1.用于解码（“utf-8”）进行解码，由于循环获取的每一行t都是是ASCII编码，必须解码为utf-8才能变为可识别的字符串;

2.用.strip（）去除每一行的空格符和换行符，

Python3——根据m3u8下载视频（下）之requests的更多相关文章

Python3 根据m3u8下载视频，批量下载ts文件并且合并
Python3 根据m3u8下载视频,批量下载ts文件并且合并 m3u8是苹果公司推出一种视频播放标准,是一种文件检索格式,将视频切割成一小段一小段的ts格式的视频文件,然后存在服务器中(现在为了减少 ...
Python3——根据m3u8下载视频（上）之urllib.request
干活干活,区区懒癌已经阻挡不了澎湃的洪荒之力了...... 运行环境:Windows基于python3.6 ---------------------------------------------- ...
Python 爬虫实例（13）下载 m3u8 格式视频
Python requests 下载 m3u8 格式视频最近爬取一个视频网站,遇到 m3u8 格式的视频需要下载. 抓包分析,视频文件是多个 ts 文件,什么是 ts文件,请去百度 ...
requests模块下载视频显示进度和网速
requests 下载视频 import os,time import requests def downloadFile(name, url): headers = {'Proxy-Connecti ...
根据M3U8地址下载视频
下面展示的是通过M3U8地址,把这个地址转为一个视频文件:只是一个基本案例,当然,有些下载的M3U8文件里面格式是不一样的,还有的是加过密的,道理都是一个道理. import java.io.Buf ...
win下youtube-dl 【ERROR: requested format not available】选下载视频质量的坑--【值得一看】
需求说明(bug出处): 简单说:下载youtube的视频,嵌入翻译好的中文字幕. 详细说(可略过): 阿里的海外服务器需要布一个Web Service---用以接收国内(本地服务器)的请求, 然后用 ...
使用you-get下载视频网站视频或其他
使用you-get下载视频网站视频或其他文/玄魂目录使用you-get下载视频网站视频或其他前言 1.1 下载.安装依赖 exe安装 pip安装 Antigen安装 Git 克隆源码 Hom ...
Python3 实现简易局域网视频聊天工具
Python3 实现简易局域网视频聊天工具 1.环境操作系统为 Ubuntu 16.04 python 3.5opencv-python 3.4.1.15numpy 1.14.5PyAudio ...
【python】M3U8下载器脚本
[python]M3U8下载器脚本脚本目标: 1. 输入M3U8文件的链接,得到视频 2.使用异步操作,这样可以快很多,不加锁,因为懒得写,而且影响不大已知条件: 1.m3u8文件其实就是一个记录 ...

随机推荐

2016年蓝桥杯B组C/C++决赛题目
2016年第七届蓝桥杯B组C/C++决赛题目点击查看2016年第七届蓝桥杯B组C/C++决赛题解 1.一步之遥从昏迷中醒来,小明发现自己被关在X星球的废矿车里. 矿车停在平直的废弃的轨道上. 他的 ...
ACM-单向链表的操作
数据表记录包含表索引和数值,请对表索引相同的记录进行合并,即将相同索引的数值进行求和运算,输出按照key值升序进行输出. 输入描述: 先输入键值对的个数然后输入成对的index和value值,以空格隔 ...
ORM对象关系映射：
django配置orm: django使用mysql数据库: 首先cmd创建库 settings配置mysql数据库: DATABASES = { 'default': { 'ENGINE': 'dj ...
LinkCutTree学习笔记
LinkCutTree 学习笔记参考来源 https://www.zybuluo.com/xzyxzy/note/1027479 https://www.cnblogs.com/zhoushuyu/ ...
SSM配置动态数据源
多数据源配置主要涉及自定义类(DataSource注解类.DataSourceAspect切面类,动态数据源接口实现类.以及数据源字符串线程保存类),pom.xml文件.applicationCont ...
Linux宝塔安装步骤
首先:先运行 X shell 一:输入命令 Centos安装命令(一般都用这个): yum install -y wget && wget -O install.sh http://d ...
Python中的赋值、深拷贝与浅拷贝（内存地址）
Python中的赋值.深拷贝与浅拷贝(内存地址) 1.python中的可变对象与不可变对象 (1) 可变对象:dict,list def dict_test(): a = {} b = a print ...
小白专场-堆中的路径-python语言实现
目录更新.更全的<数据结构与算法>的更新网站,更有python.go.人工智能教学等着你:https://www.cnblogs.com/nickchen121/p/11407287.h ...
CSP-J&S2019第一轮认证游记
Day-0 晚上和高一大佬BH聊了聊,感觉大佬第一次参加比赛毕竟还是有点慌QAQ,毕竟我这么菜的人都没慌过. 做了一套模拟题,用45分钟瞎打的提高组卷子得了62分,还不错,正式比赛用2个小时好好答的话 ...
eclipse复制bpmn文件到idea下乱码问题处理
1.最近在学习工作流,在eclipse上画完了流程图,然后复制到idea下,发现节点的汉字是乱码的. 2.处理方案是修改idea的配置文件,如图,打开这两个文件,在文件末尾加上 -Dfile.enco ...

Python3——根据m3u8下载视频（下）之requests

Python3——根据m3u8下载视频（下）之requests的更多相关文章

随机推荐

热门专题