Python3——根据m3u8下载视频（下）之requests

下半场ING，好吧，本来准备明天写的（拖延真快乐.gif），请然而,,,早上八点多跑公司加班（看书+学习）去，发现大门上挂着一把大锁，我只想说门禁是拿来看的嘛，加啥破锁o（╥﹏╥）o，严重打击了好员工的加班热情[○·`Д'·○]，所以滚回来写博客了，忧伤，写了点代码还踩了半天坑（偷懒惹的祸），忧伤10086 ...

7.31号上午，也就是离职那天，机智的我突然想到，requests.get（）下载文件实际是获取到的二进制内容然后写入到自己创建的文件中，以此来实现下载图片，文档，视频和等等，既然如此，那我直接打开已有的视频文件将新获取的二进制内容添加到后面，不就可以更直接的解决ts流合并的问题了嘛，机智如我，立刻进行了尝试，特意注意了文件打开和写入时的编码问题，果然搞定了,,,然后下午跑去签离职协议，完美收工。

运行环境：windows和linux（注意修改下路径），python36

代码如下：



# !/user/bin/env python

# -*- coding: utf-8 -*-

# au: caopeiya

# 201808011

import os, shutil

import urllib.request, urllib.error, requests

# 打开并读取网页内容

def getUrlData(url):

    try:

        urlData = urllib.request.urlopen(url, timeout=20)  # .read().decode('utf-8', 'ignore')

        # urlData = requests.get(url, timeout=20)  # .read().decode('utf-8', 'ignore')

        return urlData

    except Exception as err:

        print(f'err getUrlData({url})\n', err)

        return -1

# 下载文件-requests

def getDown_reqursts(url, file_path):

    try:

        header = {"User-Agent":"Mozilla/5.0 (Windows NT 6.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"}

        response = requests.get(url, timeout=120, headers=header)

        with open(file_path, mode='ab+') as f:

            f.write(response.content)

        # 下载文件较大时，使用循环下载

        # with open(file_path, mode='wb') as f:

        #     for content in response.iter_content(1024):

        #         f.write(content)

        print("down successful!")

    except Exception as e:

        print(e)

def getVideo_requests(url_m3u8, path, videoName):

    print('begin run ~~\n')

    urlData = getUrlData(url_m3u8)

    tempName_video = os.path.join(path, f'{videoName}.ts')  # f'{}' 相当于'{}'.format() 或 '%s'%videoName

    open(tempName_video, "wb").close()  # 清空(顺带创建)tempName_video文件，防止中途停止，继续下载重复写入

    # print(urlData)

    for line in urlData:

        # 解码decode("utf-8")，由于是直接使用了所抓取的链接内容，所以需要按行解码，如果提前解码则不能使用直接进行for循环，会报错

        url_ts = str(line.decode("utf-8")).strip()  # 重要：strip()，用来清除字符串前后存在的空格符和换行符

        if not '.ts' in url_ts:

            continue

        else:

            if not url_ts.startswith('http'):  # 判断字符串是否以'http'开头，如果不是则说明url链接不完整，需要拼接

                # 拼接ts流视频的url

                url_ts = url_m3u8.replace(url_m3u8.split('/')[-1], url_ts)

        print(url_ts)

        getDown_reqursts(url=url_ts, file_path=tempName_video)  # 下载视频流

    filename = os.path.join(path, f'{videoName}.mp4')

    shutil.move(tempName_video, filename)

    print(f'Great, {videoName}.mp4 finish down!')

if __name__ == '__main__':

    url_m3u8 = 'http://wscdn.alhls.xiaoka.tv/201886/2f5/75a/HoHdTc1LjUaBjZbJ/index.m3u8'

    path = r'D:\\'

    videoName = url_m3u8.split('/')[-2]

    getVideo_requests(url_m3u8, path, videoName)

    # getDown_reqursts('http://wscdn.alhls.xiaoka.tv/201886/2f5/75a/HoHdTc1LjUaBjZbJ/147.ts', f'D:/videos/84.ts')

要注意以下几点：

1.用于解码（“utf-8”）进行解码，由于循环获取的每一行t都是是ASCII编码，必须解码为utf-8才能变为可识别的字符串;

2.用.strip（）去除每一行的空格符和换行符，

Python3——根据m3u8下载视频（下）之requests的更多相关文章

Python3 根据m3u8下载视频，批量下载ts文件并且合并
Python3 根据m3u8下载视频,批量下载ts文件并且合并 m3u8是苹果公司推出一种视频播放标准,是一种文件检索格式,将视频切割成一小段一小段的ts格式的视频文件,然后存在服务器中(现在为了减少 ...
Python3——根据m3u8下载视频（上）之urllib.request
干活干活,区区懒癌已经阻挡不了澎湃的洪荒之力了...... 运行环境:Windows基于python3.6 ---------------------------------------------- ...
Python 爬虫实例（13）下载 m3u8 格式视频
Python requests 下载 m3u8 格式视频最近爬取一个视频网站,遇到 m3u8 格式的视频需要下载. 抓包分析,视频文件是多个 ts 文件,什么是 ts文件,请去百度 ...
requests模块下载视频显示进度和网速
requests 下载视频 import os,time import requests def downloadFile(name, url): headers = {'Proxy-Connecti ...
根据M3U8地址下载视频
下面展示的是通过M3U8地址,把这个地址转为一个视频文件:只是一个基本案例,当然,有些下载的M3U8文件里面格式是不一样的,还有的是加过密的,道理都是一个道理. import java.io.Buf ...
win下youtube-dl 【ERROR: requested format not available】选下载视频质量的坑--【值得一看】
需求说明(bug出处): 简单说:下载youtube的视频,嵌入翻译好的中文字幕. 详细说(可略过): 阿里的海外服务器需要布一个Web Service---用以接收国内(本地服务器)的请求, 然后用 ...
使用you-get下载视频网站视频或其他
使用you-get下载视频网站视频或其他文/玄魂目录使用you-get下载视频网站视频或其他前言 1.1 下载.安装依赖 exe安装 pip安装 Antigen安装 Git 克隆源码 Hom ...
Python3 实现简易局域网视频聊天工具
Python3 实现简易局域网视频聊天工具 1.环境操作系统为 Ubuntu 16.04 python 3.5opencv-python 3.4.1.15numpy 1.14.5PyAudio ...
【python】M3U8下载器脚本
[python]M3U8下载器脚本脚本目标: 1. 输入M3U8文件的链接,得到视频 2.使用异步操作,这样可以快很多,不加锁,因为懒得写,而且影响不大已知条件: 1.m3u8文件其实就是一个记录 ...

随机推荐

第十一周小组Scrum会议
会议照片本周会议内回顾上一周的内容总结上一轮的得失: 我们在第一轮中,并没有做出什么东西,为此我们痛定思痛,制定了计划,确定第二轮迭代的目标: 1. 实现小程序与后台代码的交互 2. 将检索书籍 ...
《为什么说Redis是单线程的以及Redis为什么这么快！》
为什么说Redis是单线程的以及Redis为什么这么快! 一.前言近乎所有与Java相关的面试都会问到缓存的问题,基础一点的会问到什么是“二八定律”.什么是“热数据和冷数据”,复杂一点的会问到缓 ...
URL、URI、URN之间的区别
URL统一资源定位符 URI统一资源标识符 URN统一资源名称 URL是URI的一个特例. URI由URL和URN两部分组成. 在java类中,URI类不包含任何访问资源的方法,它唯一的作用就是解析. ...
Centos7防火墙添加端口
添加 firewall-cmd --zone=public --add-port=80/tcp --permanent (--permanent永久生效,没有此参数重启后失效) 重新载入 fire ...
Oracle数据库的关键系统服务整理
在Windows 操作系统下安装Oracle 9i时会安装很多服务——并且其中一些配置为在Windows 启动时启动.在Oracle 运行在Windows 下时,有些服务可能我们并不总是需要但又害怕停 ...
resharper 8.2
用户名:ronle注册码:ZoJzmeVBoAv9Sskw76emgksMMFiLn4NM
Loj #2719. 「NOI2018」冒泡排序
Loj #2719. 「NOI2018」冒泡排序题目描述最近,小 S 对冒泡排序产生了浓厚的兴趣.为了问题简单,小 S 只研究对 *\(1\) 到 \(n\) 的排列*的冒泡排序. 下面是对冒泡排 ...
Linux和windows下修改tomcat内存
原文地址:https://www.cnblogs.com/wdpnodecodes/p/8036333.html 由于服务器上放的tomcat太多,造成内存溢出. 常见的内存溢出有以下两种: java ...
PHP匿名函数的写法
传统写法<pre>function timer () { echo "hello world";}Swoole\Timer::tick(2000, 'timer');& ...
pymysql的基本使用
序pymysql的语法sql注入问题数据的增删查改 TOC 序当我们在写程序中需要使用到数据库的时候,尽量在代码层次实现一些限制,例如两张表,我们不再使用外键去关联表与表之间的关系,我们可以在程序层 ...

Python3——根据m3u8下载视频（下）之requests

Python3——根据m3u8下载视频（下）之requests的更多相关文章

随机推荐

热门专题