python zip用法

import requests

url = "https://magi.com/search"

querystring = {"q":"堕却乡"}

headers = {

    'authority': "magi.com",

    'pragma': "no-cache",

    'cache-control': "no-cache,no-cache",

    'upgrade-insecure-requests': "1",

    'user-agent': "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36",

    'accept': "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3",

    'referer': "https://magi.com/search?q=%E7%89%B9%E6%96%AF%E6%8B%89",

    'accept-encoding': "gzip, deflate, br",

    'accept-language': "zh-CN,zh;q=0.9",

    'cookie': "acw_tc=7af6142615735221487104171e68298facdedf1e07add2205636582990",

    'Postman-Token': "dda0d475-41b9-44b4-812a-6dd489fe19dd,64d3ddc4-7036-4c42-bff6-53dcbc065db2",

    'Host': "magi.com",

    'Connection': "keep-alive"

    }

response = requests.request("GET", url,

                            headers=headers,

                            params=querystring,

                            # verify=True

                            )

# print(response.text)

import lxml.etree

taxt = lxml.etree.HTML(response.text)

cells=taxt.xpath("//main//div[@data-type='fact']//article[@class='fact']")

for cell in cells:

    sop = cell.xpath(".//dl/dd//text()")

    sop_url = cell.xpath(".//div/ul//ol//li//a//@href")

    reliability = cell.xpath(".//div//span//text()")

    import re

    reliability=re.findall("(\d{1,3})",reliability[0])[-1]

    print(reliability,sop,sop_url)

#

import requests

url = "https://www.tuicool.com/articles/jiyEnq7"

headers = {

    # 'Connection': "keep-alive",

    # 'Pragma': "no-cache",

    # 'Cache-Control': "no-cache",

    # 'Upgrade-Insecure-Requests': "1",

    'User-Agent': "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36",

    # 'Accept': "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3",

    # 'Referer': "https://magi.com/",

    # 'Accept-Encoding': "gzip, deflate",

    # 'Accept-Language': "zh-CN,zh;q=0.9",

    # 'Cookie': "Hm_lvt_28af3b8ab090b6821eea60c696e82b96=1573539698,1573540931; Hm_lpvt_28af3b8ab090b6821eea60c696e82b96=1573540931; ALLYESID4=128D850DE1E5CFA6; wdcid=11576d250e703f68; wdses=274efe2ee2728bdc; zycna=XkZbSr7Ily0BAXPBvUrZ6/aL; wdlast=1573540932",

    # 'Postman-Token': "3fb8dcac-17e0-431b-bc1e-209ab1e7c2dd,86d4a803-c79a-4949-ac91-1edd3323465e",

    # 'Host': "www.ce.cn",

    # 'cache-control': "no-cache"

    }

spo=['特斯拉', '电池供应商', '松下']

import chardet

response = requests.request("GET", url, headers=headers)

response.encoding=chardet.detect((response.content))["encoding"]

# response.encoding="utf-8"

import lxml.etree

taxt = lxml.etree.HTML(response.text)

list_sentence=taxt.xpath("//body//text()")

import re

# for t in t_list:

#     t = re.split("(。|！|？)",t)

#     if len(t)>1:

#         t = ["".join(i) for i in zip(t[0::2], t[1::2])]

#     print(t)

spo_sentence = []

for sentence in list_sentence:

    sentence_list = re.split("(。|！|？)", sentence)

    if len(sentence_list) > 1:

        sentence_list = ["".join(i) for i in zip(sentence_list[0::2], sentence_list[1::2])]

    for sentence in sentence_list:

        if spo[1]=="描述" or spo[1]=="标签" or spo[1]=="近义项":

            if sentence.find(spo[0])!=-1 and sentence.find(spo[2])!=-1:

                spo_sentence.append(sentence)

                print(sentence)

        else:

            if sentence.find(spo[0])!=-1 and sentence.find(spo[1])!=-1 and sentence.find(spo[2])!=-1:

                spo_sentence.append(sentence)

                print(sentence)

if spo_sentence:

    item = {

        "spo_sentence": spo_sentence,

        "spo": spo

    }

    print(item)

python zip用法的更多相关文章

Python高级用法
Python高级用法三元表达式 x = 10 y = 20 print(x if x > y else y) x = 100 y = 20 print(x if x > y else y ...
python zip文件密码爆破
#!/usr/bin/env # coding=UTF-8 import zipfile import threading import os import sys class CrackZip: d ...
Python高级用法总结
Python很棒,它有很多高级用法值得细细思索,学习使用.本文将根据日常使用,总结介绍Python的一组高级特性,包括:列表推导式.迭代器和生成器.装饰器. 列表推导(list comprehensi ...
python argparse用法总结
转:python argparse用法总结 1. argparse介绍 argparse是python的一个命令行解析包,非常适合用来编写可读性非常好的程序. 2. 基本用法 prog.py是我在li ...
Anaconda下载及安装及查看安装的Python库用法
Anaconda下载及安装及查看安装的Python库用法 Anaconda 是一个用于科学计算的 Python 发行版,提供了包管理与环境管理的功能.Anaconda 利用 conda 来进行 pac ...
python enumerate用法总结【转】
enumerate()说明 enumerate()是python的内置函数 enumerate在字典上是枚举.列举的意思对于一个可迭代的(iterable)/可遍历的对象(如列表.字符串),enum ...
python zip函数（11）
一.zip函数描述和使用 zip() 函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的对象,返回的结果可以直接强转为list列表,这样做的好处是节约了不少的 ...
Python import用法以及与from...import的区别
Python import用法以及与from...import的区别在python用import或者from...import来导入相应的模块.模块其实就是一些函数和类的集合文件,它能实现一些相应的 ...
预备知识-python核心用法常用数据分析库（上）
1.预备知识-python核心用法常用数据分析库(上) 目录 1.预备知识-python核心用法常用数据分析库(上) 概述实验环境任务一:环境安装与配置 [实验目标] [实验步骤] 任务二:Pan ...

随机推荐

D3 GEO应用专题(一):绘制旋转的3D地球
https://gallery.echartsjs.com/explore.html#sort=rank~timeframe=all~author=all 雷达图 https://blog.csdn. ...
2019icpc银川网络赛
外面吵得风生水起,我校平静地在打比赛,丝毫不知道这次比赛的题目就是把2018银川邀请赛的题照搬过来了QAQ,主办方真牛逼.. A Maximum(思维) 题意:维护一个栈,支持入栈和出栈操作,并计算每 ...
小菜鸟之HTML常用
html的基本结构是什么? 表示段落标签是什么?<p> 表示标题标签的是什么?<title>Css标签样式</title> 表示区域标签的是什么?<div&g ...
【Redis】Redis持久化
Redis数据持久化 Redis的特性: 易扩展,大数据高性能,多样灵活的数据模型,受限内存 Redis默认端口: 6379 Redis数据持久化分为有两种: RDB: 每隔一段时间就把内存数据写入磁 ...
THUSC2016
补退选 Luogu LOJ BZOJ 比较裸. 建一棵Trie树,记录一下每个节点的\(sum\)表示经过该点的字符串个数,每次暴力插入.删除. 同时每个节点维护一个vector,记录一下这个点的\( ...
PHP实现字母数字混合验证码
一款简单的PHP实现字母数字混合验证码,支持自定义验证码.验证码图片.宽度.高度.个数.背景图片等验证码调用地址:Application\Home\Controller\CodeController ...
python 初始化__init__()
init()方法的重要性体现在两点. 1.初始化既是对象生命周期的开始,也是非常重要的一个步骤,每个对象都必须正确的执行了初始化才能够正常的工作 2.__init__()方法的参数可以多种形式来完成赋 ...
django进阶版1
目录字段中choice参数 MTV与MVC模型 AJAX(*********) Ajax普通请求 Ajax传json格式化数据 Ajax传文件序列化组件 Ajax+sweetalert 字段中ch ...
Web 开发和数据科学家仍是 Python 开发的两大主力
由于 Python 2 即将退役,使用 Python 3 的开发者大约为 90%,Python 2 的使用量正在迅速减少.而去年仍有 1/4 的人使用 Python 2. Web 开发和数据科学家仍是 ...
C# 反射遍历对象所有属性
[TestMethod] public void Test6() { List<RepaymentRecord> repaymentList = new List<Repayment ...

python zip用法

python zip用法的更多相关文章

随机推荐

热门专题