python pandas相关知识点（练习）

首先引入库文件，并进行数据读取

import pandas as pd

import numpy as np

data_Base=pd.read_csv("D:\\Exam_Test\\unicomapp_r0_201904_jinan.csv")
#data_Ite=pd.read_csv("D:\\Exam_Test\\lte_cm_jinan.csv",encoding="gbk")

data_Base.shape

显示行与列：

print("行数{0},列数{1}".format(str(data_Base.shape[0]),str(data_Base.shape[1])))

查看字段空值数量：

data_Base.isnull().sum()

删除空值行：

data_Base.dropna(subset=["L-CELLID"],inplace=True)

每个 value 数值的采样点个数：

Df_SINR=data_Base["L-SINR"].value_counts().sort_index().reset_index()

Df_SINR

柱状图：

#SINR 样本分布柱状图

from example.commons import Faker

from pyecharts import options as opts

from pyecharts.charts import Bar

def bar_base() -> Bar:

    c = (

        Bar()

        .add_xaxis(list(Df_SINR["index"]))

        .add_yaxis("SINR样本", list(Df_SINR["L-SINR"]),label_opts=opts.LabelOpts(is_show=False))

        .set_global_opts(

            title_opts=opts.TitleOpts(title="SINR 样本分布",pos_left="center"),

            legend_opts=opts.LegendOpts(is_show=True,pos_left="right"),

        )

    )

    return c

bar_base().render("L_SINR 分布.html")

获取不是某些值得列：

data_Base=data_Base[~data_Base["L-SINR"].isin([""])]

data_Base.shape

设置最大显示列：

pd.set_option("display.max_columns",3000)

设置索引列：

data_Base=data_Base.set_index("RECTIME")

重采样：

data_Apr=data_Base.resample("D").mean().reset_index()

data_Apr

根据指定列生成新的DataFrame:

data_Apr_new=pd.DataFrame(data_Apr,columns=["RECTIME","L-RSRP","L-SINR"])

根据时间获取哪天（Day）:

data_Apr_new["RECTIME"].dt.day

双Y轴，趋势图：

#使用 pyecharts 或其他可视化工具，将每天平均 RSRP 和平均 SINR 趋势作图

import pyecharts.options as opts

from example.commons import  Faker

from pyecharts.charts import Line

def line_base() -> Line:

    c = (

        Line()

        .add_xaxis(list(data_Apr_new["RECTIME"].dt.day))

        .add_yaxis("SINR", data_Apr_new["L-SINR"].round(2),is_smooth=True,is_symbol_show=False)

        .extend_axis(

            yaxis=opts.AxisOpts(

                name="RSRP",

                min_=data_Apr_new["L-RSRP"].min().round(2),

                max_=data_Apr_new["L-RSRP"].max().round(2),

            )

        )

        .set_global_opts(title_opts=opts.TitleOpts(title="4 月份济南 RSRP 和 SINR 趋势图",pos_left="center"),

                        legend_opts=opts.LegendOpts(pos_left="right"),

                         datazoom_opts=opts.DataZoomOpts(is_show=True),

                        yaxis_opts=opts.AxisOpts(name="SINR",min_=round(data_Apr_new["L-SINR"].values.min(),2),max_=round(data_Apr_new["L-SINR"].values.max(),2)),

                        )

    )

    d = (

        Line()

        .add_xaxis(list(data_Apr_new["RECTIME"].dt.day))

        .add_yaxis("RSRP", data_Apr_new["L-RSRP"].round(2),yaxis_index=1,is_smooth=True,is_symbol_show=False)

    )

    return c.overlap(d)

line_base().render_notebook()

条件判断：

condition1=df_cm_new["样本量"]>100

condition2=df_cm_new["RSRP>=-110 采样点占比"]>0.8

condition3=df_cm_new["SINR>0 采样点占比"]<0.7

df_cm_new=df_cm_new[condition1&condition2&condition3]

df_cm_new.head()

发送邮件：

#发送邮件

import smtplib

from email.mime.text import MIMEText    #MIME (Multipurpose Internet Mail Extensions) 是描述消息内容类型的因特网标准。MIME 消息能包含文本、图像、音频、视频以及其他应用程序专用的数据。

from email.mime.multipart import MIMEMultipart

from email.header import Header

from email.mime.application import MIMEApplication

# 第三方 SMTP 服务

mail_host="smtp.qq.com"  #设置服务器

mail_user="597945025@qq.com"    #用户名

mail_pass="cwtytropotbubgai"   #口令

sender = '597945025@qq.com'

receivers = ['625645840@qq.com']  # 接收邮件，设置为接收方的邮箱

#创建一个带附件的实例

message = MIMEMultipart()

message['From'] = Header(sender, 'utf-8')

message['To'] =  Header(str(receivers), 'utf-8')

subject = 'mail test'

message['Subject'] = Header(subject, 'utf-8') 

#邮件正文内容

message.attach(MIMEText('这是邮箱测试，请查收', 'plain', 'utf-8'))

for city in City2:

# f = 'D:\\data.csv'

    xlsxpart = MIMEApplication(open(city+".xls", 'rb').read())

    xlsxpart.add_header('Content-Disposition', 'attachment', filename=('gbk', '', (city+".xls")))

    message.attach(xlsxpart)

try:

    smtpObj = smtplib.SMTP()

    smtpObj.connect(mail_host, 25)    # 25 为 SMTP 端口号

    smtpObj.login(mail_user,mail_pass)

    smtpObj.sendmail(sender, receivers, message.as_string())

    print ("邮件发送成功")

except smtplib.SMTPException:

    print ("Error: 无法发送邮件")

地图：

from pyecharts.charts import Map

from pyecharts.charts import Page

from pyecharts import options as opts

city =df_last["City2"]

val_min_rsrp,val_max_rsrp = df_last["RSRP>=-110 采样点占比"].min().round(2),df_last["RSRP>=-110 采样点占比"].max().round(2)

val_min_sinr,val_max_sinr =df_last["SINR>0 采样点占比"].min().round(2),df_last["SINR>0 采样点占比"].max().round(2)

visual_color = ['#df2f48','#dfa59b','#1c39ca','#80d327']

def map_left() -> Map:

    c = (

        Map()

        .add("", [list(z) for z in zip(list(city), list(df_last["RSRP>=-110 采样点占比"]))], "济南")

        .set_global_opts(

            title_opts=opts.TitleOpts(title="济南各区县4G网络良好覆盖（RSRP>=-110）比例分布图",pos_left="center"),

            visualmap_opts=opts.VisualMapOpts(min_=val_min_rsrp,max_=val_max_rsrp,range_color=visual_color),

            tooltip_opts=opts.TooltipOpts(formatter="{b}:{c} %")

        )

        )

    return c

def map_right() -> Map:

    c = (

        Map()

        .add("", [list(z) for z in zip(list(city), list(df_last["SINR>0 采样点占比"]))], "济南")

        .set_global_opts(

            title_opts=opts.TitleOpts(title="济南各区县4G网络良好质量（SINR>0）比例分布图",pos_left="center"),

            visualmap_opts=opts.VisualMapOpts(min_=val_min_sinr,max_=val_max_sinr),

            tooltip_opts=opts.TooltipOpts(formatter="{b}:{c} %")

        )

    )

    return c

page = Page(interval=0)

page.add(map_left(), map_right())

page.render_notebook()

对指定列进行处理（正则）

具体过程：首先将其转化成str，然后进行正则表达式匹配

data_Base['USER-ID'] = data_Base['USER-ID'].astype(np.str)

import re

pattern = re.compile(r'^[-+]?[-0-9]\d*\.\d*|[-+]?\.?[0-9]\d*$')

data_Base["USER-ID"]=data_Base["USER-ID"].apply(lambda x:x if pattern.match(x) else np.nan)

zip转化指定格式：

将三列（名称，经度，纬度）　　

# # a=[list (z) for z in zip(grid_no["longitude"],grid_no["latitude"])]

# list( zip(grid_no["longitude"],grid_no["latitude"]) )

# list( grid_no["grid_no"])
#zip() 函数用于将可迭代的对象作为参数，将对象中对应的元素打包成一个个元组，然后返回由这些元组组成的列表

base = { inx: list(item) for inx, item in zip( list( grid_no['grid_no'] ),  list( zip(grid_no['longitude'], grid_no['latitude']) )  ) }

调用百度地图BMAP

with open('./data.json', 'w') as outfile:

    json.dump(base, outfile)

from pyecharts.charts import BMap

import json

BAIDU_AK = "GbQ806nWqGFMjuiGjTm6jPgcVGWICGA1"

def bmap_base() -> BMap:

    c = (

        BMap(init_opts = opts.InitOpts(height='615px',width='1350px'))

        .add_schema(

            baidu_ak=BAIDU_AK,

            center=[117.064366, 36.646401],

            zoom=15

        )

        .add_coordinate_json(json_file='./data.json')

        .add(

            "",

            data_pair =[list(z) for z in zip(list(data["grid_no"]),list(data["覆盖好质量差的质差样本占比"]))],

            label_opts=opts.LabelOpts(is_show=False),

            symbol_size=6,

            type_ = 'effectScatter'

        )

        .add_control_panel(navigation_control_opts=opts.BMapNavigationControlOpts(),

                          scale_control_opts=opts.BMapScaleControlOpts(),

                          overview_map_opts=opts.BMapOverviewMapControlOpts(is_open=True,offset_width=0,offset_height=0))

        .set_global_opts(title_opts=opts.TitleOpts(title="济南覆盖好质量差SINR质差栅格分布图",pos_left='center'))

        .set_series_opts(effect_opts=opts.EffectOpts(symbol='circle',scale=5,brush_type = "stroke"))

    )

    return c

bmap =  bmap_base()

bmap.render("济南质差栅格分布图.html")

bmap.render_notebook()

堆叠柱状图

bar=Bar(init_opts = opts.InitOpts(height='350px'))

bar.add_xaxis(list(prb_label_city_count["City1"].unique()))

for label in prb_label_city_count["prb_label"].unique():

    p = prb_label_city_count[prb_label_city_count["prb_label"]==label]

    bar.add_yaxis(label,list((p["prb_label_per"]*100).round(2)),stack="stack1") 

bar.set_series_opts(label_opts=opts.LabelOpts(is_show=False))

bar.set_global_opts(

                    title_opts=opts.TitleOpts(title="各地市PRB利用率分区间段分布图",pos_left="center"),

                   legend_opts=opts.LegendOpts(pos_top="8%"),

                   yaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(formatter="{value} %"),max_=100),

                    tooltip_opts=opts.TooltipOpts(formatter="{b}:{c} %")

                    )

bar.render_notebook()

根据省信息标注市区地图：

city = avg_traffic['City1'] + "市"

val_min,val_max = avg_traffic["Downlink traffic at the PDCP Layer"].min(),avg_traffic["Downlink traffic at the PDCP Layer"].max()

def map_shandong() -> Map:

    c = (

        Map()

        .add("", [list(z) for z in zip(list(city), list(avg_traffic["Downlink traffic at the PDCP Layer"].round(2)))], "山东")

        .set_global_opts(

            title_opts=opts.TitleOpts(title="2月份各地市平均单小区忙时业务量",pos_left="center"),

            visualmap_opts=opts.VisualMapOpts(min_=val_min,max_=val_max),

        )

    )

    return c

mymap = map_shandong()

mymap.render()

mymap.render_notebook()

根据特定关键字数据进行分段操作：

newtable["prb_label"] = pd.cut(newtable["Average downlink PRB usage"],[0,0.2,0.5,0.8,1],labels=["低负荷","中等负荷","高负荷","超高负荷"],include_lowest=True)

python pandas相关知识点（练习）的更多相关文章

python学习相关知识点
1.ndarray中,添加行或列:https://blog.csdn.net/lishuandao/article/details/52444288 2.numpy中ndarray数组拼接方法介绍:h ...
python多线程相关知识点
1. 信号量信号机维护着一个计数器,指定可同时访问资源或者进入临界区的线程数.每次有一个线程获得信号机时,计数器-1.若计数器为0,其他线程就停止访问信号机 Semphore,是一种带计数的线程同步 ...
Python开发一个csv比较功能相关知识点汇总及demo
Python 2.7 csv.reader(csvfile, dialect='excel', **fmtparams)的一个坑:csvfile被csv.reader生成的iterator,在遍历每二 ...
Caffe学习系列（二）Caffe代码结构梳理，及相关知识点归纳
前言: 通过检索论文.书籍.博客,继续学习Caffe,千里之行始于足下,继续努力.将自己学到的一些东西记录下来,方便日后的整理. 正文: 1.代码结构梳理在终端下运行如下命令,可以查看caffe代码 ...
php正则相关知识点
关于正则,其实简单就是搜索和匹配.php,java,python等都是支持正则的,php正则兼容perl.好多同学觉得正则比较难,比较抽象,其实正则是非常简单的,主要是一个熟悉和反复练习的结果,还有一 ...
python遇到的知识点
python遇到的知识点,记录一下.方便学习. 文件相关操作查了资料,关于open()的mode参数: 'r':读 'w':写 'a':追加 'r+' == r+w(可读可写,文件若不存在就报错(I ...
基于tornado python pandas和bootstrap上传组件的mongodb数据添加工具
总体思路:基于bootstrap4的前端页面上传组件,把excel文件上传至服务器,并利用python pandas读取里面的数据形成字典列表通过pymongo 接口把数据插入或追加到mongodb ...
django学习-2.urls.py和view.py的相关知识点
1.URL函数简单解析 1.1.url() 函数可以接收四个参数,分别是两个必选参数:regex.view,和两个可选参数:kwargs.name. def url(regex, view, kwar ...
UITableView相关知识点
//*****UITableView相关知识点*****// 1 #import "ViewController.h" // step1 要实现UITableViewDataSou ...

随机推荐

APP网络测试点
js日期处理
Js获取当前日期时间及其它操作 var myDate = new Date(); myDate.getYear(); //获取当前年份(2位) myDate.getFullYear(); //获取完整 ...
【转】Visual Studio 2013 Tools for Unity安装目录，Visual Studio 2013 Tools.unitypackage
http://blog.csdn.net/dynastyting/article/details/46505349 Visual Studio 2013 Tools for Unity安装目录 D:\ ...
BZOJ 2190：[SDOI2008]仪仗队（欧拉函数）
[SDOI2008]仪仗队 Description 作为体育委员,C君负责这次运动会仪仗队的训练.仪仗队是由学生组成的N * N的方阵,为了保证队伍在行进中整齐划一,C君会跟在仪仗队的左后方,根据其视 ...
POJ 2184：Cow Exhibition（01背包变形）
题意:有n个奶牛,每个奶牛有一个smart值和一个fun值,可能为正也可能为负,要求选出n只奶牛使他们smart值的和s与fun值得和f都非负,且s+f值要求最大. 分析: 一道很好的背包DP题,我们 ...
POJ 3686 The Windy's（思维+费用流好题）
The Windy's Time Limit: 5000MS Memory Limit: 65536K Total Submissions: 5362 Accepted: 2249 Descr ...
Codeforces Round #323 (Div. 2) C 无敌gcd 数学/贪心
C. GCD Table time limit per test 2 seconds memory limit per test 256 megabytes input standard input ...
[六省联考2017]组合数问题 (矩阵优化$dp$)
题目链接 Solution 矩阵优化 $dp$. 题中给出的式子的意思就是: 求 nk 个物品中选出 mod k 为 r 的个数的物品的方案数. 考虑朴素 $dp$ ,定义状态 \(f[i][ ...
在vue中使用sass
首先安装node-sass和sass-loader cnpm install node-sass && sass-loader --save 在webpack.config.js 的m ...
从无序序列中求这个序列排序后邻点间最大差值的O(n)算法
标题可能比较绕口,简单点说就是给你一个无序数列A={a1,a2,a3……an},如果你把这个序列排序后变成序列B,求序列B中相邻两个元素之间相差数值的最大值. 注意:序列A的元素的大小在[1,2^31 ...

python pandas相关知识点（练习）

首先引入库文件，并进行数据读取

显示行与列：

查看字段空值数量：

删除空值行：

每个 value 数值的采样点个数：

柱状图：

获取不是某些值得列：

设置最大显示列：

设置索引列：

重采样：

根据指定列生成新的DataFrame:

根据时间获取哪天（Day）:

双Y轴，趋势图：

条件判断：

发送邮件：

地图：

对指定列进行处理（正则）

zip转化指定格式：

调用百度地图BMAP

堆叠柱状图

python pandas相关知识点（练习）的更多相关文章

随机推荐

热门专题