该用Python还是SQL？4个案例教你节省时间

在数据分析行业，对数据提出的每一个问题都可以用多种潜在的语言和工具包来回答。每种语言都有其优势，它们之间也存在着不同的区别。不能否认的是，有些操作用Python执行起来要比SQL更加高效。这篇文章分享了4个能够节省时间的案例，在这几个案例中，Python在探索和分析数据集方面远远优于SQL。

描述性统计

假设你正在探索新的数据集，可以使用许多不同的方法来统计描述这些数据，并得到总体感知。例如：

· 计数

· 平均值

· 标准偏差

· 最小值

· 第一四分位数

· 第二四分位数(中位数)

· 第三四分位数

· 最大值

要想在SQL中得到以上信息，你需要输入：

但也许你并不想输入以上所有代码。你可以使用pandas的DataFrame.describe()函数来得出基础数据集的基本描述性统计信息。

datasets['Python Input'].describe().round(1)

查看此报告并仿照该报告自行探索描述性统计。

移动平均值

假设你现在想计算移动平均值，以便于在输入不断变化的情况下得到其明确的平均值。移动平均值有助于消除数据骤降和峰值的影响，从而使长期趋势更加显而易见。

在SQL中，你可以输入这样的查询（query）：

在Python中，只需以下代码便可快速得到相同的两周移动平均值：

另外，Python能够进一步实现可视化。

枢轴

要想重新排列数据与枢轴以绘制图表或是演示文稿格式，在SQL中需要几个步骤才能实现。在这个案例中，需要将Mode Public Warehouse中大学橄榄球运动员的数据集从行枢轴转换到列枢轴。

首先，要汇总每年、每场比赛的运动员的信息来准备数据。

转换数据之后，需要将查询（query）嵌入子查询（subquery）中。

接下来，如果你想将结果按照年份分成几列，可以用SELECT语句为每个项单独创建列。

虽然这能使你很好地控制查询和进程，但是用Python操作实则要更加轻松。当你从年份和比赛中SELECT大学橄榄球运动员后，可以跳转到Notebook并运行DataFrame.pivot。你能根据列值重塑数据，因而可以重新排列结果集。

DataFrame.pivot

自连接

在很多情况下，你可能想要将一个表与其自身连接起来。要想创建自连接（self join），需要先输入此查询，以便为同一张表创建不同的引用名称。

在pandas中，我们可以这样实现：

想自己尝试建立自连接吗？仿照这篇报告来撰写你的个人Mode报告吧！

该用Python还是SQL？4个案例教你节省时间的更多相关文章

python 连接sql server
linux 下pymssql模块的安装所需压缩包:pymssql-2.1.0.tar.bz2freetds-patched.tar.gz 安装: tar -xvf pymssql-2.1.0.tar ...
Sql Server触发器案例（初学者学习案例）
万事都是从最简单的一句“hello world”开始,所以我接下里介绍的sql触发器学习案例也从最简单的案例来说明分析: 1.首先创建表,这几张表你们也许很熟,在百度搜触发器案例都是使用这2张表 Cr ...
(火炬)MS SQL Server数据库案例教程
(火炬)MS SQL Server数据库案例教程创建数据库: CREATE DATABASE TDB //数据库名称 ON ( NAME=TDB_dat,//逻辑文件名在创建数据库完成之后语句中引 ...
Python和SQL Server 2017的强大功能
Python和SQL Server 2017的强大功能摘要: 源:https://www.red-gate.com/simple-talk/sql/sql-development/power-pyt ...
Python和SQL 2017的强大功能
Python和SQL Server 2017的强大功能原文来自:https://www.red-gate.com/simple-talk/sql/sql-development/power-py ...
一个特殊的SQL Server阻塞案例分析
上周,在SQL Server数据库下面遇到了一个有意思的SQL阻塞(SQL Blocking)案例.其实个人对SQL Server的阻塞还是颇有研究的.写过好几篇相关文章. 至于这里为什么要总结一下这 ...
[Spark][Python][DataFrame][SQL]Spark对DataFrame直接执行SQL处理的例子
[Spark][Python][DataFrame][SQL]Spark对DataFrame直接执行SQL处理的例子 $cat people.json {"name":" ...
python文件读取和写入案例
python文件读取和写入案例直接上代码吧都是说明百度上找了很多,最终得出思路没有直接可以读取修改的扩展,只能先读取,然后复制一份,然后在复制出来的文件里面追加保存然后删除读的那个,但是缺 ...
web实践小项目<一>:简单日程管理系统（涉及html/css，javascript，python，sql，日期处理）
暑假自学了些html/css,javascript和python,苦于学完无处练手几乎过目即忘...最后在同学的建议下做了个简单日程管理系统.借第一版完成之际,希望能将实践期间犯过的错误和获得的新知进 ...

随机推荐

从0开始构建你的api网关--Spring Cloud Gateway网关实战及原理解析
API 网关 API 网关出现的原因是微服务架构的出现,不同的微服务一般会有不同的网络地址,而外部客户端可能需要调用多个服务的接口才能完成一个业务需求,如果让客户端直接与各个微服务通信,会有以下的问题 ...
C#动态调用泛型类、泛型方法
在制作一个批量序列化工具时遇到了如下问题,在此记录一下,仅供参考. 主程序加载另一个程序集,将其中的所有类取出,然后对这些类分别调用泛型类或泛型方法.控制台程序解决方案如下: Main工程:提供Wor ...
C# 数组比较--取得两个集合的交集,差集,并集的方法
方法关键字: 交集:Intersect 差集:Except 并集:Union 使用代码: , , , , }; , , , , }; var 交集 = arr1.Intersect(arr2).ToL ...
关于Vue.use()使用详解
问题相信很多人在用Vue使用别人的组件时,会用到 Vue.use() .例如:Vue.use(VueRouter).Vue.use(MintUI).但是用 axios时,就不需要用 Vue.use( ...
css，解决文字与图片对齐的问题
测试代码: <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF ...
一起学Android之Storage
概述在Android开发中,存储(Storage)的方式根据具体的需求不同而不同,例如数据对应用程序是私有的还是其他应用程序(和用户)可以访问的,以及保存数据需要多大的空间. 存储分类主要的存储方 ...
sqlserver2012 在视图中建索引
第一种如果已经有视图但是要加索引只需要执行以下SQL就好(前提是此视图必须绑定到架构) CREATE UNIQUE CLUSTERED INDEX in ...
Liunx-cd命令
1. 如何进入上级目录cd .. 2. 如何进入当前用户主目录cd ~3. 如何进入上两级目录cd ../.. 4. 进入当前目录命令cd .5. 如何进入目录 /lym/b 6.切换跟目录
nginx之location配置详解及案例
语法规则: location [=|~|~*|^~] /uri/ { … } = 开头表示精确匹配 ^~ 开头表示uri以某个常规字符串开头,理解为匹配 url路径即可.nginx不对url做编码, ...
小白学习Python之路---开发环境的搭建
本节内容 1.Python的介绍 2.发展史 3.安装Python 4.搭建开发环境 5.Hello World程序一.Python的介绍 Python的创始人为荷兰人吉多·范罗苏姆(Guido v ...

该用Python还是SQL？4个案例教你节省时间

该用Python还是SQL？4个案例教你节省时间的更多相关文章

随机推荐

热门专题