SQL 查询强化 - 数据准备
最近要搞新的项目了, 我的 BI 报表这块, 我感觉, 可能又要写sql, 对于一些简单的 查询, 表连接我还应付得来, 如果涉及多个表的, 什么子查询嵌套, 自定义函数, 加上控制流...就感觉就不行了, 下的我赶紧从网上找几篇教程来跟着写一写...
SQL 真的是, 特别, 特别重要, 面试,笔试必考... 而我是专做数据这块, 必然是重中之重. 而然,我真实中却, 真的写的很少, 主要是我太依赖 Pandas 了, 直接连接上多个表, 然后就可以为所欲为, 其实跟sql 是一样的, 什么段筛选, 表横向连接 (join) , 纵向连接 (union) , 分组聚合 (group by, aggregation) + 控制流(if else, loop) 80% 的数据处理内容, 就是这些呀.
我在处理这些内容时, 用编程语言如 Python 来搞, 轻轻松松, 再复杂的逻辑, 我无所畏惧. 但一旦要用 sql 写出逻辑来, 我真的是很头疼, 而且吧, 不同的 sql 写法又不一样(有差异)标准sql, mysql, oracle, sqlserver, 以及目前公司用的 sybase sql... 我好难...
但必须迈过这道坎. (就以mysql 为栗子来整吧, 反正大致也差不多的).
表关系
还是咱最为熟悉的, 学生表, 成绩表, 课程表, 教师表... 业务也是差不多的, 只是熟悉度而已, 我感觉.

数据准备
-- 创建库
-- 终端: pysql -u root -p (回车)
-- 密码: xxxx
show databases;
drop database if exists cj;
create database cj charset=utf8;
use cj;
-- 1. 学生表 student (s_id, s_name, birth_date, gender)
drop table if exist student;
create table student(
s_id char(5),
s_name varchar(20),
birth_date date,
gender char(3)
);
-- 插入学生数据
insert into student(s_id,s_name,birth_date,gender)
values('0001' , '王二' , '1989-01-01' , '男');
insert into student(s_id,s_name,birth_date,gender)
values('0002' , '星落' , '1990-12-21' , '女');
insert into student(s_id,s_name,birth_date,gender)
values('0003' , '胡小适' , '1991-12-21' , '男');
insert into student(s_id,s_name,birth_date,gender)
values('0004' , '油哥' , '1996-10-01' , '男');
-- 2. 成绩表 score (s_id, c_id, score)
drop table if exists score;
create table score(
s_id char(5),
c_id char(5),
score int
);
-- 插入学生成绩
insert into score(s_id,c_id,score)
values('0001' , '0001' , 80);
insert into score(s_id,c_id,score)
values('0001' , '0002' , 90);
insert into score(s_id,c_id,score)
values('0001' , '0003' , 99);
insert into score(s_id,c_id,score)
values('0002' , '0002' , 60);
insert into score(s_id,c_id,score)
values('0002' , '0003' , 80);
insert into score(s_id,c_id,score)
values('0003' , '0001' , 80);
insert into score(s_id,c_id,score)
values('0003' , '0002' , 80);
insert into score(s_id,c_id,score)
values('0003' , '0003' , 80);
-- 3. 课程表 course (c_id, c_name, t_id)
drop table if exists course;
create table course(
c_id char(5),
c_name varchar(20),
t_id char(5)
);
-- 插入课程信息
insert into course(c_id,c_name,t_id)
values('0001' , '语文' , '0002');
insert into course(c_id,c_name,t_id)
values('0002' , '数学' , '0001');
insert into course(c_id,c_name,t_id)
values('0003' , '英语' , '0003');
-- 4.教师表 teacher (t_id, t_name)
drop table if exists teacher;
create table teacher(
t_id char(5),
t_name varchar(20)
);
-- 插入教师信息
insert into teacher(t_id,t_name)
values('0001' , '欧拉');
insert into teacher(t_id,t_name)
values('0002' , '仲尼');
-- 这里的t_name是空值(null)
insert into teacher(t_id,t_name)
values('0003' , null);
-- 这里的t_name是空字符串('')
insert into teacher(t_id,t_name)
values('0004' , '');
数据预览
mysql> show tables;
+--------------+
| Tables_in_cj |
+--------------+
| course |
| score |
| student |
| teacher |
+--------------+
4 rows in set (0.00 sec)
学生表 student
mysql> select * from student;
+------+-----------+------------+--------+
| s_id | s_name | birth_date | gender |
+------+-----------+------------+--------+
| 0001 | 王二 | 1989-01-01 | 男 |
| 0002 | 星落 | 1990-12-21 | 女 |
| 0003 | 胡小适 | 1991-12-21 | 男 |
| 0004 | 油哥 | 1996-10-01 | 男 |
+------+-----------+------------+--------+
4 rows in set (0.00 sec)
成绩表 score
mysql> select * from score;
+------+------+-------+
| s_id | c_id | score |
+------+------+-------+
| 0001 | 0001 | 80 |
| 0001 | 0002 | 90 |
| 0001 | 0003 | 99 |
| 0002 | 0002 | 60 |
| 0002 | 0003 | 80 |
| 0003 | 0001 | 80 |
| 0003 | 0002 | 80 |
| 0003 | 0003 | 80 |
+------+------+-------+
8 rows in set (0.00 sec)
课程表 course
+------+--------+------+
| c_id | c_name | t_id |
+------+--------+------+
| 0001 | 语文 | 0002 |
| 0002 | 数学 | 0001 |
| 0003 | 英语 | 0003 |
+------+--------+------+
3 rows in set (0.00 sec)
教师表 teacher
mysql> select * from teacher;
+------+--------+
| t_id | t_name |
+------+--------+
| 0001 | 欧拉 |
| 0002 | 仲尼 |
| 0003 | NULL |
| 0004 | |
+------+--------+
4 rows in set (0.00 sec)
后面的查询, 都基于这个数据, 字段啥的. 当然这也是咱最为熟悉的表. 哎, 真的是孰能生巧吧, 这种东西.
SQL 查询强化 - 数据准备的更多相关文章
- 视图查询的数据和sql查询的数据不一样
视图查询的数据和sql查询的数据不一样. 手动刷新视图 exec sp_refreshview 视图名称
- sql 查询重复数据,删除重复数据,过滤重复数据
select * from (SELECT titleid,count(titleid) c FROM [DragonGuoShi].[dbo].[ArticleInfo] group by titl ...
- ORACLE和SQL查询库数据量
ORACLE根据账号查询每张表数据量: select t.table_name,t.num_rows from user_tables t ORDER BY NUM_ROWS DESC; SQL SE ...
- 关于SQL查询某年数据 和DATEPART 函数的使用
数据库查询某年数据(sql server)select *from 表名 where YEAR(存时间的字段名) =某年select *from News where YEAR(addDate) =2 ...
- [sql查询] 重复数据只取一条
SELECT * FROM tab_init WHERE id IN ( --根据Data分类获取数据最小ID列表 select max(id) from tab_init group by a,b ...
- sql查询当天数据
向数据库中添加日期 MS SQL SERVER: NSERT into student(studentid,time1)values('15',getdate()); MY SQLinsert int ...
- PL/SQL 查询的数据出现乱码
解决方法: 1.首先在查询出Oracle数据库的字符集. select userenv('language') from dual; 2.新建系统变量 NLS_LANG,变量值为第一步查询出来的字符集 ...
- 工作 巧遇 sql 查询 一组数据中 最新的一条
SELECT * FROM rsl a, (SELECT CODE, max(time_key) time_key FROM rsl GROUP BY CODE ) b WHERE a. CODE = ...
- sql 查询大数据 常用 50列优化
大数据量的问题是很多面试笔试中经常出现的问题,比如baidu google 腾讯 这样的一些涉及到海量数据的公司经常会问到. 下面的方法是我对海量数据的处理方法进行了一个一般性的总结,当然这些方法可能 ...
- SQL查询遍历数据方法一 [ 临时表 + While循环]
以下以SQL Server 2000中的NorthWind数据库中的Customers表为例, 用 临时表 + While循环 的方法, 对Customers表中的CompanyName列进行遍历 c ...
随机推荐
- 【FAQ】HarmonyOS SDK 闭源开放能力 —Live View Kit (1)
1.问题描述: 客户端创建实况窗后,通过Push kit更新实况窗内容,这个过程是自动更新的还是客户端解析push消息数据后填充数据更新?客户端除了接入Push kit和创建实况窗还需要做什么工作? ...
- warning C291: not every exit path returns a value 在switch分支中使用return
switch(data) { case 1: ...
- 动态能力理论&知识管理理论--商业之所见
动态能力理论:企业整合,建立和再配置内外部资源以适应快速变化环境的能力. (1)"动态"指的是适应不断变化的环境,企业必须具有不断更新自身能力的能力: (2)"能力&qu ...
- JavaGUI - [04] BoxLayout
题记部分 一.简介 为了简化开发,Swing引入了一个新的布局管理器:BoxLayout.BoxLayout可以在垂直和水平两个方向上摆放GUI组件,BoxLayout提供了如下一个简单的构造器: ...
- php-fpm自动重启 解决方案
环境:Mac.php7.1.nginx 现象:killall php-fpm,php-fpm自动重启 共有如下几种解决方案: 1.检查php-fpm.conf的deamonize模式是否开启 2.查找 ...
- Unable to Connect: sPort: 0 C# ServiceStack.Redis 访问 redis
需求: 对数据库中的不断抓取的文章进行缓存,因此需要定时访问数据,写入缓存中 在捕获到的异常日志发现错误:Unable to Connect: sPort: 0 使用的访问方式是线程池的方式:Poo ...
- 【Matlab】求解复合材料层合板刚度矩阵及柔度矩阵
1. matlab文件结构 2. main.m代码 clc clear; warning off; %% %铺层角度数组 angles=[0 90 0]; % ° %单层厚度 ply_thicknes ...
- go 组合函数 Collection
我们经常需要程序在数据集上执行操作,比如选择满足给定条件的所有项,或者将所有的项通过一个自定义函数映射到一个新的集合上. 在某些语言中,会习惯使用泛型. Go 不支持泛型,在 Go 中,当你的程序或者 ...
- Django实战项目-学习任务系统-自定义URL拦截器
接着上期代码框架,6个主要功能基本实现,剩下的就是细节点的完善优化了. 首先增加URL拦截器,你不会希望没有登录用户就可以进入用户主页各种功能的,所以增加URL拦截器可以解决这个问题. Django框 ...
- bs4库爬取天气预报
Python不仅用于网站开发,数据分析,图像处理,也常用于爬虫技术方向,最近学习了解下,爬虫技术入门一般先使用bs4库,爬取天气预报简单尝试下. 第一步:首先选定目标网站地址 网上查询,天气预报准确率 ...