SQL 查询强化 - 数据准备
最近要搞新的项目了, 我的 BI 报表这块, 我感觉, 可能又要写sql, 对于一些简单的 查询, 表连接我还应付得来, 如果涉及多个表的, 什么子查询嵌套, 自定义函数, 加上控制流...就感觉就不行了, 下的我赶紧从网上找几篇教程来跟着写一写...
SQL 真的是, 特别, 特别重要, 面试,笔试必考... 而我是专做数据这块, 必然是重中之重. 而然,我真实中却, 真的写的很少, 主要是我太依赖 Pandas 了, 直接连接上多个表, 然后就可以为所欲为, 其实跟sql 是一样的, 什么段筛选, 表横向连接 (join) , 纵向连接 (union) , 分组聚合 (group by, aggregation) + 控制流(if else, loop) 80% 的数据处理内容, 就是这些呀.
我在处理这些内容时, 用编程语言如 Python 来搞, 轻轻松松, 再复杂的逻辑, 我无所畏惧. 但一旦要用 sql 写出逻辑来, 我真的是很头疼, 而且吧, 不同的 sql 写法又不一样(有差异)标准sql, mysql, oracle, sqlserver, 以及目前公司用的 sybase sql... 我好难...
但必须迈过这道坎. (就以mysql 为栗子来整吧, 反正大致也差不多的).
表关系
还是咱最为熟悉的, 学生表, 成绩表, 课程表, 教师表... 业务也是差不多的, 只是熟悉度而已, 我感觉.
数据准备
-- 创建库
-- 终端: pysql -u root -p (回车)
-- 密码: xxxx
show databases;
drop database if exists cj;
create database cj charset=utf8;
use cj;
-- 1. 学生表 student (s_id, s_name, birth_date, gender)
drop table if exist student;
create table student(
s_id char(5),
s_name varchar(20),
birth_date date,
gender char(3)
);
-- 插入学生数据
insert into student(s_id,s_name,birth_date,gender)
values('0001' , '王二' , '1989-01-01' , '男');
insert into student(s_id,s_name,birth_date,gender)
values('0002' , '星落' , '1990-12-21' , '女');
insert into student(s_id,s_name,birth_date,gender)
values('0003' , '胡小适' , '1991-12-21' , '男');
insert into student(s_id,s_name,birth_date,gender)
values('0004' , '油哥' , '1996-10-01' , '男');
-- 2. 成绩表 score (s_id, c_id, score)
drop table if exists score;
create table score(
s_id char(5),
c_id char(5),
score int
);
-- 插入学生成绩
insert into score(s_id,c_id,score)
values('0001' , '0001' , 80);
insert into score(s_id,c_id,score)
values('0001' , '0002' , 90);
insert into score(s_id,c_id,score)
values('0001' , '0003' , 99);
insert into score(s_id,c_id,score)
values('0002' , '0002' , 60);
insert into score(s_id,c_id,score)
values('0002' , '0003' , 80);
insert into score(s_id,c_id,score)
values('0003' , '0001' , 80);
insert into score(s_id,c_id,score)
values('0003' , '0002' , 80);
insert into score(s_id,c_id,score)
values('0003' , '0003' , 80);
-- 3. 课程表 course (c_id, c_name, t_id)
drop table if exists course;
create table course(
c_id char(5),
c_name varchar(20),
t_id char(5)
);
-- 插入课程信息
insert into course(c_id,c_name,t_id)
values('0001' , '语文' , '0002');
insert into course(c_id,c_name,t_id)
values('0002' , '数学' , '0001');
insert into course(c_id,c_name,t_id)
values('0003' , '英语' , '0003');
-- 4.教师表 teacher (t_id, t_name)
drop table if exists teacher;
create table teacher(
t_id char(5),
t_name varchar(20)
);
-- 插入教师信息
insert into teacher(t_id,t_name)
values('0001' , '欧拉');
insert into teacher(t_id,t_name)
values('0002' , '仲尼');
-- 这里的t_name是空值(null)
insert into teacher(t_id,t_name)
values('0003' , null);
-- 这里的t_name是空字符串('')
insert into teacher(t_id,t_name)
values('0004' , '');
数据预览
mysql> show tables;
+--------------+
| Tables_in_cj |
+--------------+
| course |
| score |
| student |
| teacher |
+--------------+
4 rows in set (0.00 sec)
学生表 student
mysql> select * from student;
+------+-----------+------------+--------+
| s_id | s_name | birth_date | gender |
+------+-----------+------------+--------+
| 0001 | 王二 | 1989-01-01 | 男 |
| 0002 | 星落 | 1990-12-21 | 女 |
| 0003 | 胡小适 | 1991-12-21 | 男 |
| 0004 | 油哥 | 1996-10-01 | 男 |
+------+-----------+------------+--------+
4 rows in set (0.00 sec)
成绩表 score
mysql> select * from score;
+------+------+-------+
| s_id | c_id | score |
+------+------+-------+
| 0001 | 0001 | 80 |
| 0001 | 0002 | 90 |
| 0001 | 0003 | 99 |
| 0002 | 0002 | 60 |
| 0002 | 0003 | 80 |
| 0003 | 0001 | 80 |
| 0003 | 0002 | 80 |
| 0003 | 0003 | 80 |
+------+------+-------+
8 rows in set (0.00 sec)
课程表 course
+------+--------+------+
| c_id | c_name | t_id |
+------+--------+------+
| 0001 | 语文 | 0002 |
| 0002 | 数学 | 0001 |
| 0003 | 英语 | 0003 |
+------+--------+------+
3 rows in set (0.00 sec)
教师表 teacher
mysql> select * from teacher;
+------+--------+
| t_id | t_name |
+------+--------+
| 0001 | 欧拉 |
| 0002 | 仲尼 |
| 0003 | NULL |
| 0004 | |
+------+--------+
4 rows in set (0.00 sec)
后面的查询, 都基于这个数据, 字段啥的. 当然这也是咱最为熟悉的表. 哎, 真的是孰能生巧吧, 这种东西.
SQL 查询强化 - 数据准备的更多相关文章
- 视图查询的数据和sql查询的数据不一样
视图查询的数据和sql查询的数据不一样. 手动刷新视图 exec sp_refreshview 视图名称
- sql 查询重复数据,删除重复数据,过滤重复数据
select * from (SELECT titleid,count(titleid) c FROM [DragonGuoShi].[dbo].[ArticleInfo] group by titl ...
- ORACLE和SQL查询库数据量
ORACLE根据账号查询每张表数据量: select t.table_name,t.num_rows from user_tables t ORDER BY NUM_ROWS DESC; SQL SE ...
- 关于SQL查询某年数据 和DATEPART 函数的使用
数据库查询某年数据(sql server)select *from 表名 where YEAR(存时间的字段名) =某年select *from News where YEAR(addDate) =2 ...
- [sql查询] 重复数据只取一条
SELECT * FROM tab_init WHERE id IN ( --根据Data分类获取数据最小ID列表 select max(id) from tab_init group by a,b ...
- sql查询当天数据
向数据库中添加日期 MS SQL SERVER: NSERT into student(studentid,time1)values('15',getdate()); MY SQLinsert int ...
- PL/SQL 查询的数据出现乱码
解决方法: 1.首先在查询出Oracle数据库的字符集. select userenv('language') from dual; 2.新建系统变量 NLS_LANG,变量值为第一步查询出来的字符集 ...
- 工作 巧遇 sql 查询 一组数据中 最新的一条
SELECT * FROM rsl a, (SELECT CODE, max(time_key) time_key FROM rsl GROUP BY CODE ) b WHERE a. CODE = ...
- sql 查询大数据 常用 50列优化
大数据量的问题是很多面试笔试中经常出现的问题,比如baidu google 腾讯 这样的一些涉及到海量数据的公司经常会问到. 下面的方法是我对海量数据的处理方法进行了一个一般性的总结,当然这些方法可能 ...
- SQL查询遍历数据方法一 [ 临时表 + While循环]
以下以SQL Server 2000中的NorthWind数据库中的Customers表为例, 用 临时表 + While循环 的方法, 对Customers表中的CompanyName列进行遍历 c ...
随机推荐
- vue+elementUI当渲染文本超出一定字数时显示省略号
如图,当渲染的文字超出30字后显示省略号 1.设置过滤器 filters: { ellipsis(value) { if (!value) return ""; if (value ...
- pnpm 安装和使用
1. 简介 Fast, disk space efficient package manager: Fast. Up to 2x faster than the alternatives (see b ...
- 国产化浪潮下,Gitee DevOps 赋能企业数字化创新
在数字化浪潮汹涌的当下,企业竞争白热化,国产数字化创新成为企业突破发展瓶颈.提升核心竞争力的关键 "钥匙".Gitee DevOps 作为国产研发管理领域的佼佼者,凭借强大功能与优 ...
- 当我老丈人都安装上DeepSeek的时候,我就知道AI元年真的来了!
关注公众号回复1 获取一线.总监.高管<管理秘籍> 春节期间DeepSeek引爆了朋友圈,甚至连我老丈人都安装了APP,这与两年前OpenAI横空出世很不一样,DeepSeek似乎真的实现 ...
- Python脚本 | 提取pdf页面为jpg
功能: 提取pdf文件中的每一页,输出为jpg文件 以markdown语法写入文本文件 将该文本复制到剪贴板 # python 3.10 # ! 运行在 conda-myv虚拟环境 import fi ...
- composer 2 升级操作
update composer composer self-update // or sudo composer self-update 回滚到版本1 composer self-update --r ...
- [tldr] 配置windows terminal使用git bash
windows terminal默认使用power shell作为shell,但是power shell不好用,还是习惯linux的命令行行为. 参考Windows Terminal 配置 Git B ...
- Shell脚本实现服务器多台免密
简介 本脚本(auto_ssh_batch.sh)用于在多台主机之间快速配置SSH免密登录,并支持远程传输脚本/文件及执行命令.通过 pass 文件提供统一认证凭据,通过 nodes 文件定义目标主机 ...
- Docker Swarm 进阶:集群容错
- 网站支持https之一:https原理和SSL证书类型
1 https原理 https加密请求过程 Client和Server之间会进行一下几个步骤的交互: ① Client发送https请求: ② Client和Server通过tcp的三次握手建立连接, ...