本笔记整理自《SQL 基础教程》《MySQL 必知必会》和网上资料。个人笔记不保证正确。

一、基础

SQL,即结构化查询语言,是为访问与操作关系数据库中的数据而设计的语言。

  1. 关系数据库以行(row)为单位读写数据
  2. SQL 根据功能的不同,可分为三类(其中DML用得最多,增删查改嘛)
    1. DDL(Data Definition Language, 数据定义语言): CREATE/DROP/ALTER
    2. DML(Data Manipulation Language, 数据操作语言): SELECT/INSERT/UPDATE/DELETE
    3. DCL(Data Control Language, 数据控制语言): COMMIT/ROLLBACK/GRANT/REVOKE
  3. SQL 语句要以分号结尾。换行在 SQL 中不表示结束,而等同于空格。
  4. SQL 不区分关键字(Keyword)的大小写,但是描述符就不一定了。
    • 这里有个坑:MySQL 中,数据库和表其实就是数据目录下的目录和文件,因而,操作系统的敏感性决定数据库名和表名 是否大小写敏感。这就意味着数据库名表名在 Windows 中是大小写不敏感的,而在大多数类型的 Unix/Linux 系统中是大小写敏感的。(注意仅指数据库名和表名)可通过修改配置文件的lower_case_table_names属性来统一这一行为。
    • 字段名字段内容都是内部数据,是操作系统无关的。它们的大小写敏感性,由 MySQL 的的校对(COLLATE)规则来控制。该规则体现在 MySQL 的 校对字符集(COLLATION)的后缀上:比如 utf8字符集,utf8_general_ci表示不区分大小写,这个是 utf8 字符集默认的校对规则;utf8_general_cs 表示区分大小写,utf8_bin 表示二进制比较,同样也区分大小写 。
  5. SQL 中的字符串和日期需要用单引号引用起来,日期有特定格式年-月-日

修改字符集:set names <字符集名>

记住在 MySQL 中,utf-8mb4 才是完全的 utf-8字符集。

二、DDL

1. 数据库的创建和删除

  1. 创建数据库
CREATE DATABASE <数据库名称>;
DROP DATABASE <数据库名称>;

2. 创建表:

关系表的设计

关系表的设计,要确保把信息分解成多个表,一类信息一个表,各表通过某些常用的,基本不会改变的值(即关系表设计中的关系,也常称为外键)互相关联。尽量不要有冗余数据。

语句:

CREATE TABLE <表名>
(
<列名1> <数据类型> <该列所需约束>,
<列名2> <数据类型> <该列所需约束>,
<列名3> <数据类型> <该列所需约束>,
...
<该表的约束1>, <该表的约束2>...
);

举例:

CREATE TABLE `persons`
(
`id` INT UNSIGNED NOT NULL AUTO_INCREMENT,
`name` CHAR(20) NOT NULL,
PRIMARY KEY (`id`)
)ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

后面的是设置引擎和默认字符集。工作上,表的设计一定要深思熟虑,因为改起来很困难。

字段类型(MySQL)

有四类数据类型:字符串、数字、日期、二进制。它们又根据数据长度的区别,下分为多个类型。

  1. 字符串:

  2. 数字

  3. 日期

  4. 二进制

约束

SQL 约束是除了数据类型之外,对列中数据追加的限定条件。

  1. 类型约束:NOT NULLAUTO_INCREMENTUNSIGNED(这个只 MySQL 支持)
  2. 默认值:DEFAULT,举例 <列名3> VARCHAR(32) NOT NULL DEFAULT "los angeles"
  3. 表约束:PRIMARY KEY 主键约束(主键默认 UNIQUE 且 NOT NULL)

此外还有 FOREIGN KEYCHECK 两个约束语句,在进阶笔记中介绍。

P.S. 字段约束也可以写成表约束(比如主键约束),而反过来很可能不行。

3. 删除表和更新表定义

  1. 删除表(危险操作)

    • 删除整个表:
DROP TABLE <表名>;
- 只清空表内数据,但留下表:
TRUNCATE <表名>;  -- 非标准SQL语句,但是大部分DB都支持。(可能不能ROLLBACK)
  1. 更新表定义(麻烦的操作)

    所以所创建表前要仔细想好格式了,更新表定义是不得已才能为之。

    添加列定义:
ALTER TABLE <表名> ADD COLUMN <列名> <数据类型> <该列的约束>;

删除列定义:

ALTER TABLE <表名> DROP COLUMN <列名>;

三、DML

万恶之源 NULL

1. 查询(重点)

  1. 基本语句:
SELECT <字段1> AS <别名1>,
<字段2> AS <别名2>,
...
FROM <表名>
WHERE <过滤条件>;
  1. DISTINCT 修饰列名,使查询结果无重。例:SELECT DISTINCT <列名> FROM <表名>
  2. 过滤条件可使用比较运算(<>、=等)和逻辑运算(AND OR NOT).
  3. 过滤条件中,比较运算会永远忽略 NULL 值,如果需要对 NULL 值做操作,需要使用 IS NULLIS NOT NULL(说忽略也许不太准确,NULL 既不为真也不为假,反正少用NULL。。)
  4. 包含NULL的四则运算,得到的结果总为NULL

2. 聚合与排序(重点)

聚合函数

即对列进行统计分析的函数,主要有五个:

  1. COUNT:计算列的行数。(只有COUNT(*)会计算NULL行)
  2. SUM:求该列之和。
  3. AVG:求该列的平均值。
  4. MAX/MIN:求该列的 最大/最小 值

NOTE:

  1. 聚合函数计算时会排除所有NULL行。只有COUNT(*)例外,NULL行也会被它计数。
  2. MAX/MIN 几乎适用于所有数据类型的列(对非数值型,以其二进制值来排序),而SUM/AVG只能用于数值类型的列。
  3. 聚合函数操作的列,也能用DISTINCT修饰。例:SELECT COUNT(DISTINCT <列名>) FROM <表名>
  4. 聚合函数只能用于SELECT子句和还没讲的HAVING子句(以及 ORDER BY 子句)中。

分组(GROUP BY)

分组以聚合键为分类标准,将数据分为多个逻辑组,从而能分别对每个组进行聚合运算。(分组是为了分类聚合)

  1. 若出现了 GROUP BY 子句,查询结果一定是每一组一行。
  2. GROUP BY 会将 NULL 作为一组特定数据,显示为空。

聚合对SELECT子句的限制

首先要理解的是:

  1. 聚合函数的操作对象为某一列,而产生的结果只有一个值。
  2. GROUP BY 的操作对象为一列或者多列,产生的结果呢,是每一组一个值。

因此为了避免歧义,只要使用了聚合函数或 GROUP BY 二者之一,SELECT 子句就只能包含:

  1. 常数
  2. 其他聚合函数(该聚合函数的操作对象可以为其他列)
  3. 如果使用了 GROUP BY 子句,还能包括该子句所指定的列名。(也就是聚合键)但是绝不能包含其他的列名,因为这会有歧义。

此外,还有一个问题是由 SQL 的执行顺序引起的。应该能很容易猜到,SELECT 语句的执行顺序和书写顺序是不一致的

查询应该是从表开始,所以 FROM 语句一定先执行。然后应该要过滤(WHERE),再是分组(GROUP BY),最后才是 SELECT 语句。(就已经学到的子句而言,顺序是这样)

因此按理说,SELECT 语句 定义的别名,是不能在 GROUP BY 里使用的。(也有些DB支持该用法,但不通用)

对聚合结果进行过滤(HAVING)

从刚刚说过的SQL执行顺序可见,WHERE要比GROUP BY先执行,因此如果想过滤分组后的结果,不能用它。而应该使用 HAVING 子句。

HAVING 子句和 WHERE 子句都是用来过滤的,但是执行顺序的不同也就决定了它们的用途不同。

NOTE:

  1. 有时候,会发现某个过滤条件,不论是先执行(就是写在WHERE子句中)还是后执行(写在HAVING中)都没问题,这时候应该将它写在WHERE子句中,这样GROUP BY操作的数据会更少,处理更快。
  2. HAVING 子句的元素,也存在和 SELECT 子句同样的限制。不能使用聚合键以外的列名。

排序(ORDER BY)

ORDER BY 子句在 SELECT 子句之后执行,因此它能使用 SELECT 子句中定义的别名。(而 GROUP BY 之前已经说过不能用别名了)

格式:

SELECT <字段1> AS <别名1>,
<字段2> AS <别名2>,
...
FROM <表名>
WHERE <过滤条件1>
GROUP BY <列名1>, <列名2>...
HAVING <过滤条件2>
ORDER BY <列名/别名1>, <列名/别名2>... ;
  1. 多排序键/列:指定多排序键时的排序规则为:优先使用左侧的列,如果该列存在相同值,再接着参考右侧的键,依此类推。(如果左侧键值不同,右侧的键就不会被使用了)
  2. NULL 值的顺序:排序键中出现了 NULL 值时,这类值会在结果的开头或结尾汇总,究竟是排在开头还是结尾,并没有特殊规定。
  3. ORDER BY 子句只影响结果的先后顺序,因此排序键可以是结果集以外的东西,比如其他的列,或者使用了 GROUP BY 时,还能用聚合函数。

3. 数据的增、删、改

插入(INSERT INTO) 也算用的多了

语法:

INSERT INTO <表名>
(列名1, 列名2...)
VALUES (值1, 值2...);

或者也可以使用 SELECT 语句来替代 VALUES 子句,达到将 SELECT 到的结果集插入某表的效果。(但是不要用ORDER BY,因为结果是,没有顺序,排序是徒劳无功的)

插入时主键不能重复,否则会报错。(因此如果需要包含重复数据,一般都会定义一个自增的id字段)

删除(DELETE)

清空表(危险操作,而且效率不如 TRUNCATE):

DELETE FROM <表名>;

条件删除:

DELETE FROM <表名>
WHERE <条件>;

因此使用DELETE时,一定要记得带WHERE,不然就好玩了。。

更新(UPDATE)

UPDATE <表名>
SET <列名1> = <算术表达式1>,
<列名2> = <表达式2>,
...
WHERE <条件>;

同 DELETE 一样,不带 WHERE 子句的 UPDATE 是很危险的。

四、DCL - 事务处理(MySQL)

事务是一系列不可分割的数据库操作,也就是说,这一系列操作要么全部执行,要么全部不执行。如果执行过程中发生了问题(检查执行状态),可以通过执行 ROLLBACK 回滚到该事务执行前的状态。(注意并不会自动回滚

START TRANSACTION;
-- do somthing
COMMIT;
  • START TRANSACTION: 标识事务的开始
  • COMMIT:提交事务。一旦提交,所执行过的操作就已成定论,恢复不了了。
  • ROLLBACK:事务回滚,只能回滚未 COMMIT 的 DML 操作!也就是说只能用在 START TRANSACTIONCOMMIT 之间,并且只能回滚 INSERT/UPDATE/DELETE。(回滚 SELECT 没啥意义)
  • SAVEPOINT <保留点>ROLLBACK TO <保留点>:同样只能用在 START TRANSACTIONCOMMIT 之间,其优势在于,ROLLBACK TO 可以指定回滚到某特定保留点,更灵活,而 ROLLBACK 只能回滚到事务开始前。

需要注意的有:

  1. COMMITROLLBACK 语句也是事务的结束,因此如果执行了 ROLLBACK,那它与 COMMIT 之间的内容会被跳过。(在这一点上,它相当于大多数 PL 的 return)
  2. 如果事务执行出现问题,问题行后面的所有语句都不会被执行!包括 COMMITROLLBACK 如果想用纯 SQL 实现事务原子性,必须使用存储过程检查执行状态!举例如下:
CREATE PROCEDURE my_test()
BEGIN
DECLARE EXIT HANDLER FOR SQLEXCEPTION ROLLBACK -- 检测到 SQLEXCEPTION 则 rollback,然后 exit
START TRANSACTION
INSERT INTO table_test VALUES(1, 'A')
INSERT INTO table_test VALUES(1, 'B') -- 这里主键冲突,会触发 SQLEXCEPTION COMMIT
END CALL my_test()

或者在 PL 中通过异常处理执行 ROLLBACK。(事务虽然中止了,但并未结束!所以仍然可以 ROLLBACK 或者 COMMIT

数据何时被提交到数据库

  1. 显式提交:在事务中使用 COMMIT 提交数据操作被称为显式提交
  2. 隐式提交:非 DML 操作会被立即提交,也就是说这些语句本身就隐含了提交语义
  3. 自动提交: 如果 AUTOCOMMIT 被设置为 ON,当前 session 中的 DML 语句会在执行后被自动提交(START TRANSACTION 内部的 DML 除外,在它内部必须显式 COMMIT

所有的 DML 语句都是要显式提交的,MySQL session 的 AUTOCOMMIT 默认为 ON,所以 DML 会被自动提交。

P.S. 许多语言的数据库 API 会定义自己的事务操作,不一定与这里一致。

SQL 基础笔记(一)的更多相关文章

  1. SQL 基础笔记(二):进阶查询

    本笔记整理自<SQL 基础教程>.<MySQL 必知必会>和网上资料.个人笔记不保证正确. 一.复杂查询 视图 将 SELECT 查询包装成一个虚拟表,该虚拟表就被称为视图.( ...

  2. SQL基础笔记

    Codecademy中Learn SQL, SQL: Table Transformaton和SQL: Analyzing Business Metrics三门课程的笔记,以及补充的附加笔记. Cod ...

  3. SQL 基础笔记(三):约束

    个人笔记不保证正确. 数据类型是限制我们可以在表里存储什么数据的一种方法.不过,对于许多应用来说, 这种限制实在是太粗糙了.比如,一个包含产品价格的字段应该只接受正数. 但是没有哪种标准数据类型只接受 ...

  4. sql基础笔记备忘

    MySQL中定义数据字段的类型对你数据库的优化是非常重要的. MySQL支持多种类型,大致可以分为三类:数值.日期/时间和字符串(字符)类型. 数值类型:tinyint smallint medium ...

  5. MYSQL基础笔记(二)-SQL基本操作

    SQL基本操作 基本操作:CRUD,增删改查 将SQL的基本操作根据操作对象进行分类: 1.库操作 2.表操作 3.数据操作 库操作: 对数据库的增删改查 新增数据库: 基本语法: Create da ...

  6. C#面试题(转载) SQL Server 数据库基础笔记分享(下) SQL Server 数据库基础笔记分享(上) Asp.Net MVC4中的全局过滤器 C#语法——泛型的多种应用

    C#面试题(转载) 原文地址:100道C#面试题(.net开发人员必备)  https://blog.csdn.net/u013519551/article/details/51220841 1. . ...

  7. 《SQL基础教程》+ 《SQL进阶教程》 学习笔记

    写在前面:本文主要注重 SQL 的理论.主流覆盖的功能范围及其基本语法/用法.至于详细的 SQL 语法/用法,因为每家 DBMS 都有些许不同,我会在以后专门介绍某款DBMS(例如 PostgreSQ ...

  8. php代码审计基础笔记

    出处: 九零SEC连接:http://forum.90sec.org/forum.php?mod=viewthread&tid=8059 --------------------------- ...

  9. MYSQL基础笔记(六)- 数据类型一

    数据类型(列类型) 所谓数据烈性,就是对数据进行统一的分类.从系统角度出发时为了能够使用统一的方式进行管理,更好的利用有限的空间. SQL中讲数据类型分成三大类:1.数值类型,2.字符串类型和时间日期 ...

随机推荐

  1. 关于VMware给系统分区扩容的一点经验

    我的VMware版本是8.0.6 build-1035888,里面安装的是Windows XP SP3 首先,在VM关机状态下使用Hard disk设置中的Utilities下的Expand给整个磁盘 ...

  2. hadoop中使用的Unsafe.java

    今天查看hadoop源代码, 发现有个Unsafe.java 稍微总结下 优势 1 减少线程调度开销, Unsafe.java 通过采用非堵塞原子方式来减少线程调度开销        2 传统线程通信 ...

  3. 第27章 LTDC/DMA2D—液晶显示—零死角玩转STM32-F429系列

    第27章     LTDC/DMA2D—液晶显示 全套200集视频教程和1000页PDF教程请到秉火论坛下载:www.firebbs.cn 野火视频教程优酷观看网址:http://i.youku.co ...

  4. Xcode 中 pch 文件配置 - iOS

    一.简介 首先 pch 文件(即:Prefix Header)是一种预编译文件,在 Xcode 6 之前创建新的工程则会自动将该文件一起创建出来,但在 Xcode 6 之后苹果官方则默认将自动创建的方 ...

  5. 打包时ElementUI使vendor.js文件体量过大优化方法

    <h1> 1.在index.html中以CDN的方式引入 </h1> <p> 引入的时候注意:要先在引入之前引入VUE否则会报undedined prototype ...

  6. ref是什么?

    ref是组件的特殊属性,组件被渲染后,指向组件的一个引用.可以通过组件的ref属性,来获取真实的组件. 因为,组件并不是真正的DOM节点,而是存在于内存中的一种数据结构,称为虚拟的DOM,只有当它真正 ...

  7. JS常用数组方法及实例

    1.join(separator):将数组的元素组起一个字符串,以separator为分隔符 ,,,,]; var b = a.join("|"); //如果不用分隔符,默认逗号隔 ...

  8. python入门基本知识

    1. 什么是语言 语言是一个事物与另外一个事物沟通的介质. python则是人(程序员)与计算机沟通的介质. 2. 什么是编程 编程就是程序员将自己想要让计算机做的事情用编程语言翻译出来写到一系列的文 ...

  9. DNS域名解析服务(bind)

    DNS(Domain Name System,域名系统): 用于管理和解析域名与IP地址对应关系的技术. 简单来说,就是能够接受用户输入的域名或IP地址,然后自动查找与之匹配(或者说具有映射关系)的I ...

  10. SSM框架的简单搭建

    转:https://blog.csdn.net/zhshulin/article/details/37956105 Spring+SpringMVC+MyBatis spring       : 4. ...