Sql Server中的nvarchar(n)、varchar(n) 和Mysql中的char(n)、varchar(n)
刚才有幸看了下 nvarchar(n)和varchar(n),感觉以前的认知有误。
nvarchar(n):n指的是字符个数,范围是1-4000,存储的是可变长度的Unicode字符数据。
按字符存储,1个中文或者英文字符都占2个字节。
varchar(n):n指的是字节个数(其实这个地方用【字符】也行,1个字符占一个字节),范围是1-8000,存储的是可变长度的非Unicode字符数据。
按字节存储,1个中文或者英文字符都占1个字节。
实验例子:创建一个People2表,有字段UName,数据类型为varchar(2);字段Age,数据类型为nvarchar(2)。
1.测试varchar(2)
(1).Uname列里插入1个汉字或1个英文
结果:全部成功
(2).Uname列里插入2个汉字或2个英文
结果:2个英文的成功,2个汉字的失败
(2).Uname列里插入1个汉字和1个英文
结果:失败
总结:在varchar(2)中,2表示最大可以存两个字节,即能存1个汉字符号,或者2个英文符号。1个汉字符号占2个字节,1个英文符号占1个字节。
2.测试nvarchar(2)
(1).Age列里插入1个汉字或1个英文
结果:都成功
(2).Age列里插入2个汉字或2个英文
结果:都成功
(3).Age列里插入1个汉字和1个英文
结果:成功
(4).Age列里插入1个汉字和2个英文
结果:失败
总结:在nvarchar(2)中,2表示最大可以存两个字符,即能存2个汉字符号,或者2个英文符号。1个汉字符号占2个字节,1个英文符号占2个字节。
其他:varchar中也能存储汉字,但是,但是,但是遇到一些生僻汉字时有可能会乱码。
------------------------------------------------------------------Mysql中的char(n)和varchar(n)--------------------------------------------------------------
在Mysql中,存在着char和varchar两种字符串类型,并没有所谓的nvarchar。以下结论基于Mysql5.0版本以上:
为了做实验,先准备下三个不同字符集的数据表。
mysql> create table tb_latin (a_char char(2),b_varchar varchar(2)) default character set latin1;
Query OK, 0 rows affected (0.01 sec) mysql> show create table tb_latin;
+----------+-----------------------------------------------------------------------------------------------------------------------------------------+
| Table | Create Table |
+----------+-----------------------------------------------------------------------------------------------------------------------------------------+
| tb_latin | CREATE TABLE `tb_latin` (
`a_char` char(2) DEFAULT NULL,
`b_varchar` varchar(2) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=latin1 |
+----------+-----------------------------------------------------------------------------------------------------------------------------------------+
1 row in set (0.00 sec) mysql> create table tb_gbk (a_char char(2),b_varchar varchar(2)) default character set gbk;
Query OK, 0 rows affected (0.03 sec) mysql> show create table tb_gbk;
+--------+------------------------------------------------------------------------------------------------------------------------------------+
| Table | Create Table |
+--------+------------------------------------------------------------------------------------------------------------------------------------+
| tb_gbk | CREATE TABLE `tb_gbk` (
`a_char` char(2) DEFAULT NULL,
`b_varchar` varchar(2) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=gbk |
+--------+------------------------------------------------------------------------------------------------------------------------------------+
1 row in set (0.00 sec)
mysql> create table tb_utf8 (a_char char(2),b_varchar varchar(2)) default character set utf8 ;
Query OK, 0 rows affected (0.01 sec) mysql> show create table tb_utf8;
+---------+--------------------------------------------------------------------------------------------------------------------------------------+
| Table | Create Table |
+---------+--------------------------------------------------------------------------------------------------------------------------------------+
| tb_utf8 | CREATE TABLE `tb_utf8` (
`a_char` char(2) DEFAULT NULL,
`b_varchar` varchar(2) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8 |
+---------+--------------------------------------------------------------------------------------------------------------------------------------+
1 row in set (0.00 sec)
char(n)
1.往tb_latin表中插入数据。
mysql> insert into tb_latin (a_char) values ('z');
mysql> insert into tb_latin (a_char) values ('zz');
mysql> insert into tb_latin (a_char) values ('中'); #latin1字符集下不支持中文,所以报错。
ERROR 1366 (HY000): Incorrect string value: '\xE4\xB8\xAD' for column 'a_char' at row 1
查询出字符串的所占字节数(length),字符串长度(char_length)。
mysql> select a_char,length(a_char),CHAR_LENGTH(a_char) from tb_latin;
+--------+----------------+---------------------+
| a_char | length(a_char) | CHAR_LENGTH(a_char) |
+--------+----------------+---------------------+
| z | 1 | 1 |
| zz | 2 | 2 |
+--------+----------------+---------------------+
2 rows in set (0.00 sec)
结论:latin1字符集中,1个字符占一个字节。不支持中文字符。
2.往tb_gbk表中插入数据。
mysql> insert into tb_gbk (a_char) values ('zz');
Query OK, 1 row affected (0.00 sec) mysql> insert into tb_gbk (a_char) values ('中');
Query OK, 1 row affected (0.00 sec) mysql> insert into tb_gbk (a_char) values ('z中');
Query OK, 1 row affected (0.01 sec) mysql> insert into tb_gbk (a_char) values ('中中');
Query OK, 1 row affected (0.00 sec)
查询出字符串的所占字节数(length),字符串长度(char_length)。
mysql> select a_char,length(a_char),CHAR_LENGTH(a_char) from tb_gbk;
+--------+----------------+---------------------+
| a_char | length(a_char) | CHAR_LENGTH(a_char) |
+--------+----------------+---------------------+
| z | 1 | 1 |
| zz | 2 | 2 |
| 中 | 2 | 1 |
| z中 | 3 | 2 |
| 中中 | 4 | 2 |
+--------+----------------+---------------------+
结论:gbk字符集中,1个英文字符占一个字节,一个中文字符占两个字节。char(2),可以存2个英文占两个字节,2个中文占四个字节,1个英文和1个中文,占三个字节。
3.往tb_utf8表中插入数据。
mysql> insert into tb_utf8 (a_char) values ('z');
Query OK, 1 row affected (0.00 sec) mysql> insert into tb_utf8 (a_char) values ('zz');
Query OK, 1 row affected (0.00 sec) mysql> insert into tb_utf8 (a_char) values ('中');
Query OK, 1 row affected (0.01 sec) mysql> insert into tb_utf8 (a_char) values ('z中');
Query OK, 1 row affected (0.00 sec) mysql> insert into tb_utf8 (a_char) values ('中中');
Query OK, 1 row affected (0.01 sec)
查询出字符串的所占字节数(length),字符串长度(char_length)。
mysql> select a_char,length(a_char),CHAR_LENGTH(a_char) from tb_utf8;
+--------+----------------+---------------------+
| a_char | length(a_char) | CHAR_LENGTH(a_char) |
+--------+----------------+---------------------+
| z | 1 | 1 |
| zz | 2 | 2 |
| 中 | 3 | 1 |
| z中 | 4 | 2 |
| 中中 | 6 | 2 |
+--------+----------------+---------------------+
结论:utf8字符集中,1个英文字符占一个字节,一个中文字符占三个字节。char(2),可以存2个英文占两个字节,2个中文占六个字节,1个英文和1个中文,占四个字节。
4.char(n),n的最大值
n的最大值是255,而且跟字符集编码无关,进行验证。
mysql> alter table tb_latin add charmax1 char(255);
Query OK, 0 rows affected (0.06 sec)
Records: 0 Duplicates: 0 Warnings: 0 mysql> alter table tb_latin add charmax2 char(256);
ERROR 1074 (42000): Column length too big for column 'charmax2' (max = 255); use BLOB or TEXT instead
mysql>
mysql> alter table tb_gbk add charmax1 char(255);
Query OK, 0 rows affected (0.03 sec)
Records: 0 Duplicates: 0 Warnings: 0 mysql>
mysql> alter table tb_gbk add charmax2 char(256);
ERROR 1074 (42000): Column length too big for column 'charmax2' (max = 255); use BLOB or TEXT instead
mysql> alter table tb_utf8 add charmax1 char(255);
Query OK, 0 rows affected (0.03 sec)
Records: 0 Duplicates: 0 Warnings: 0 mysql>
mysql> alter table tb_utf8 add charmax2 char(256);
ERROR 1074 (42000): Column length too big for column 'charmax2' (max = 255); use BLOB or TEXT instead
结论:char类型的最大长度为255,这个最大值与字符集编码无关。
SET sql_mode = 'PAD_CHAR_TO_FULL_LENGTH';
注意:char中有很大的一个特性就是,char(2)中,当字符长度没有达到2个时,会用空格补全余下的字符,但是上述实验却体现不出来。原因是sql_mode没有开启PAD_CHAR_TO_FULL_LENGTH,默认情况下,尾部空格CHAR
在检索时从列值中删除 。如果 PAD_CHAR_TO_FULL_LENGTH
启用,则不会发生修剪,并将检索 CHAR
值填充到其全长。
mysql> SET sql_mode = 'PAD_CHAR_TO_FULL_LENGTH'; #设置sql_mode
Query OK, 0 rows affected (0.00 sec)
mysql> select a_char,length(a_char),CHAR_LENGTH(a_char) from tb_utf8;
+--------+----------------+---------------------+
| a_char | length(a_char) | CHAR_LENGTH(a_char) |
+--------+----------------+---------------------+
| z | 2 | 2 | #可以发现char的字符长度都是2了
| zz | 2 | 2 |
| 中 | 4 | 2 |
| z中 | 4 | 2 |
| 中中 | 6 | 2 |
+--------+----------------+---------------------+
varchar(n)
1.varchar中,字符串占用空间是实际字符长度占用的空间,长度不足n时,也不会用空格补全,在不同字符集中,汉字英文占用的长度和char中的一样。
2.但就是n的最大值问题,与字符集编码有关。
在latin字符集下,如果varchar的字段可以为空,则最大是65532,若不可以为空,最大值是65533.
mysql> create table test(name varchar(65532))engine=innodb DEFAULT CHARSET=latin1;
Query OK, 0 rows affected (0.02 sec) mysql> drop table if exists test;
Query OK, 0 rows affected (0.01 sec) mysql> create table test(name varchar(65533) not null)engine=innodb DEFAULT CHARSET=latin1;
Query OK, 0 rows affected (0.02 sec)
在gbk字符集下, varchar 最大是32766, 这次与是否为空没有关系.
mysql> create table test(name varchar(32766))engine=innodb DEFAULT CHARSET=gbk;
Query OK, 0 rows affected (0.02 sec) mysql> drop table if exists test;
Query OK, 0 rows affected (0.01 sec) mysql> create table test(name varchar(32766) not null)engine=innodb DEFAULT CHARSET=gbk;
Query OK, 0 rows affected (0.01 sec)
在utf8字符集下, varchar 最大是21844, 这次与是否为空没有关系.
mysql> create table test(name varchar(21844))engine=innodb DEFAULT CHARSET=utf8;
Query OK, 0 rows affected (0.05 sec) mysql> drop table if exists test;
Query OK, 0 rows affected (0.00 sec) mysql> create table test(name varchar(21844) not null)engine=innodb DEFAULT CHARSET=utf8;
Query OK, 0 rows affected (0.02 sec)
参考:1.https://dev.mysql.com/doc/refman/5.7/en/sql-mode.html#sqlmode_pad_char_to_full_length
2.mysql 编码和汉字存储占用字节问题的探索 3.关于mysql中的int(N)、char(N)和varchar(N)类型的简单说明
Sql Server中的nvarchar(n)、varchar(n) 和Mysql中的char(n)、varchar(n)的更多相关文章
- SQL Server 2008空间数据应用系列五:数据表中使用空间数据类型
原文:SQL Server 2008空间数据应用系列五:数据表中使用空间数据类型 友情提示,您阅读本篇博文的先决条件如下: 1.本文示例基于Microsoft SQL Server 2008 R2调测 ...
- Sql server cast(as nvarchar) 默认长度问题
Sql server 在我的SQL语句中:sql=".........cast(ziduan as nvarchar) ..............." 这样之后,ziduan被转 ...
- SQL Server 数据变更时间戳(timestamp)在复制中的运用
一.本文所涉及的内容(Contents) 本文所涉及的内容(Contents) 背景(Contexts) 方案(Solution) 方案一(Solution One) 方案二(Solution Two ...
- Step6:SQL Server 数据变更时间戳(timestamp)在复制中的运用
一.本文所涉及的内容(Contents) 本文所涉及的内容(Contents) 背景(Contexts) 方案(Solution) 方案一(Solution One) 方案二(Solution Two ...
- 《Pro SQL Server Internals, 2nd edition》的CHAPTER 3 Statistics中的Introduction to SQL Server Statistics、Statistics and Execution Plans、Statistics Maintenance(译)
<Pro SQL Server Internals> 作者: Dmitri Korotkevitch 出版社: Apress出版年: 2016-12-29页数: 804定价: USD 59 ...
- 如何进行数据库,比如ORACLE,SQL SERVER的逆向工程,将数据库导入到PowerDesigner中
Oracle的反向工程就是指将Oracle中的数据库,当然也可以是SQL Server中的数据库导入到PD中,这个需要建立一个数据库的链接,然后进行逆向工程的操作. 第一步:建立数据库的链接: Pow ...
- [SQL Server 视图的创建- (create view必须是批处理中仅有的语句问题)]
当我们SQL Server在创建视图时 ,会出现"create view 必须是批处理中仅有的语句"这个语法错误提示 ,实际上这本身没什么错! 因为create view 必须是批 ...
- SQL Server导入数据报错"无法在只读列“Id”中插入数据"
使用sql server 导入数据报错:无法在只读列'id'中插入数据.如下图所示: 查找出现该问题的原因是表中id为自动增长的标识列,需要在[编辑映射]中勾选"启用标识插入": ...
- MSSQL sql server 2005/2008 row_number()函数应用之–删除表中重复记录,只保留一条不重复数据
转自:http://www.maomao365.com/?p=4942 下文主要讲述:重复数据只获取一条的方法 row_number函数在数据库中的功能是为每一行 按照一定的规则生成一个编号,我们常常 ...
随机推荐
- SQL中常用系统函数
--1 CONVERT(数据类型,表达式),CAST( 表达式 AS 数据类型) 转变数据类型--将数字转化为字符串SELECT CONVERT(varchar(2),12)+CONVERT(varc ...
- C#-结构体(十)
结构体概念 在C#中,结构体是值类型,一般适用于表示类似Point.Rectangle.Color的对象 值类型能够降低对堆的管理.使用.降低垃圾回收,表现出更好的性能.可是值类型也有不好的一面.会涉 ...
- 关于JBoss -“Closing a connection for you,please close them yourself”
使用JNDI的方式从Jboss里获取数据连接(Connection)的方式,Jboss会管理connection,不需要自己手动去关闭,但Jboss老是提示需要自己来关闭connection,针对Jb ...
- windows7家庭版,专业版,旗舰版,企业版版本区别
Windows 7包含6个版本,分别为Windows 7 Starter(初级版).Windows 7 Home Basic(家庭普通版).Windows 7 Home Premium(家庭高级版). ...
- Xlua 不同平台链接库编译
xlua 下载包中提供lua5.3的库文件,如果需要luajit或者自己添加删除的就需要自己进行编译. Lua53版本没那么多事,主要是LuaJIt版本折腾的比较久. 工具 Xlua使用CMake进行 ...
- Unity Shader 基础(2) Image Effect
Unity中 Image Effect 是Post Processing的一种方,Unity自身也提供很多Effect效果供使用.Image Effect的使用官方文档做了很多介绍,这里重点Post ...
- C语言 文件的读写操作
//凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ #include<stdio.h> #include<stdlib.h> void ...
- Java strictfp
strictfp关键字 用于强制Java中的浮点计算(float或double)的精度符合IEEE 754标准. 不使用strictfp:浮点精度取决于目标平台的硬件,即CPU的浮点处理能力. 使用s ...
- 软工团队 - UML设计
软工团队 - UML设计 分工 对于分工我们没有不是按"自己负责部分的核心模块做练习"(每个人对每个图的某一模块来依次做完四个UML)的原因,是在于画这些图并不是都能彻底分成各个& ...
- python3编写网络爬虫16-使用selenium 爬取淘宝商品信息
一.使用selenium 模拟浏览器操作爬取淘宝商品信息 之前我们已经成功尝试分析Ajax来抓取相关数据,但是并不是所有页面都可以通过分析Ajax来完成抓取.比如,淘宝,它的整个页面数据确实也是通过A ...