SQLServer的varchar与nvarchar的学习之二
SQLServer的varchar与nvarchar的学习之二
背景
昨天简单总结了多种数据库 varchar和nvarchar的区别与关系
今天想着能够分析一下数据库文件.
计划使用winhex 查看数据文件, 简单进行学习
过程
创建数据库和表,然后进行一些测试, 进行简单测试判断.
create database zhaobsh
create table zhaobsh (zhaobshvarchar varchar(30),zhaobshnvarchar nvarchar(30))
insert into zhaobsh values ('123abc','123abc')
insert into zhaobsh values ('abcd赵1234','abcd赵1234')
insert into zhaobsh values ('abcde한국12345','abcde한국12345')
insert into zhaobsh values ('abcde한국12345',N'abcde한국12345')
查询分析器的结果
| zhaobsh_varchar | zhaobsh_nvarchar |
|---|---|
| 赵XX测试三十个字符的情况 | 赵XX测试三十个字符的情况赵本帅赵XX |
| 123abc | 123abc |
| abcd赵XX1234 | abcd赵XX1234 |
| abcde??12345 | abcde??12345 |
| abcde??12345 | abcde한국12345 |
简单分析
nvarchar是字符数. 可以保存字符的个数
varchar是字节数, 汉字的话因为是GBK编码可能要除以2
chinese_prc的排序规则下 韩文是乱码显示.
使用 N开头存储到 nvarchar里面可以正常显示韩文.
但是需要SQL单独修改一下.
打开winhex进行查看
先分离数据库,然后复制数据库的数据文件出来.
使用winhex打开数据文件
第一部分 数字和英文:
Offset 0 1 2 3 4 5 6 7 8 9 A B C D E F
0011C0B0 31 32 12
0011C0C0 33 61 62 63 31 00 32 00 33 00 61 00 62 00 63 3abc1 2 3 a b c
可以明显看到
varchar的 数字和英文字符, 都是一个字符使用一个字节进行保存.
nvarchar 使用的是两个字符进行保存,方式是后面补零.
并且可以看到字段的两个数据时仅仅仅挨着的.
地区看到 nvarchar 在存储ASCII字符时至少会浪费一倍的存储空间.
中文部分
Offset 0 1 2 3 4 5 6 7 8 9 A B C D E F
0011C0D0 31 00 61 62 63 1 abc
0011C0E0 64 D5 D4 XX XX XX XX 31 32 33 34 61 00 62 00 63 d赵XX1234a b c
0011C0F0 00 64 00 75 8D 2C 67 05 5E 31 00 32 00 33 00 34 d u ,g ^1 2 3 4
可以看到 :
varchar: D5 D4 XX XX XX XX 六个字节表示了 三个汉字.
nvarchar: 75 8D XX XX XX XX 应该也是六个字节表示了三个汉字.
通过百度发现 赵的 GBK编码其实是 D5D4, 明显 varchar使用GBK进行了存储.
另外发现 赵的 unicode编码是 8D75 也就是 nvarchar的字符存储方式.
所以明显可以看到, varchar 使用了 我这个数据库 Chinese_prc_ci_as的默认字符存储方式
但是当时使用nvarchar时 使用的就是 unicode的编码存储格式.
韩文部分
Offset 0 1 2 3 4 5 6 7 8 9 A B C D E F
0011C100 61 62 ab
0011C110 63 64 65 3F 3F 31 32 33 34 35 61 00 62 00 63 00 cde??12345a b c
0011C120 64 00 65 00 3F 00 3F 00 31 00 32 00 33 00 34 00 d e ? ? 1 2 3 4
0011C130 35 00 30 00 04 00 02 00 00 02 00 19 00 31 00 61 5 0 1 a
0011C140 62 63 64 65 3F 3F 31 32 33 34 35 61 00 62 00 63 bcde??12345a b c
0011C150 00 64 00 65 00 5C D5 6D AD 31 00 32 00 33 00 34 d e \誱? 2 3 4
0011C160 00 35 5
因为我想写的是韩文
只有N 开头的字段保存正常:
한국 的UNICDE 码为: D55C AD6D
可以看到数据库里面存储的也是: 5CD5 6DAD
比较符合预期.
也说明 nvarchar里面存的是 unicode 的字符 而不是utf-8的编码格式.
SQLServer数据库这一块的设置还是比较有意思的.
SQLServer的varchar与nvarchar的学习之二的更多相关文章
- 答:SQLServer DBA 三十问之一: char、varchar、nvarchar之间的区别(包括用途和空间占用);xml类型查找某个节点的数据有哪些方法,哪个效率高;使用存储 过程和使用T-SQL查询数据有啥不一样;
http://www.cnblogs.com/fygh/archive/2011/10/18/2216166.html 1. char.varchar.nvarchar之间的区别(包括用途和空间占用) ...
- sqlserver varchar和Nvarchar区别
sql server中的varchar和Nvarchar有什么区别? 答:varchar(n)长度为 n 个字节的可变长度且非 Unicode 的字符数据.n 必须是一个介于 1 和 8,000 ...
- sql-char和varchar,nvarchar的区别
数据类型的比较 char表示的是固定长度,最长n个字 varchar表示的是实际长度的数据类型 比如:如果是char类型,当你输入字符小于长度时,后补空格:而是varchar类型时,则表示你输入字符的 ...
- sql server varchar和nvarchar的区别
一.前言 在了解varchar 和nvarchar之前咱们先了解一下这些词的字面和常用意思,以方便我们更好的使用: SQL SERVER中生成的语句中,字符串前加N.N 前缀必须是大写字母.是Unic ...
- SQL中varchar和nvarchar的基本介绍及其区别
SQL中varchar和nvarchar的基本介绍及其区别 varchar(n) 长度为 n 个字节的可变长度且非 Unicode 的字符数据.n 必须是一个介于 1 和 8,000 之间的数值.存储 ...
- 数据库char varchar nchar nvarchar,编码Unicode,UTF8,GBK等,Sql语句中文前为什么加N(一次线上数据存储乱码排查)
背景 公司有一个数据处理线,上面的数据经过不同环境处理,然后上线到正式库.其中一个环节需要将数据进行处理然后导入到另外一个库(Sql Server).这个处理的程序是老大用python写的,处理完后进 ...
- sql中NVARCHAR(MAX) 性能和占空间分析 varchar(n),nvarchar(n) 长度性能及所占空间分析
varchar(n),nvarchar(n) 中的n怎么解释: nvarchar(n)最多能存n个字符,不区分中英文. varchar(n)最多能存n个字节,一个中文是两个字节. 所占空间: nvar ...
- varchar(n),nvarchar(n) 长度、性能、及所占空间的说明
varchar(n),nvarchar(n) 中的n怎么解释: nvarchar(n)最多能存n个字符,不区分中英文. varchar(n)最多能存n个字节,一个中文是两个字节. 所占空间: nvar ...
- varchar和Nvarchar区别
http://www.cnblogs.com/yelaiju/archive/2010/05/29/1746826.html Unicode字符集就是为了解决字符集这种不兼容的问题而产生的,它所有的字 ...
- [转]varchar(n),nvarchar(n) 长度、性能、及所占空间分析
varchar(n),nvarchar(n) 中的n怎么解释: nvarchar(n)最多能存n个字符,不区分中英文. varchar(n)最多能存n个字节,一个中文是两个字节. 所占空间: nvar ...
随机推荐
- 聊聊ChatGLM-6B部署与微调的深入理解
ChatGLM的部署,主要是两个步骤: 在Github上下载chatglm的库文件 在Hugging Face上下载模型参数与配置文件 ChatGLM包 从Github上看ChatGLM项目文件的结构 ...
- 从传统行业到半导体行业开发(YMS,DMS,EAP,EDA)
一线开发人: 今天半导体YMS 项目快要收尾了,我的心情有点高兴,多年来我一直保持着写作的习惯,总是想写一些什么,今天但是又不知道从何说起.自己从传统的行业转向左半导体行业开发.从电*机如软件开发到电 ...
- 一文带你了解EiPaaS和EiPaaS的国际趋势
摘要:EiPaaS (Enterprise Integration Platform as a Service) 是企业级的集成平台和服务. 本文分享自华为云社区<初识EiPaaS和EiPaaS ...
- GaussDB拿下的安全认证CC EAL4+究竟有多难?
摘要:近日,经过全球知名独立认证机构SGS Brightsight实验室的安全评估,华为云GaussDB企业级分布式数据库内核获得全球权威信息技术安全性评估标准CC EAL4+级别认证 本文分享自华为 ...
- ISO/IEC 5055:软件代码质量的标尺
摘要:ISO 5055是首个直接从软件内部结构方面衡量软件质量(如安全性和可靠性)的ISO标准.该标准基于统计安全性.可靠性.可维护性和性能效率方面的软件缺陷来衡量软件的结构质量. 本文分享自华为云社 ...
- iOS App Store上架流程详解
很多开发者在开发完iOS APP.进行内测后,下一步就面临上架App Store,不过也有很多同学对APP上架App Store的流程不太了解,下面我们来说一下iOS APP上架App Store ...
- 提供免费 TPU 的 ControlNet 微调活动来啦
相信大家已经感受到 AI 绘画的魅力,多多少少也可以自称半个「prompt 小专家」了,而在 AI 绘画的时候 Stable Diffusion 也会出现一些小瑕疵,比如 AI 不是灵魂画「手」,还有 ...
- 用ChatGPT,入门机器学习,太强了
入门机器学习,对大部分人来说很简单,一本书.一份课件.一套视频足矣,但是我大胆猜测很多人大概率都没有完整看完过. 所以前些天在朋友圈抱怨了一波: 我感觉所谓牛人,大佬,刨除背景机遇,其成长路上可能也仅 ...
- IntelliJ IDEA 2024年最新下载、安装使用教程、亲测可用
本文讲的是2023.3最新版本IntelliJ IDEA破解.IntelliJ IDEA激活码.IntelliJ IDEA安装.IntelliJ IDEA永久激活码的最新永久激活教程,本文有mac和w ...
- ABAP使用异步远程RFC实现并行处理
1.使用场景 当开发复杂报表,需要处理大量数据,不管怎么优化计算和查询语句,程序的运行效率还是达不到用户要求,怎么办? 为了解决这个问题,就需要程序实现并行处理. 本文档就是通过异步调用远程RFC的办 ...