SQLServer的varchar与nvarchar的学习之二
SQLServer的varchar与nvarchar的学习之二
背景
昨天简单总结了多种数据库 varchar和nvarchar的区别与关系
今天想着能够分析一下数据库文件.
计划使用winhex 查看数据文件, 简单进行学习
过程
创建数据库和表,然后进行一些测试, 进行简单测试判断.
create database zhaobsh
create table zhaobsh (zhaobshvarchar varchar(30),zhaobshnvarchar nvarchar(30))
insert into zhaobsh values ('123abc','123abc')
insert into zhaobsh values ('abcd赵1234','abcd赵1234')
insert into zhaobsh values ('abcde한국12345','abcde한국12345')
insert into zhaobsh values ('abcde한국12345',N'abcde한국12345')
查询分析器的结果
| zhaobsh_varchar | zhaobsh_nvarchar |
|---|---|
| 赵XX测试三十个字符的情况 | 赵XX测试三十个字符的情况赵本帅赵XX |
| 123abc | 123abc |
| abcd赵XX1234 | abcd赵XX1234 |
| abcde??12345 | abcde??12345 |
| abcde??12345 | abcde한국12345 |
简单分析
nvarchar是字符数. 可以保存字符的个数
varchar是字节数, 汉字的话因为是GBK编码可能要除以2
chinese_prc的排序规则下 韩文是乱码显示.
使用 N开头存储到 nvarchar里面可以正常显示韩文.
但是需要SQL单独修改一下.
打开winhex进行查看
先分离数据库,然后复制数据库的数据文件出来.
使用winhex打开数据文件
第一部分 数字和英文:
Offset 0 1 2 3 4 5 6 7 8 9 A B C D E F
0011C0B0 31 32 12
0011C0C0 33 61 62 63 31 00 32 00 33 00 61 00 62 00 63 3abc1 2 3 a b c
可以明显看到
varchar的 数字和英文字符, 都是一个字符使用一个字节进行保存.
nvarchar 使用的是两个字符进行保存,方式是后面补零.
并且可以看到字段的两个数据时仅仅仅挨着的.
地区看到 nvarchar 在存储ASCII字符时至少会浪费一倍的存储空间.
中文部分
Offset 0 1 2 3 4 5 6 7 8 9 A B C D E F
0011C0D0 31 00 61 62 63 1 abc
0011C0E0 64 D5 D4 XX XX XX XX 31 32 33 34 61 00 62 00 63 d赵XX1234a b c
0011C0F0 00 64 00 75 8D 2C 67 05 5E 31 00 32 00 33 00 34 d u ,g ^1 2 3 4
可以看到 :
varchar: D5 D4 XX XX XX XX 六个字节表示了 三个汉字.
nvarchar: 75 8D XX XX XX XX 应该也是六个字节表示了三个汉字.
通过百度发现 赵的 GBK编码其实是 D5D4, 明显 varchar使用GBK进行了存储.
另外发现 赵的 unicode编码是 8D75 也就是 nvarchar的字符存储方式.
所以明显可以看到, varchar 使用了 我这个数据库 Chinese_prc_ci_as的默认字符存储方式
但是当时使用nvarchar时 使用的就是 unicode的编码存储格式.
韩文部分
Offset 0 1 2 3 4 5 6 7 8 9 A B C D E F
0011C100 61 62 ab
0011C110 63 64 65 3F 3F 31 32 33 34 35 61 00 62 00 63 00 cde??12345a b c
0011C120 64 00 65 00 3F 00 3F 00 31 00 32 00 33 00 34 00 d e ? ? 1 2 3 4
0011C130 35 00 30 00 04 00 02 00 00 02 00 19 00 31 00 61 5 0 1 a
0011C140 62 63 64 65 3F 3F 31 32 33 34 35 61 00 62 00 63 bcde??12345a b c
0011C150 00 64 00 65 00 5C D5 6D AD 31 00 32 00 33 00 34 d e \誱? 2 3 4
0011C160 00 35 5
因为我想写的是韩文
只有N 开头的字段保存正常:
한국 的UNICDE 码为: D55C AD6D
可以看到数据库里面存储的也是: 5CD5 6DAD
比较符合预期.
也说明 nvarchar里面存的是 unicode 的字符 而不是utf-8的编码格式.
SQLServer数据库这一块的设置还是比较有意思的.
SQLServer的varchar与nvarchar的学习之二的更多相关文章
- 答:SQLServer DBA 三十问之一: char、varchar、nvarchar之间的区别(包括用途和空间占用);xml类型查找某个节点的数据有哪些方法,哪个效率高;使用存储 过程和使用T-SQL查询数据有啥不一样;
http://www.cnblogs.com/fygh/archive/2011/10/18/2216166.html 1. char.varchar.nvarchar之间的区别(包括用途和空间占用) ...
- sqlserver varchar和Nvarchar区别
sql server中的varchar和Nvarchar有什么区别? 答:varchar(n)长度为 n 个字节的可变长度且非 Unicode 的字符数据.n 必须是一个介于 1 和 8,000 ...
- sql-char和varchar,nvarchar的区别
数据类型的比较 char表示的是固定长度,最长n个字 varchar表示的是实际长度的数据类型 比如:如果是char类型,当你输入字符小于长度时,后补空格:而是varchar类型时,则表示你输入字符的 ...
- sql server varchar和nvarchar的区别
一.前言 在了解varchar 和nvarchar之前咱们先了解一下这些词的字面和常用意思,以方便我们更好的使用: SQL SERVER中生成的语句中,字符串前加N.N 前缀必须是大写字母.是Unic ...
- SQL中varchar和nvarchar的基本介绍及其区别
SQL中varchar和nvarchar的基本介绍及其区别 varchar(n) 长度为 n 个字节的可变长度且非 Unicode 的字符数据.n 必须是一个介于 1 和 8,000 之间的数值.存储 ...
- 数据库char varchar nchar nvarchar,编码Unicode,UTF8,GBK等,Sql语句中文前为什么加N(一次线上数据存储乱码排查)
背景 公司有一个数据处理线,上面的数据经过不同环境处理,然后上线到正式库.其中一个环节需要将数据进行处理然后导入到另外一个库(Sql Server).这个处理的程序是老大用python写的,处理完后进 ...
- sql中NVARCHAR(MAX) 性能和占空间分析 varchar(n),nvarchar(n) 长度性能及所占空间分析
varchar(n),nvarchar(n) 中的n怎么解释: nvarchar(n)最多能存n个字符,不区分中英文. varchar(n)最多能存n个字节,一个中文是两个字节. 所占空间: nvar ...
- varchar(n),nvarchar(n) 长度、性能、及所占空间的说明
varchar(n),nvarchar(n) 中的n怎么解释: nvarchar(n)最多能存n个字符,不区分中英文. varchar(n)最多能存n个字节,一个中文是两个字节. 所占空间: nvar ...
- varchar和Nvarchar区别
http://www.cnblogs.com/yelaiju/archive/2010/05/29/1746826.html Unicode字符集就是为了解决字符集这种不兼容的问题而产生的,它所有的字 ...
- [转]varchar(n),nvarchar(n) 长度、性能、及所占空间分析
varchar(n),nvarchar(n) 中的n怎么解释: nvarchar(n)最多能存n个字符,不区分中英文. varchar(n)最多能存n个字节,一个中文是两个字节. 所占空间: nvar ...
随机推荐
- 从零玩转xxl-job分布式任务调度-xxl-job
title: 从零玩转xxl-job分布式任务调度 date: 2022-03-18 00:11:55.443 updated: 2023-01-05 10:58:06.991 url: https: ...
- 解密Prompt系列22. LLM Agent之RAG的反思:放弃了压缩还是智能么?
已经唠了三章的RAG,是时候回头反思一下,当前的RAG是解决幻觉的终点么?我给不出直接的答案,不过感觉当前把RAG当作传统搜索框架在大模型时代下的改良,这个思路的天花板高度有限~ 反思来源于对RAG下 ...
- vulnhub - lazySysAdmin - writeup
信息收集 可以看到目标开放了常见的22, 80, 139, 445, 3306这个6667的服务少见. root@kali tmp/lazySysAdmin » arp-scan -I eth1 -l ...
- GaussDB(for Redis)游戏实践:玩家下线行为上报
本文分享自华为云社区<GaussDB(for Redis) 游戏实践:玩家下线行为上报>,作者:GaussDB 数据库 为保护未成年人的身心健康,2007年国家推出网络游戏防沉迷系统,对未 ...
- 云原生批量计算引擎 Volcano社区v1.8.0版本正式发布
本文分享自华为云社区<云原生批量计算引擎 Volcano社区v1.8.0版本正式发布>,作者: 云容器大未来. 北京时间2023年8月17日,Volcano 社区 v1.8.0 版本正式发 ...
- 技术解读丨分布式缓存数据库Redis大KEY问题定位及优化建议
摘要:如何定位分布式缓存数据库Redis大KEY问题,实操案例带你掌握优化方法. [背景] 访问Redis 5.0 cluster集群出现OOM报错,报错信息为(error) OOM command ...
- IIS 设置超时时间
高级设置 => 限制 => 连接超时(秒),默认120秒,根据实际情况调整
- PLS-00103: 出现符号 ")"在需要下列之一时
执行 Oracle 存储过程时,出现 "PLS-00103: 出现符号 ")"在需要下列之一时:", Cause: java.sql.SQLException: ...
- 标注BIO-精灵标注助手
目录 准备待标注数据 将待标数据生成文件 数据标注 下载标注软件 创建项目 标注数据 导出数据 ANN 转 BIO 推荐使用 Label Studio 准备待标注数据 创建 raw_data.txt ...
- POJ: 2236 Wireless Network 题解
POJ 2236 Wireless Network 加工并储存数据的数据结构 并查集 这是并查集的基本应用,两台修好的电脑若距离d内则加入合并.不过不小心的话会TLE,比如: #include < ...