分类: oracle 2012-10-29 17:31 425人阅读 评论(0) 收藏 举报

Oracle字符集引起的几个问题,常见的就是汉字占多少个字节,其次就是字符集导致数据库启动失败以及索引失效等问题

汉字占多少个字节?

select length('ABCDE中文字符串FG'),lengthb('ABCDE中文字符串FG') from dual;

就可以知道,一个汉字占了几个字节,也可以查看数据库的字符集

select * from nls_database_parameters where parameter ='NLS_CHARACTERSET';

当NLS_CHARACTERSET=AL32UTF8时(UTF-8是变长编码,每个Unicode代码点按照不同范围,可以有1-3字节的不同长度)
NLS_LENGTH_SEMANTICS=BYTE时,一个汉字代表三个字节
NLS_LENGTH_SEMANTICS=CHAR时,一个汉字代表一个字节
当NLS_CHARACTERSET=US7ASCII时(字符集为单字节)
NLS_LENGTH_SEMANTICS=BYTE时,一个汉字代表两个字节
NLS_LENGTH_SEMANTICS=CHAR时,一个汉字代表两个字节

Oracle与汉字问题相关的函数

注意:计算长度的几个方法区别如下:

LENGTH(string1) 返回以字符为单位的长度.
LENGTHB(string1) 返回以字节为单位的长度.
LENGTHC(string1) 返回以Unicode完全字符为单位的长度.
LENGTH2(string1) 返回以UCS2代码点为单位的长度.
LENGTH4(string1) 返回以UCS4代码点为单位的长度.

substr,substrb均为字符串截取函数,都带有三个参数,第一个参数为所要截取的字符串,第二个参数为strart(索引均从1开始),第三个参数为length。
substr是按照字来算的,而substrb()是按照字节来算的

关于substr,substrb的例子举例:

SQL> select substr('今天是个好日子',3,5) from dual;
----------
是个好日子
SQL> select substrb('今天是个好日子',3,5) from dual;
-----
天是
结论是substr是按照字来算的,而substrb()是按照字节来算的。看下面的例子:
SQL> select substr('abcdef',3,4) from dual;
----
cdef
SQL> select substrb('abcdef',3,4) from dual;
----
cdef
分析:对于字母来说,substr与substrb作用时一样的,但对于汉字来说,substr是按字来取值,而substrb是按字节来取值,当所取长度为奇数时,则自动舍弃最后一位字节。
类似的还有,
length与lengthb 长度计算函数 
select length('你好') from dual         ----output:2
select lengthb('你好') from dual       ----output :4

Instr与Instrb 字符串查找函数 instr(原字符串,查的字符串,起始位置,第几个匹配) 返回字符串位置,找不到返回0 .
select instr('日日花前长病酒','花前',1,1) from dual     ----output:3
select instrb('日日花前长病酒','花前',1,1) from dual     ----output:7

 Oracle字符集

安装数据库的时候可以设置字符集,不同版本可能默认的字符集是不一样的(以Oracle 9i为例子)

首先查看字符集:(注意:修改数据库字符集时必须谨慎,修改之前一定要为数据库备份。由于不能回退这项操作,因此可能会造成数据丢失或者损坏)

SQL> select name,value$ from props$ where name like '%NLS%';

NAME                           VALUE$
------------------------------ ------------------------------
NLS_LANGUAGE AMERICAN
NLS_TERRITORY AMERICA
NLS_CURRENCY $
NLS_ISO_CURRENCY AMERICA
NLS_NUMERIC_CHARACTERS .,
NLS_CHARACTERSET US7ASCII
NLS_CALENDAR GREGORIAN
NLS_DATE_FORMAT DD-MON-RR
NLS_DATE_LANGUAGE AMERICAN
……………….
NLS_NCHAR_CHARACTERSET AL16UTF16
NLS_RDBMS_VERSION 9.2.0.4.0 20 rows selected.
SQL> select name,dump(name) from eygle.test; NAME DUMP(NAME)
------------------------------------------------------
测试 Typ=1 Len=4: 178,226,202,212
Test Typ=1 Len=4: 116,101,115,116 2 rows selected.

转换字符集,你只能在新字符集是旧字符集严格超集的情况下使用这种方式转换。所谓超集是指:当前字符集中的每一个字符在新字符集中都可以表示,并使用同样的代码点比如很多字符集都是US7ASCII的严格超集.

如果不是超集,将获得以下错误:

  1. SQL> ALTER DATABASE CHARACTER SET  ZHS16CGB231280;
  2. ALTER DATABASE CHARACTER SET  ZHS16CGB231280*ERROR at line 1:ORA-12712: new character set must be a superset of old character set

转换字符集,数据库应该在RESTRICTED模式下进行:

  1. <p>c:\>sqlplus "/ as sysdba"
  2. SQL*Plus: Release 9.2.0.4.0 - Production on Sat Nov 1 10:52:30 2003
  3. Copyright (c) 1982, 2002, Oracle Corporation.  All rights reserved.
  4. Connected to:
  5. Oracle9i Enterprise Edition Release 9.2.0.4.0 - Production
  6. With the Partitioning, Oracle Label Security, OLAP and Oracle Data Mining options
  7. JServer Release 9.2.0.4.0 - Production
  8. SQL> shutdown immediate
  9. Database closed.
  10. Database dismounted.
  11. ORACLE instance shut down.
  12. SQL> STARTUP MOUNT;
  13. ORACLE instance started.
  14. Total System Global Area   76619308 bytes
  15. Fixed Size                   454188 bytes
  16. Variable Size              58720256 bytes
  17. Database Buffers           16777216 bytes
  18. Redo Buffers                 667648 bytes
  19. Database mounted.
  20. SQL> ALTER SESSION SET SQL_TRACE=TRUE;
  21. Session altered.
  22. SQL> ALTER SYSTEM ENABLE RESTRICTED SESSION;
  23. System altered.
  24. SQL> ALTER SYSTEM SET JOB_QUEUE_PROCESSES=0;
  25. System altered.
  26. SQL> ALTER SYSTEM SET AQ_TM_PROCESSES=0;
  27. System altered.
  28. SQL> ALTER DATABASE OPEN;
  29. Database altered.
  30. SQL> set linesize 120
  31. SQL> ALTER DATABASE CHARACTER SET ZHS16GBK;
  32. ALTER DATABASE CHARACTER SET ZHS16GBK
  33. *
  34. ERROR at line 1:
  35. ORA-12721: operation cannot execute when other sessions are active
  36. SQL> ALTER DATABASE CHARACTER SET ZHS16GBK;
  37. ALTER DATABASE CHARACTER SET ZHS16GBK
  38. *
  39. ERROR at line 1:
  40. ORA-12716: Cannot ALTER DATABASE CHARACTER SET when CLOB data exists
  41. 在Oracle9i中,如果数据库存在CLOB类型字段,那么就不允许对字符集进行转换
  42. </p>

这时候,我们可以去查看alert<sid>.log日志文件,看CLOB字段存在于哪些表上:

  1. ALTER DATABASE CHARACTER SET ZHS16GBK SYS.METASTYLESHEET (STYLESHEET) - CLOB populatedORA-12716 signalled during: ALTER DATABASE CHARACTER SET ZHS16GBK...

对于不同情况,Oracle提供不同的解决方案,如果是用户数据表,一般我们可以把包含CLOB字段的表导出,然后drop掉相关对象,
转换后再导入数据库;对于系统表,可以按照以下方式处理:

  1. SQL> truncate table Metastylesheet;Table truncated.
  2. SQL> ALTER SESSION SET SQL_TRACE=TRUE;
  3. Session altered.
  4. SQL> ALTER DATABASE CHARACTER SET ZHS16GBK;
  5. Database altered.
  6. SQL> ALTER SESSION SET SQL_TRACE=FALSE;
  7. Session altered.

在9.2.0中,转换完成以后,可以通过运行catmet.sql脚本来重建Metastylesheet表:

SQL> @?/rdbms/admin/catmet.sql

通过Metastylesheet表来测试不同字符集的影响。

提示:
通过设置sql_trace,我们可以跟踪很多数据库的后台操作,这个工具是DBA常用的“利器”之一。
我们简单看一下数据库更改字符集时的后台处理,我提取了主要的更新部分。
通过以下跟踪过程,我们看到数据库在更改字符集的时候,主要更新了12张数据字典表,修改了数据库的原数据,这也证实了我们以前的说法:
这个更改字符集的操作在本质上并不转换任何数据库字符,只是简单的更新数据库中所有跟字符集相关的信息。

  1. update col$ set charsetid = :1
  2. where
  3. charsetform = :2
  4. update argument$ set charsetid = :1
  5. where
  6. charsetform = :2
  7. update collection$ set charsetid = :1
  8. where
  9. charsetform = :2
  10. update attribute$ set charsetid = :1
  11. where
  12. charsetform = :2
  13. update parameter$ set charsetid = :1
  14. where
  15. charsetform = :2
  16. update result$ set charsetid = :1
  17. where
  18. charsetform = :2
  19. update partcol$ set spare1 = :1
  20. where
  21. charsetform = :2
  22. update subpartcol$ set spare1 = :1
  23. where
  24. charsetform = :2
  25. update props$ set value$ = :1
  26. where
  27. name = :2
  28. update "SYS"."KOTAD$" set SYS_NC_ROWINFO$ = :1
  29. where
  30. SYS_NC_OID$ = :2
  31. update seq$ set increment$=:2,minvalue=:3,maxvalue=:4,cycle#=:5,order$=:6,
  32. cache=:7,highwater=:8,audit$=:9,flags=:10
  33. where
  34. obj#=:1
  35. update kopm$ set metadata = :1, length  = :2
  36. where
  37. name='DB_FDO'

注意:通过前面 ” ALTER DATABASE CHARACTER
SET”
方式更改字符集时,Oracle至少需要更改12张数据字典表,而这种直接更新props$表的方式只完成了其中十二分之一的工作,潜在的完整性隐患是可
想而知的。而且通过更新props$表的方式修改字符集,在Oracle7之后就不应该被使用.

(转)oracle字符集与汉字的更多相关文章

  1. Oracle 一个中文汉字 占用几个字节,由Oracle中字符集编码决定

    Oracle 一个中文汉字 占用几个字节,要根据Oracle中字符集编码决定 查看oracle server端字符集 select userenv('language') from dual; 如果显 ...

  2. ORACLE字符集基础知识

    概念描叙    ORACLE数据库有国家字符集(national character set)与数据库字符集(database character set)之分.两者都是在创建数据库时需要设置的.国家 ...

  3. Oracle一个中文汉字占用几个字节

    Oracle 一个中文汉字 占用几个字节,要根据Oracle中字符集编码决定   查看oracle server端字符集 select userenv('language') from dual; 如 ...

  4. 转Oracle字符集问题总结

    Oracle字符集问题总结 分类: Oracle2006-06-04 13:48 1298人阅读 评论(3) 收藏 举报 oracle数据库sqlcharacter存储insert 作者: vston ...

  5. oracle字符集问题总结

    在进行web开发和oracle安装的过程中经常有人对字符集搞不清楚,因此对此做一下总结. 1.第一个问题:字符集之间的区别是什么呢?   常见的字符集有:UTF-8和GBK   (1)GBK字符集 G ...

  6. oracle 字符集

    ---- 在国内外大中型数据库管理系统中,把ORACLE作为数据库管理平台的用户比较多.ORACLE 不论是数据库管理能力还是安全性都是无可非议的,但是,它在汉字信息的显示方面着实给中国用户带来不少麻 ...

  7. Oracle 字符集问题

    1 简介 ORACLE数据库字符集,即Oracle全球化支持(Globalization Support),或即国家语言支持(NLS)其作用是用本国语言和格式来存储.处理和检索数据.利用全球化支持,O ...

  8. 更改Oracle字符集避免乱码

    如何更改Oracle字符集避免乱码 转一位大神的笔记. 国内最常用的Oracle字符集ZHS16GBK(GBK 16-bit Simplified Chinese)能够支持繁体中文,并且按照2个字符长 ...

  9. 转://oracle字符集

    一.oracle字符集基础知识oracle数据库有国家字符集(national character set)与数据库字符集(database character set)之分.两者都是在创建数据库时需 ...

随机推荐

  1. Java 异常 —— java.io.InvalidClassException: javax.xml.namespace.QName; local class incompatible

    项目中有个 WebService 接口,调试时使用 Main 方法运行,别人的机器上都能运行,就笔者的机器出问题.他们说是RP的问题…… 异常信息: java.io.InvalidClassExcep ...

  2. 38-语言入门-38-Coin Test

    题目地址: http://acm.nyist.net/JudgeOnline/problem.php?pid=204    描述As is known to all,if you throw a co ...

  3. [JWFD开源工作流]JWFD开源工作流官方下载内容更新

    在更新版的JWFD二次开发包中,我正在实现单线程的时钟控制器,动了下引擎的源代码,这个更新包主要是升级界面,内核代码,大家就不用升级了.. 代码提示: 请修改代码包中(org.jwfd.workflo ...

  4. MVC用户登陆验证及权限检查(Form认证)

    1.配置Web.conf,使用Form认证方式   <system.web>     <authentication mode="None" />      ...

  5. SQL注入与Java

    前面这篇文章介绍了SQL注入,并且主要就PHP的内容做了实验: http://www.cnblogs.com/charlesblc/p/5987951.html 还有这篇文章对处理方案做了介绍(Pre ...

  6. Tomcat遇到”Error listenerStart”或”Error filterStart”问题且无详细日志时的log配置.

    昨天部署web应用到Tomcat之后,无法成功启动,并且控制台没有详细的错误信息,顶多就两行提示信息,例如:严重: Error listenerStart严重: Context [/lizongbo] ...

  7. Winform——计算器

    namespace 计算器2._0 { public partial class Form1 : Form { public Form1() { InitializeComponent(); } pr ...

  8. 嵌入式ARM系统开发基础

    从.net到delplhi 从windows到Linxu 未来有多远? 如何突破自己? 什么是自己? 我从哪里来,要到哪里去? 世界是什么? 是世选择了我,还是我选择了世界? 怎么才能够完成蜕变? 去 ...

  9. HDU 1224 Free DIY Tour

    题意:给出每个城市interesting的值,和城市之间的飞行路线,求一条闭合路线(从原点出发又回到原点) 使得路线上的interesting的值之和最大 因为要输出路径,所以用pre数组来保存前驱 ...

  10. HDU 1160 FatMouse's Speed

    半个下午,总算A过去了 毕竟水题 好歹是自己独立思考,debug,然后2A过的 我为人人的dp算法 题意: 为了支持你的观点,你需要从给的数据中找出尽量多的数据,说明老鼠越重速度越慢这一论点 本着“指 ...