一个有趣的问题——MySQL中varchar的最大长度
明明维护了一个1k的最小堆,可是输出到MySQL里却只有九百多行数据。
查log,发现这么一段内容:
stderr logs
com.mysql.jdbc.MysqlDataTruncation: Data truncation: Data too long for column 'reqs' at row 1
at com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:3595)
at com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:3529)
at com.mysql.jdbc.MysqlIO.sendCommand(MysqlIO.java:1990)
at com.mysql.jdbc.MysqlIO.sqlQueryDirect(MysqlIO.java:2151)
at com.mysql.jdbc.ConnectionImpl.execSQL(ConnectionImpl.java:2625)
at com.mysql.jdbc.PreparedStatement.executeInternal(PreparedStatement.java:2119)
at com.mysql.jdbc.PreparedStatement.executeUpdate(PreparedStatement.java:2415)
at com.mysql.jdbc.PreparedStatement.executeUpdate(PreparedStatement.java:2333)
at com.mysql.jdbc.PreparedStatement.executeUpdate(PreparedStatement.java:2318)
at com.successfactors.perflog.hadoop.mapreduce.core.ParseRecordToDB$RecordReducer.insertData(Unknown Source)
at com.successfactors.perflog.hadoop.mapreduce.core.ParseRecordToDB$RecordReducer.cleanup(Unknown Source)
at org.apache.hadoop.mapreduce.Reducer.run(Reducer.java:178)
at org.apache.hadoop.mapred.ReduceTask.runNewReducer(ReduceTask.java:649)
at org.apache.hadoop.mapred.ReduceTask.run(ReduceTask.java:417)
at org.apache.hadoop.mapred.Child$4.run(Child.java:255)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:415)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1121)
at org.apache.hadoop.mapred.Child.main(Child.java:249)
看来是column的最大长度不够,查看DDL:
CREATE TABLE `record` (
`eid` varchar(100) NOT NULL,
`module` varchar(32) NOT NULL,
`stime` int(11) NOT NULL,
`edate` varchar(32) NOT NULL,
`fname` varchar(100) NOT NULL,
`event` varchar(500) NOT NULL,
`reqs` varchar(10000) NOT NULL,
PRIMARY KEY (`eid`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
我都一万了还不够,试下65535吧!
发现varchar直接变成mediumtext了,这可不对。那就试试22222吧
又报错了...
最后我设置为20000长度了,倒是通过了,通过一个复杂的减法可以计算更为临界的值。
去网上查查,发现MySQL里column的最大长度貌似跟很多东西有关,跑去问公司的DBA,貌似oracle是另一套机制。
附一篇别人的文章,讲最大值的:
http://www.cnblogs.com/mo-beifeng/archive/2011/08/09/2133039.html
这不是一个固定的数字。本文简要说明一下限制规则。 strlen 计算字符串长度,一个中文当2字符 mb_strlen根据它的字符编码模式,统计字符quot count计算数组中的元素数目或对象中的属性个数 <?php
header('Content-Type:text/html;charset=UTF-8');
$string1="谢春业";//定义中文字符变量
$string2="xcy";//定义英文字符变量
//直接输出看看他们的长度
echo strlen($string1);
echo "</br>";
echo strlen($string2);
echo "</br>";
//用 php 多字节扩展函数 mb_strlen试试看
echo mb_strlen($string1,'utf8');
echo "</br>";
echo mb_strlen($string2,'utf8');
echo "</br>";
?> 输出结果是:
9
3
3
3
1、限制规则 字段的限制在字段定义的时候有以下规则: a) 存储限制 varchar 字段是将实际内容单独存储在聚簇索引之外,内容开头用1到2个字节表示实际长度(长度超过255时需要2个字节),因此最大长度不能超过65535。 b) 编码长度限制 字符类型若为gbk,每个字符最多占2个字节,最大长度不能超过32766; 字符类型若为utf8,每个字符最多占3个字节,最大长度不能超过21845。 对于英文比较多的论坛 ,使用GBK则每个字符占用2个字节,而使用UTF-8英文却只占一个字节。 若定义的时候超过上述限制,则varchar字段会被强行转为text类型,并产生warning。 c) 行长度限制 导致实际应用中varchar长度限制的是一个行定义的长度。 MySQL要求一个行的定义长度不能超过65535。若定义的表长度超过这个值,则提示 ERROR 1118 (42000): Row size too large. The maximum row size for the used table type, not counting BLOBs, is 65535. You have to change some columns to TEXT or BLOBs。 2、计算例子 举两个例说明一下实际长度的计算。 a) 若一个表只有一个varchar类型,如定义为 create table t4(c varchar(N)) charset=gbk; 则此处N的最大值为(65535-1-2)/2= 32766。 减1的原因是实际行存储从第二个字节开始’; 减2的原因是varchar头部的2个字节表示长度; 除2的原因是字符编码是gbk。 b) 若一个表定义为 create table t4(c int, c2 char(30), c3 varchar(N)) charset=utf8; 则此处N的最大值为 (65535-1-2-4-30*3)/3=21812 减1和减2与上例相同; 减4的原因是int类型的c占4个字节; 减30*3的原因是char(30)占用90个字节,编码是utf8。 如果被varchar超过上述的b规则,被强转成text类型,则每个字段占用定义长度为11字节,当然这已经不是“varchar”了。
这里还有一个不错的表格:
http://blog.sina.com.cn/s/blog_4f925fc30102edg8.html
一、数字类型
|
类型 |
范围 |
说明 |
|
|
Char(N) [ binary] |
N=1~255 个字元 |
固定长度 |
std_name cahr(32) not null |
|
VarChar(N) [binary] |
N=1~255 个字元 |
可变长度 |
std_address varchar(256) |
|
TinyBlob |
最大长度个字元(2^8-1) |
Blob (Binary large objects)储存二进位资料,且有分大小写 |
memo text not null |
|
TinyText |
最大长度个字元(2^8-1) |
||
|
Blob |
最大长度个字元(2^16-1) |
||
|
Text |
最大长度个字元(2^16-1) |
||
|
MediumBlob |
最大长度 16777215 个字元(2^24-1) |
||
|
MediumText |
最大长度 16777215 个字元(2^24-1 |
||
|
LongBlob |
最大长度个字元 (2^32-1) |
||
|
LongText |
最大长度个字元 (2^32-1) |
||
|
Enum |
集合最大数目为 |
列举(Enumeration),Enum单选、Set复选 |
sex enum(1,0) |
|
Set |
集合最大数目为 |
辨別Null与Not Null :Null为允许储存空值(Null)
二、数值
|
类型 |
范围 |
说明 |
例如 |
|
TinyInt[M] [UNSIGNED] |
-128~127 |
num tinyint unsigned |
|
|
SmallInt[M] [UNSIGNED] |
-32768~32767 |
||
|
MediumInt[M] [UNSIGNED] |
-8388608~8388607 |
||
|
Int[M] [UNSIGNED] |
-2^31~2^31-1 |
||
|
BigInt[M] [UNSIGNED] |
-2^63~2^63-1 |
||
|
Float [(M,D)] |
-3.4E+38~3.4E+38( 约 ) |
注: M 为长度, D 为小数,Float 4 bytes,Double 8 bytes |
|
|
Double [(M,D)] |
-1.79E+308~1.79E+308( 约 ) |
||
|
Decimal [(M,D)] |
辨別ZeroFill:当宣告关键字ZeroFill为自动填满0,如 000021
三、日期时间
|
类型 |
范围 |
说明 |
|
Date |
日期(yyyy-mm-dd) |
|
|
Time |
时间(hh:mm:ss) |
|
|
DateTime |
日期与时间組合(yyyy-mm-dd hh:mm:ss) |
|
|
TimeStamp |
yyyymmddhhmmss |
|
|
Year |
年份yyyy |
一个有趣的问题——MySQL中varchar的最大长度的更多相关文章
- Mysql中varchar和char区别
一.varchar和char的区别: 区别一:定长和变长 char表示定长.长度固定,varchanr表示变长,即长度可变. 即char类型是规定多少字长则必须存储多少字长,超过的长度的字段则只能截取 ...
- 【转】MySQL中varchar最大长度是多少?
一. varchar存储规则: 4.0版本以下,varchar(20),指的是20字节,如果存放UTF8汉字时,只能存6个(每个汉字3字节) 5.0版本以上,varchar(20),指的是20字符,无 ...
- int(11)最大长度是多少,MySQL中varchar最大长度是多少(转)
int(11)最大长度是多少,MySQL中varchar最大长度是多少? int(11)最大长度是多少? 在SQL语句中int代表你要创建字段的类型,int代表整型,11代表字段的长度. 这个11代表 ...
- 浅谈mysql中varchar(m)与char(n)的区别与联系
mysql建表长度的限制 在mysql建表时,出现以下报错信息: 错误一:行大小过大,所使用的表这种类型的最大的行大小,不算BLOB类型,是65535.(这是我翻译的) 原因是MySQL在建表的 ...
- MySQL中varchar最大长度是多少?
一. varchar存储规则: 4.0版本以下,varchar(20),指的是20字节,如果存放UTF8汉字时,只能存6个(每个汉字3字节) 5.0版本以上,varchar(20),指的是20字符,无 ...
- MySQL中varchar与char区别
MySQL中varchar与char区别(转) MySQL中varchar最大长度是多少? 一. varchar存储规则: 4.0版本以下,varchar(20),指的是20字节,如果存放UTF8汉字 ...
- MySQL中varchar最大长度是多少
一. varchar存储规则: 4.0版本以下,varchar(20),指的是20字节,如果存放UTF8汉字时,只能存6个(每个汉字3字节) 5.0版本以上,varchar(20),指的是20字符,无 ...
- MySql中varchar和char,如何选择合适的数据类型?
背景 学过MySQL的同学都知道MySQL中varchar和char是两种最主要的字符串类型,varchar是变长的类型,而char是固定长度.那关于如何选择类型就成为令人头疼的事,很多初学者为了保证 ...
- 【转】Mysql中varchar存放中文与英文所占字节异同
本文转自Ruby china, 原文地址:https://ruby-china.org/topics/24920 一.关于UTF-8 UTF-8 Unicode Transformation Form ...
随机推荐
- validatebox验证框架rules
项目前端使用JQuery easyui框架,验证使用插件validatebox,验证方法如下: <input name="test" type="text" ...
- Spark添加/更改集群节点需要修改的配置文件
笔记:在配置好了spark后,如果需要添加/删除一个结点需要修改如下配置文件 cd $HADOOP/etc/hadoop 进入hadoop配置文件夹下 修改 slaves,将对应的节点添加/删除 修改 ...
- 关于viewWithTag的一点说明
通常我们使用viewWithTag如下情形: 如果我们用了一个父View,上面放了多个子view, 每个子view都通过从0开始的Tag值来进行标志,以便于后期在像View上直接使用viewWithT ...
- BZOJ 2324 营救皮卡丘
http://www.lydsy.com/JudgeOnline/problem.php?id=2324 思路:最小费用最大流 考虑设数组d[k][i][j],代表只用前k个城市,i到j的最短路 然后 ...
- hex格式介绍及转bin格式的源程序
Intel HEX文件是记录文本行的ASCII文本文件,在Intel HEX文件中,每一行是一个HEX记录,由十六进制数组成的机器码或者数据常量.Intel HEX文件经常被用于将程序或数据传输存储到 ...
- keil c51的内部RAM(idata)动态内存管理程序
程序比较简单,但感觉比较有意思,个人认为有一定应用价值,希望大家有更好的思路和方法,互相促进. 程序的基本思路是:在CPU堆栈指针SP以上的RAM区域,通过把堆栈指针SP上移若干个字节,把空出的RAM ...
- Eclipse自动补全功能轻松设置 || 不需要修改编辑任何文件
本文介绍如何设置Eclipse代码自动补全功能.轻松实现输入任意字母均可出现代码补全提示框. Eclipse代码自动补全功能默认只包括 点"." ,即只有输入”." ...
- unix c 08
信号 - signal()改变信号的处理方式.默认情况下,信号在Unix中都有自己的处理方式,如果想改变信号的处理方式,signal/sigaction 可以实现. 信号可以在关键代码处进行屏蔽,因为 ...
- 快速批量导入庞大数据到SQL SERVER数据库(ADO.NET)
原文地址:http://www.cnblogs.com/chenxizhang/archive/2008/11/11/1331060.html 如果你需要在程序中批量插入成千上万行的数据,你会怎么编写 ...
- Linux配置FTP服务器
基于CentOS-6.5 1.先查看是否已安装:rpm -qa vsftpd 或 rpm -ql vsftpd 2.安装:yum install vsftpd -y 3.设置开机启动: chkconf ...