MySQL的数据类型和建库策略详解
无论是在小得可怜的免费数据库空间或是大型电子商务网站 合理的设计表结构 充分利用空间是十分必要的 这就要求我们对数据库系统的常用数据类型有充分的认识 下面我就将我的一点心得写出来跟大家分享
创新互联公司专业为企业提供头屯河网站建设、头屯河做网站、头屯河网站设计、头屯河网站制作等企业网站建设、网页设计与制作、头屯河企业网站模板建站服务,10年头屯河做网站经验,不只是建网站,更提供有价值的思路和整体网络服务。
一 数字类型
数字类型按照我的分类方法分为三类 整数类 小数类和数字类
我所谓的 数字类 就是指DECIMAL和NUMERIC 它们是同一种类型 它严格的说不是一种数字类型 因为他们实际上是将数字以字符串形式保存的 他的值的每一位(包括小数点)占一个字节的存储空间 因此这种类型耗费空间比较大 但是它的一个突出的优点是小数的位数固定 在运算中不会 失真 所以比较适合用于 价格 金额 这样对精度要求不高但准确度要求非常高的字段
小数类 即浮点数类型 根据精度的不同 有FLOAT(单精度)和DOUBLE(双精度)两种 它们的优势是精确度 FLOAT可以表示绝对值非常小 小到约 E ( 小数点后面有 个零)的小数 而DOUBLE更是可以表示绝对值小到约 E ( 小数点后面有 个零)的小数 FLOAT类型和DOUBLE类型占用存储空间分别是 字节和 字节 如果需要用到小数的字段 精度要求不高的 当然用FLOAT了!可是说句实在话 我们 民用 的数据 哪有要求精度那么高的呢?这两种类型至今我没有用过——我还没有遇到适合于使用它们的事例
用的最多的 最值得精打细算的 是整数类型 从只占一个字节存储空间的TINYINT到占 个字节的BIGINT 挑选一个 够用 并且占用存储空间最小的类型是设计数据库时应该考虑的 TINYINT SMALLINT MEDIUMINT INT和BIGINT占用存储空间分别为 字节 字节 字节 字节和 字节 就无符号的整数而言 这些类型能表示的最大整数分别为 和 如果用来保存用户的年龄(举例来说 数据库中保存年龄是不可取的) 用TINYINT就够了 九城的《纵横》里 各项技能值 用SMALLINT也够了 如果要用作一个肯定不会超过 行的表的AUTO_INCREMENT的IDENTIFY字段 当然用 MEDIUMINT 不用 INT 试想 每行节约一个字节 行可以节约 兆多呢!
二 日期时间类型
日期和时间类型比较简单 无非是 DATE TIME DATETIME TIMESTAMP和YEAR等几个类型 只对日期敏感 而对时间没有要求的字段 就用DATE而不用DATETIME是不用说的了 单独使用时间的情况也时有发生——使用TIME 但最多用到的还是用DATETIME 在日期时间类型上没有什么文章可做 这里就不再详述
三 字符(串)类型
不要以为字符类型就是 CHAR !CHAR和VARCHAR的区别在于CHAR是固定长度 只要你定义一个字段是CHAR( ) 那么不论你存储的数据是否达到了 个字节 它都要占去 个字节的空间 而VARVHAR则是可变长度的 如果一个字段可能的值是不固定长度的 我们只知道它不可能超过 个字符 把它定义为 VARCHAR( )是最合算的 VARCHAR 类型的实际长度是它的值的(实际长度+ ) 为什么 + 呢?这一个字节用于保存实际使用了多大的长度呀!从这个 + 中也应该看到 如果一个字段 它的可能值最长是 个字符 而多数情况下也就是用到了 个字符时 用VARCHAR就不合算了 因为在多数情况下 实际占用空间是 个字节 比用CHAR( )还多占用一个字节!
举个例子 就是一个存储股票名称和代码的表 股票名称绝大部分是四个字的 即 个字节 股票代码 上海的是六位数字 深圳的是四位数字 这些都是固定长度的 股票名称当然要用 CHAR( ) 股票代码虽然是不固定长度 但如果使用VARVHAR( ) 一个深圳的股票代码实际占用空间是 个字节 而一个上海的股票代码要占用 个字节!考虑到上海的股票数目比深圳的多 那么用VARCHAR( )就不如CHAR( )合算了
虽然一个CHAR或VARVHAR的最大长度可以到 我认为大于 的CHAR是几乎用不到的——很少有大于 个字节长度的固定长度的东东吧?不是固定长度的就用VARCHAR!大于 的VARCHAR也是几乎用不到的——比这更大的用TEXT就好了 TINYTEXT 最大长度为 占用空间也是(实际长度+ ) TEXT 最大长度 占用空间是(实际长度+ ) MEDIUMTEXT 最大长度 占用空间是(实际长度+ ) LONGTEXT 最大长度 占用空间是(实际长度+ ) 为什么 + ? + ? + ? + ?你要是还不知道就该打PP了 这些可以用在论坛啊 新闻啊 什么的 用来保存文章的正文 根据实际情况的不同 选择从小到大的不同类型
四 枚举和集合类型
枚举(ENUM)类型 最多可以定义 种不同的字符串从中做出选择 只能并且必须选择其中一种 占用存储空间是一个或两个字节 由枚举值的数目决定 集合(SET)类型 最多可以有 个成员 可以选择其中的零个到不限定的多个 占用存储空间是一个到八个字节 由集合可能的成员数目决定
举个例子来说 在SQLServer中 你可以节约到用一个Bit类型来表示性别(男/女) 但MySQL没有Bit 用TINTINT?不 可以用ENUM( 帅哥 美眉 )!只有两种选择 所以只需一个字节——跟TINYINT一样大 但却可以直接用字符串 帅哥 和 美眉 来存取 真是太方便啦!
lishixinzhi/Article/program/MySQL/201311/29648
mysql能设置数据类型长度吗
可以设置数据类型长度
精确数字
整数
bigint
从 -2^63 (-9223372036854775808) 到 2^63-1 (9223372036854775807) 的整型数据(所有数字)。
int
从 -2^31 (-2,147,483,648) 到 2^31 - 1 (2,147,483,647) 的整型数据(所有数字)。
smallint
从 -2^15 (-32,768) 到 2^15 - 1 (32,767) 的整数数据。
tinyint
从 0 到 255 的整数数据。
bit
bit
1 或 0 的整数数据。
decimal 和 numeric
decimal
从 -10^38 +1 到 10^38 –1 的固定精度和小数位的数字数据。
numeric
功能上等同于 decimal。
money 和 smallmoney
money
货币数据值介于 -2^63 (-922,337,203,685,477.5808) 与 2^63 - 1 (+922,337,203,685,477.5807) 之间,精确到货币单位的千分之十。
smallmoney
货币数据值介于 -214,748.3648 与 +214,748.3647 之间,精确到货币单位的千分之十。
近似数字
float
从 -1.79E + 308 到 1.79E + 308 的浮点精度数字。
real
从 -3.40E + 38 到 3.40E + 38 的浮点精度数字。
datetime 和 smalldatetime
datetime
从 1753 年 1 月 1 日到 9999 年 12 月 31 日的日期和时间数据,精确到百分之三秒(或 3.33 毫秒)。
smalldatetime
从 1900 年 1 月 1 日到 2079 年 6 月 6 日的日期和时间数据,精确到分钟。
字符串
char
固定长度的非 Unicode 字符数据,最大长度为 8,000 个字符。
varchar
可变长度的非 Unicode 数据,最长为 8,000 个字符。
text
可变长度的非 Unicode 数据,最大长度为 2^31 - 1 (2,147,483,647) 个字符。
Unicode 字符串
nchar
固定长度的 Unicode 数据,最大长度为 4,000 个字符。
nvarchar
可变长度 Unicode 数据,其最大长度为 4,000 字符。sysname 是系统提供用户定义的数据类型,在功能上等同于 nvarchar(128),用于引用数据库对象名。
ntext
可变长度 Unicode 数据,其最大长度为 2^30 - 1 (1,073,741,823) 个字符。
二进制字符串
binary
固定长度的二进制数据,其最大长度为 8,000 个字节。
varbinary
可变长度的二进制数据,其最大长度为 8,000 个字节。
image
可变长度的二进制数据,其最大长度为 2^31 - 1 (2,147,483,647) 个字节。
其它数据类型
cursor
游标的引用。
sql_variant
一种存储 SQL Server 支持的各种数据类型(text、ntext、timestamp 和 sql_variant 除外)值的数据类型。
table
一种特殊的数据类型,存储供以后处理的结果集。
timestamp
数据库范围的唯一数字,每次更新行时也进行更新。
uniqueidentifier
全局唯一标识符 (GUID)。
【MySQL】建表(一):数据类型
建表过程就是一个画表头的过程(声明字段过程)
存储同样的数据,不同的lie类型所占的空间和效率是不一样的,这就是我们建表前要列类型的意义
所以,列类型的存储与占据的字节关系是学习的重点
一般而言,设某类型N字节
N字节,8N位
0 -- 2^8N-1
-2^(8N-1) --- 2^(8N-1)-1
对于int类型:占的字节越多,存储的范围也越大
添加一个学分 列
alter table class add score tinyint unsigned not null default 0;
(M)unsigned zerofill
zerofill: zero是零,fill是填充,代表0填充
M表示补0宽度,即位数不够,用0填充没有补齐的宽度,并不改变其大小
M必须和zerofill配合才有意义
用zerofill表示属性,则该属性也默认为unsigned类型
char、varchar分别称为定长、变长类型
char(100)是存储0~100个长度
varchar(100)也是存储0~100个长度
char为定长,当输入长度不足设定的长度时,会用空格去补,而取出来时,会将空格去掉,所以,用concat连接时,char的空格被自动删除了
【注】char(M),varchar(M)限制的是字符,不是字节
即char(2) charset utf8, 储存2 个utf8字符,比如中国
utf8一个字符占3个字节
一般用来存储文章内容、新闻内容等
声明text时,不必使用默认值
所以不必加上 not null default '' ,而是直接使用 artice text
用来存储图像、音频等二进制信息
意义:blob防止因为字符集的问题,导致信息丢失
比如一张图中有0xFF字节,这个在ASCII字符集默认 非法,在入库的时候,被过滤了
超出范围,year类型只占1字节,最多能存256种变化
范围:1901~2155
year能简写成两位,但不推荐这样写(但现在的版本不支持了)
如何设置mysql中的数据类型
使用ALTER命令修改,格式:
ALTER TABLE 表名 MODIFY COLUMN 字段名 字段类型定义;
例如:
ALTER TABLE chatter_users MODIFY COLUMN ip VARCHAR(50);
MySQL优化之数据类型的使用
有助于效率的类型选择
使你的数据尽可能小
最基本的优化之一是使你的数据(和索引)在磁盘上(并且在内存中)占据的空间尽可能小 这能给出巨大的改进 因为磁盘读入较快并且通常也用较少的主存储器 如果在更小的列上做索引 索引也占据较少的资源
你能用下面的技术使表的性能更好并且使存储空间最小
·尽可能地使用最有效(最小)的类型 MySQL有很多节省磁盘空间和内存的专业化类型
·如果可能使表更小 使用较小的整数类型 例如 MEDIUMINT经常比INT好一些
·如果可能 声明列为NOT NULL 它使任何事情更快而且你为每列节省一位 注意如果在你的应用程序中你确实需要NULL 你应该毫无疑问使用它 只是避免缺省地在所有列上有它
使用定长列 不使用可变长列
这条准则对被经常修改 从而容易产生碎片的表来说特别重要 例如 应该选择 CHAR 列而不选择 VARCHAR 列 所要权衡的是使用定长列时 表所占用的空间更多 但如果能够承担这种空间的耗费 使用定长行将比使用可变长的行处理快得多
将列定义为 NOT NULL
这样处理更快 所需空间更少 而且有时还能简化查询 因为不需要检查是否存在特例 NULL
考虑使用 ENUM 列
如果有一个只含有限数目的特定值的列 那么应该考虑将其转换为 ENUM 列 ENUM 列的值可以更快地处理 因为它们在内部是以数值表示的
有关BLOB和TEXT类型
使用BLOB和TEXT类型的优点
用 BLOB 存储应用程序中包装或未包装的数据 有可能使原来需要几个检索操作才能完成的数据检索得以在单个检索操作中完成 而且还对存储标准表结构不易表示的数据或随时间变化的数据有帮助
使用BLOB和TEXT类型的可能弊端
另一方面 BLOB 值也有自己的固有问题 特别是在进行大量的 DELETE 或 UPDATE 操作时更是如此 删除 BLOB 会在表中留下一个大空白 在以后将需用一个记录或可能是不同大小的多个记录来填充
除非有必要 否则应避免检索较大的 BLOB 或 TEXT 值 例如 除非肯定WHERE 子句能够将结果恰好限制在所想要的行上 否则 SELECT * 查询不是一个好办法 这样做可能会将非常大的 BLOB 值无目的地从网络上拖过来 这是存储在另一列中的 BLOB 标识信息很有用的另一种情形 可以搜索该列以确定想要的行 然后从限定的行中检索 BLOB 值
必要的准则
对容易产生碎片的表使用 OPTIMIZE TABLE
大量进行修改的表 特别是那些含有可变长列的表 容易产生碎片 碎片不好 因为它在存储表的磁盘块中产生不使用的空间 随着时间的增长 必须读取更多的块才能取到有效的行 从而降低了性能 任意具有可变长行的表都存在这个问题 但这个问题对 BLOB 列更为突出 因为它们尺寸的变化非常大 经常使用 OPTIMIZE TABLE 有助于保持性能不下降
使用多列索引
多列索引列有时很有用 一种技术是根据其他列建立一个散列值 并将其存储在一个独立的列中 然后可通过搜索散列值找到行 这只对精确匹配的查询有效 (散列值对具有诸如 或 = 这样的操作符的范围搜索没有用处) 在MySQL 版及以上版本中 散列值可利用 MD ( ) 函数产生 散列索引对 BLOB 列特别有用 有一事要注意 在 MySQL 以前的版本中 不能索引 BLOB 类型 甚至是在 或更新的版本中 利用散列值作为标识值来查找 BLOB 值也比搜索 BLOB 列本身更快
将 BLOB 值隔离在一个独立的表中
在某些情况下 将 BLOB 列从表中移出放入另一个副表可能具有一定的意义 条件是移出 BLOB 列后可将表转换为定长行格式 这样会减少主表中的碎片 而且能利用定长行的性能优势
使用ANALYSE过程检查表列
如果使用的是 MySQL 或更新的版本 应该执行 PROCEDURE ANALYSE( ) 查看它所提供的关于表中列的信息
ANALYSE([max elements [max memory]])
它检验来自你的查询的结果并返回结果的分析
max elements(缺省 )是 *** yse将注意的每列不同值的最大数量 这被ANALYSE用来检查最佳的列类型是否应该是ENUM类型
max memory(缺省 )是在 *** yse尝试寻找所有不同值的时候应该分配给每列的最大内存量
SELECT FROM WHERE PROCEDURE ANALYSE([max elements [max memory]])
例如
mysqlSELECT * FROM student PROCEDURE ANALYSE();
mysqlSELECT * FROM student PROCEDURE ANALYSE( );
相应输出中有一列是关于表中每列的最佳列类型的建议 第二个例子要求 PROCEDURE ANALYSE( ) 不要建议含有多于 个值或取多于 字节的 ENUM 类型(可根据需要更改这些值) 如果没有这样的限制 输出可能会很长;ENUM 的定义也会很难阅读
lishixinzhi/Article/program/MySQL/201311/29636
文章名称:mysql怎么设置数据类 mysql怎么修改列的类型
标题网址:http://scpingwu.com/article/docopgd.html