改了点东西,因为想着要把项目优化,但是每条数据如果都存到单一数据库中,会造成以后的数据越来越大,怎么办?于是我想到了,可以考虑将单类数据存储到sqlite中,既可以备份,又可以用作缓存和其他作用。
所以就想到了sqlite的一些特性,当然,花了大量的时间测试代码,即,一份代码自动生成不同的数据库,可以自由控制读取哪个库哪个表。基于YII而已。写的有点挫,但现在这样的好处是可以不改动原有任何一行代码。
OK,接着转sqlite的字段类型。
一、存储种类和数据类型:
sqlite将数据值的存储划分为以下几种存储类型:
NULL: 表示该值为NULL值。
INTEGER: 无符号整型值。
REAL: 浮点值。
TEXT: 文本字符串,存储使用的编码方式为UTF-8、UTF-16BE、UTF-16LE。
BLOB: 存储Blob数据,该类型数据和输入数据完全相同。
由于sqlite采用的是动态数据类型,而其他传统的关系型数据库使用的是静态数据类型,即字段可以存储的数据类型是在表声明时即以确定的,因此它们之间 在数据存储方面还是存在着很大的差异。在sqlite中,存储分类和数据类型也有一定的差别,如INTEGER存储类别可以包含6种不同长度的 Integer数据类型,然而这些INTEGER数据一旦被读入到内存后,sqlite会将其全部视为占用8个字节无符号整型。因此对于sqlite而 言,即使在表声明中明确了字段类型,我们仍然可以在该字段中存储其它类型的数据。然而需要特别说明的是,尽管sqlite为我们提供了这种方便,但是一旦 考虑到数据库平台的可移植性问题,我们在实际的开发中还是应该尽可能的保证数据类型的存储和声明的一致性。除非你有极为充分的理由,同时又不再考虑数据库 平台的移植问题,在此种情况下确实可以使用sqlite提供的此种特征。
1. 布尔数据类型:
sqlite并没有提供专门的布尔存储类型,取而代之的是存储整型1表示true,0表示false。
2. 日期和时间数据类型:
和布尔类型一样,sqlite也同样没有提供专门的日期时间存储类型,而是以TEXT、REAL和INTEGER类型分别不同的格式表示该类型,如:
TEXT: "YYYY-MM-DD HH:MM:SS.SSS"
REAL: 以Julian日期格式存储
INTEGER: 以Unix时间形式保存数据值,即从1970-01-01 00:00:00到当前时间所流经的秒数。
二、类型亲缘性:
为了最大化sqlite和其它数据库引擎之间的数据类型兼容性,sqlite提出了"类型亲缘性(Type Affinity)"的概念。我们可以这样理解"类型亲缘性 ",在表字段被声明之后,sqlite都会根据该字段声明时的类型为其选择一种亲缘类型,当数据插入时,该字段的数据将会优先采用亲缘类型作为该值的存储 方式,除非亲缘类型不匹配或无法转换当前数据到该亲缘类型,这样sqlite才会考虑其它更适合该值的类型存储该值。sqlite目前的版本支持以下五种 亲缘类型:
亲缘类型 | 描述 |
TEXT | 数值型数据在被插入之前,需要先被转换为文本格式,之后再插入到目标字段中。 |
NUMERIC | 当文本数据被插入到亲缘性为NUMERIC的 字段中时,如果转换操作不会导致数据信息丢失以及完全可逆,那么sqlite就会将该文本数据转换为INTEGER或REAL类型的数据,如果转换失 败,sqlite仍会以TEXT方式存储该数据。对于NULL或BLOB类型的新数据,sqlite将不做任何转换,直接以NULL或BLOB的方式存储 该数据。需要额外说明的是,对于浮点格式的常量文本,如"30000.0",如果该值可以转换为INTEGER同时又不会丢失数值信息,那么sqlite 就会将其转换为INTEGER的存储方式。 |
INTEGER | 对于亲缘类型为INTEGER的字段,其规则等同于NUMERIC,唯一差别是在执行CAST表达式时。 |
REAL | 其规则基本等同于NUMERIC,唯一的差别是不会将"30000.0"这样的文本数据转换为INTEGER存储方式。 |
NONE | 不做任何的转换,直接以该数据所属的数据类型进行存储。 |
1. 决定字段亲缘性的规则:
字段的亲缘性是根据该字段在声明时被定义的类型来决定的,具体的规则可以参照以下列表。需要注意的是以下列表的顺序,即如果某一字段类型同时符合两种亲缘性,那么排在前面的规则将先产生作用。
1). 如果类型字符串中包含"INT",那么该字段的亲缘类型是INTEGER。
2). 如果类型字符串中包含"CHAR"、"CLOB"或"TEXT",那么该字段的亲缘类型是TEXT,如VARCHAR。
3). 如果类型字符串中包含"BLOB",那么该字段的亲缘类型是NONE。
4). 如果类型字符串中包含"REAL"、"FLOA"或"DOUB",那么该字段的亲缘类型是REAL。
5). 其余情况下,字段的亲缘类型为NUMERIC。
2. 具体示例:
声明类型 | 亲缘类型 | 应用规则 |
INT INTEGER TINYINT SMALLINT MEDIUMINT BIGINT UNSIGNED BIG INT INT2 INT8 |
INTEGER | 1 |
CHARACTER(20) VARCHAR(255) VARYING CHARACTER(255) NCHAR(55) NATIVE CHARACTER(70) NVARCHAR(100) TEXT CLOB |
TEXT | 2 |
BLOB | NONE | 3 |
REAL DOUBLE DOUBLE PRECISION FLOAT |
REAL | 4 |
NUMERIC DECIMAL(10,5) BOOLEAN DATE DATETIME |
NUMERIC | 5 |
注:在sqlite中,类型VARCHAR(255)的长度信息255没有任何实际意义,仅仅是为了保证与其它数据库的声明一致性。
三、比较表达式:
在sqlite3中支持的比较表达式有:"=","==","<","<=",">",">=","!=","<>","IN","NOT IN","BETWEEN","IS" and "IS NOT"。
数据的比较结果主要依赖于操作数的存储方式,其规则为:
1). 存储方式为NULL的数值小于其它存储类型的值。
2). 存储方式为INTEGER和REAL的数值小于TEXT或BLOB类型的值,如果同为INTEGER或REAL,则基于数值规则进行比较。
3). 存储方式为TEXT的数值小于BLOB类型的值,如果同为TEXT,则基于文本规则(ASCII值)进行比较。
4). 如果是两个BLOB类型的数值进行比较,其结果为C运行时函数memcmp()的结果。
四、操作符:
所有的数学操作符(+,-,*,/,%,<<,>>,&,and |)在执行之前都会先将操作数转换为NUMERIC存储类型,即使在转换过程中可能会造成数据信息的丢失。此外,如果其中一个操作数为NULL,那么它们 的结果亦为NULL。在数学操作符中,如果其中一个操作数看上去并不像数值类型,那么它们结果为0或0.0。
-------
上面的这一小段来自:http://www.cnblogs.com/stephen-liu74/archive/2012/02/22/2325258.html,其实这里也有一份,不过这一份嘛 ,就整理的不太好了。所以我扔到code框里。。其实以前有一份pdf的,但一下子找不到了。而且。。。mac下看chm和pdf都不太爽。。
- NULL
- INTEGER
- REAL
- TEXT
- BLOB
- 但实际上,sqlite3也接受如下的数据类型:
- smallint16位元的整数。
- interger32位元的整数。
- decimal(p,s)p精确值和s大小的十进位整数,精确值p是指全部有几个数(digits)大小值,s是指小数点後有几位数。如果没有特别指定,则系统会设为p=5;s=0。
- float32位元的实数。
- double64位元的实数。
- char(n)n长度的字串,n不能超过254。
- varchar(n)长度不固定且其最大长度为n的字串,n不能超过4000。
- graphic(n)和char(n)一样,不过其单位是两个字元double-bytes,n不能超过127。这个形态是为了支援两个字元长度的字体,例如中文字。
- vargraphic(n)可变长度且其最大长度为n的双字元字串,n不能超过2000
- date包含了年份、月份、日期。
- time包含了小时、分钟、秒。
- timestamp包含了年、月、日、时、分、秒、千分之一秒。
- 1.存储类别
- 第二版把所有列的值都存储成ASCII文本格式。第三版则可以把数据存储成整数和实数,还可以存储BLOB数据.
- Eachvaluestoredinansqlite数据库中存储的每个值都有一个属性,都属于下面所列类中的一种,(被数据库引擎所控制)
- 空.这个值为空值
- 整数.值被标识为整数,依据值的大小可以依次被存储为1,2,3,4,5,6,7,8.
- 实数.所有值都是浮动的数值,被存储为8字节的IEEE浮动标记序号.
- 文本.值为文本字符串,使用数据库编码存储(TUTF-8,UTF-16BEorUTF-16-LE).
- BLOB.值是BLOB数据,如何输入就如何存储,不改变格式.
- 像sqlite2.0版一样,在3.0版中,除了INTEGERPRIMARYKEY,数据库中的任何列都可以存储任何类型的数据.这一规则也有例外,在下面的"严格相似模式"中将描述.
- 输入sqlite的所有值,不管它是嵌入sql语句中的文字还是提前编译好的绑定在sql语句中的值,在sql语句执行前都被存储为一个类.在下面所描述的情况下,数据库引擎将在执行时检查并把值在数字存储类(整数和实数)和文本类间转换.
- 存储的类别最初被分类为如下:
- 具体的值比如sql语句部分的带双引号或单引号的文字被定义为文本,如果文字没带引号并没有小数点或指数则被定义为整数,如果文字没带引号但有小数点或指数则被定义为实数,如果值是空则被定义为空值.BLOB数据使用符号X'ABCD'来标识.
- Valuessuppliedusingthe被输入的值使用sqlite3_bind_*APIs的被分类一个存储等级,这等级是和原来的类基本相一致的.(比如sqlite3_bind_blob()绑定一个BLOB的值).
- 值的分类是sql分等级操作的结果,决定于最远的操作表达式.用户定义的功能也许会把值返回任意的类.在编译的时候来确定表达式的存储类基本是不可能的.
- 2.列之间的亲和性
- 在sqlite3.0版中,值被定义为什么类型只和值自身有关,和列没有关系,和变量也没有关系.(这有时被称作弱类型.)所有其它的我们所使用的数据库引擎都受静态类型系统的限制,其中的所有值的类是由其所属列的属性决定的,而和值无关.
- 为了最大限度的增加sqlite数据库和其他数据库的兼容性,sqlite支持列的"类型亲和性".列的亲和性是为该列所存储的数据建议一个类型.我们要注意是建议而不是强迫.在理论上来讲,任何列依然是可以存储任何类型的数据的.只是针对某些列,如果给建议类型的话,数据库将按所建议的类型存储.这个被优先使用的数据类型则被称为"亲和类型".
- 在sqlite3.0版中,数据库中的每一列都被定义为以下亲和类型中的一种:
- 文本
- 数字的
- 整数
- 无
- 一个具有类型亲和性的列按照无类型,文本,或BLOB存储所有的数据.如果数字数据被插入一个具有文本类型亲和性的列,在存储之前数字将被转换成文本.
- 一个具有数字类型亲和性的列也许使用所有的五个存储类型存储值.当文本数据被插入一个数字列时,在存储之前,数据库将尝试着把文本转换成整数或实数.如果能成功转换的话,值将按证书活实数的类型被存储.如果不能成功转换的话,值则只能按文本类型存储了,而不会被转换成无类型或BLOB类型来存储.
- 一个具有整数亲和力的列在转换方面和具有数字亲和力的列是一样的,但也有些区别,比如没有浮动量的实值(文本值转换的值)被插入具有整数亲和力的列时,它将被转换成整数并按整数类型存储.
- 一个具有无类型亲和力的列不会优先选择使用哪个类型.在数据被输入前它不会强迫数据转换类型.
- 2.1列的亲和性的决定
- 一个列的亲和类型是由该列所宣称的类型决定的.遵守以下规则:
- 如果数据类型包括字符串"INT"那么它被定义成具有整数亲和性.
- 如果列中的数据类型包括以下任何的字符串"CHAR","CLOB",or"TEXT"那么这个列则具有文本亲和性.要注意VARCHAR类型包括字符串"CHAR"因此也具有文本类型亲和性.
- 如果一个列的数据类型包括字符串"BLOB"或者如果数据类型被具体化了,那么这个列具有无类型亲和性.
- 否则就具有数字类型亲和性.
- 如果表格使用If"CREATETABLEASSELECT..."语句生成的,那么所有的列则都没有具体的数据类型,则没有类型亲和性.
- 2.2列的亲和性的例子
- CREATETABLEt1(
- tTEXT,
- nuNUMERIC,
- iINTEGER,
- noBLOB
- );
- --Storageclassesforthefollowingrow:
- --TEXT,REAL,INTEGER,TEXT
- INSERTINTOt1VALUES('500.0','500.0','500.0');
- --Storageclassesforthefollowingrow:
- --TEXT,REAL
- INSERTINTOt1VALUES(500.0,500.0,500.0);
- 3.比较表达式
- 像sqlite2.0版一样,3.0版的一个特性是二进制比较符'=','<','<=','>='and'!=',一个操作'IN'可以测试固定的成员资格,三重的比较操作符'BETWEEN'.
- 比较的结果决定于被比较的两个值的存储类型。遵循以下规则:
- 一个具有空存储类型的值被认为小于任何值(包括另外一个具有空存储类型的值)。
- 一个整数值或实数值小于任何文本值和BLOB值。当一个整数或实数和另一个整数或实数相比较的时候,则按照实际数值来比较。
- 一个文本值小于BLOB值。当两个文本值相比较的时候,则用C语言类库中的memcmp()函数来比较。然而,有时候也不是这样的,比如在下面所描述的“用户定义的整理顺序”情况下。
- 当两个BLOB文本被比较的时候,结果决定于memcmp()函数。
- 在开始比较前,sqlite尝试着把值在数字存储级(整数和实数)和文本之间相互转换。下面列举了关于如何比较二进制值的例子。在着重号below中使用的表达式可以表示sql标量表达式或是文本但不是一个列值。
- 当一个列值被比拟为表达式结果的时候,在比较开始前,列的亲和性将被应用在表达结果中。
- 当两个列值比较的时候,如果一个列有整数或数字亲和性的时候,而另外一列却没有,那么数字亲和性适用于从非数字列提取的任何具有文本存储类型的值.P>
- 当比较两个表达式的结果时,不发生任何转换,直接比较结果.如果一个字符串和一个数字比较,数字总是小于字符串.
- 在sqlite中,表达式"aBETWEENbANDc"等于表达式"a>=bANDa<=c",在比较表达式时,a可以是具有任何亲和性.
- 表达式"aIN(SELECTb....)"在比较时遵循上面所提到的三条规则,是二进制比较.(例如,在一个相似的样式"a=b").例如,如果'b'是一个列值,'a'是一个表达式,那么,在开始比较前,'b'的亲和性就被转换为'a'的亲和性了.
- sqlite把表达式"aIN(x,y,z)"和"a=zORa=yORa=z"视为相等.
- 3.1比较例子
- CREATETABLEt1(
- aTEXT,
- bNUMERIC,
- cBLOB
- );
- --Storageclassesforthefollowingrow:
- --TEXT,TEXT
- INSERTINTOt1VALUES('500','500','500');
- --60and40areconvertedto'60'and'40'andvaluesarecomparedasTEXT.
- SELECTa<60,a<40FROMt1;
- 1|0
- --Comparisonsarenumeric.Noconversionsarerequired.
- SELECTb<60,b<600FROMt1;
- 0|1
- --Both60and600(storageclassNUMERIC)arelessthan'500'
- --(storageclassTEXT).
- SELECTc<60,c<600FROMt1;
- 0|0
- 4.运算符
- 所有的数学运算符(所有的运算符而不是连锁作用标记符"||")运算对象首先具有数字亲和性,如果一个或是两个都不能被转换为数字那么操作的结果将是空值。
- 对于连接作用操作符,所有操作符将首先具有文本亲和性。如果其中任何一个操作符不能被转换为文本(因为它是空值或是BLOB)连接作用操作符将是空值。
- 5.分类,排序,混合挑选
- 当用子句ORDER挑选值时,空值首先被挑选出来,然后是整数和实数按顺序被挑选出来,然后是文本值按memcmp()顺序被挑选出来,最后是BLOB值按memcmp()顺序被挑选出来.在挑选之前,没有存储类型的值都被转换了.
- Whengroupingvalueswiththe当用GROUPBY子句给值分组时,具有不同存储类型的值被认为是不同的,但也有例外,比如,一个整数值和一个实数值从数字角度来说是相等的,那么它们则是相等的.用GROUPby子句比较完后,值不具有任何亲和性.
- 混合挑选操作符UNION,INTERSECTandEXCEPT在值之间实行绝对的比较,同样的亲和性将被应用于所有的值,这些值将被存储在一个单独的具有混合SELECT的结果组的列中.被赋予的亲和性是该列的亲和性,这个亲和性是由剩下的大部分的混合SELECTS返回的,这些混合SELECTS在那个位置上有列值(而不是其它类型的表达式).如果一个给定的混合SELECT列没有SELECTS的量,那么在比较前,该列的值将不具有任何亲和性.
- 6.其它亲和性模式
- 以上的部分所描述的都是数据库引擎在正常亲和性模式下所进行的操作,sqlite将描述其它两种亲和性模式,如下:
- 严格亲和性模式.在这种模式下,如果需要值之间相互转换数据存储类型的话,数据库引擎将发送错误报告,当前语句也将会重新运行.
- 无亲和性模式.在这种模式下,值的数据存储类型不发生转换.具有不同存储类型的值之间不能比较,但整数和实数之间可以比较.
- 7.用户定义的校对顺序
- Bydefault,when当sqlite比较两个文本值的时候,通过系统设定,不管字符串的编码是什么,用memcmp()来比较.sqlite第三版允许用户提供任意的函数来代替memcmp(),也就是用户定义的比较顺序.
- 除了系统预设的BINARY比较顺序,它是用memcmp()函数比较,sqlite还包含了两个额外的内置比较顺序函数,NOCASE和REVERSE:
- BINARY-使用memcmp()比较字符串数据,不考虑文本编码.
- REVERSE-用倒序比较二进制文本.
- NOCASE-和二进制一样,但在比较之前,26位的大写字母盘要被折合成相应的小写字母盘.
- 7.1分配比较顺序
- 每个表格中的每个列都有一个预设的比较类型.如果一个比较类型不是二进制所要求的,比较的子句将被具体化为列的定义来定义该列.
- 当用sqlite比较两个文本值时,比较顺序将按照以下的规则来决定比较的结果.文档的第三部分和第五部分描述在何种场合下发生这种比较.
- 对于二进制比较符(=,<,>,<=and>=),如果每个操作数是一列的话,那么该列的默认比较类型决定于所使用的比较顺序.如果两个操作数都是列的话,那么左边的操作数的比较类型决定了所要使用的比较顺序.如果两个操作数都不是一列,将使用二进制来比较.
- 表达式"xBETWEENyandz"和"x>=yANDx<=z"是相同的.表达式"xIN(SELECTy...)"和表达式"xx=y"使用同样的方法来操作,这是为了决定所要使用的比较顺序.如果X是一列或者二进制的,则"xIN(y,z...)"形式的表达式所使用的比较顺序是X的默认的比较类型.
- ORDERBYclausethatispartofaSELECTstatementmaybeassignedacollationsequencetobeusedforthesortoperationexplicitly.Inthiscasetheexplicitcollationsequenceisalwaysused.Otherwise,iftheexpressionsortedbyanORDERBYclauseisacolumn,thenthedefaultcollationtypeofthecolumnisusedtodeterminesortorder.Iftheexpressionisnotacolumn,thentheBINARYcollationsequenceisused.
- 7.2比较顺序的例子
- 下面的例子介绍了TheexamplesbelowidentifythecollationsequencesthatwouldbeusedtodeterminetheresultsoftextcomparisonsthatmaybeperformedbyvarIoUssqlstatements.Notethatatextcomparisonmaynotberequired,andnocollationsequenceused,inthecaSEOfnumeric,bloborNULLvalues.
- CREATETABLEt1(
- a,--defaultcollationtypeBINARY
- bCOLLATEBINARY,--defaultcollationtypeBINARY
- cCOLLATEREVERSE,--defaultcollationtypeREVERSE
- dCOLLATENOCASE--defaultcollationtypeNOCASE
- );
- --TextcomparisonisperformedusingtheBINARYcollationsequence.
- SELECT(a=b)FROMt1;
- --TextcomparisonisperformedusingtheNOCASEcollationsequence.
- SELECT(d=a)FROMt1;
- --TextcomparisonisperformedusingtheBINARYcollationsequence.
- SELECT(a=d)FROMt1;
- --TextcomparisonisperformedusingtheREVERSEcollationsequence.
- SELECT('abc'=c)FROMt1;
- --TextcomparisonisperformedusingtheREVERSEcollationsequence.
- SELECT(c='abc')FROMt1;
- --GroupingisperformedusingtheNOCASEcollationsequence(i.e.values
- --'abc'and'ABC'areplacedinthesamegroup).
- SELECTcount(*)GROUPBYdFROMt1;
- --GroupingisperformedusingtheBINARYcollationsequence.
- SELECTcount(*)GROUPBY(d||'')FROMt1;
- --SortingisperformedusingtheREVERSEcollationsequence.
- SELECT*FROMt1ORDERBYc;
- --SortingisperformedusingtheBINARYcollationsequence.
- SELECT*FROMt1ORDERBY(c||'');
- --SortingisperformedusingtheNOCASEcollationsequence.
- SELECT*FROMt1ORDERBYcCOLLATENOCASE;