SQL Server 2008中如何为XML字段建立索引
from:http://blog.csdn.net/tjvictor/article/details/4370771
SQL Server中的XML索引分为两类:主XML 索引和辅助XML索引。其中辅助XML索引又分为:PATH 辅助XML索引,VALUE 辅助XML索引,PROPERTY辅助XML索引。
创建XML索引的语法示例如下:
- create table XMLTable(Id int primary key, XMLCol xml);
- go
- --XML主索引
- create primary xml index IPXML_XMLTable_XMLCol on XMLTable(XMLCol);
- --XML路径辅助索引
- create xml index IXML_XMLTable_XMLCol_Path on XMLTable(XMLCol)
- using xml index IPXML_XMLTable_XMLCol for path
- --XML属性辅助索引
- create xml index IXML_XMLTable_XMLCol_Property on XMLTable(XMLCol)
- using xml index IPXML_XMLTable_XMLCol for Property
- --XML内容辅助索引
- create xml index IXML_XMLTable_XMLCol_value on XMLTable(XMLCol)
- using xml index IPXML_XMLTable_XMLCol for value
需要注意是的,建立XML索引的表必须有主键。
建立索引的好处是提高查询效率,坏处是增加存储空间。下面结合实例,说明一下:
1.首先建立测试表,在SSMS中执行如下SQL语句create table XMLTable(Id int primary key, XMLCol xml);建表。
2.下面的程序是给表添加60万条数据,方便测试性能。至于为什么用程序添加而不是用insert语句,请参见我的另一篇博客:SQL Server 批量插入数据的两种方法http://blog.csdn.net/tjvictor/archive/2009/07/18/4360030.aspx
- static void Main(string[] args)
- {
- DataTable dt = GetTableSchema();
- for (int count = 1; count <= 600000; count++)
- {
- DataRow r = dt.NewRow();
- r[0] = count;
- r[1] = GetPropertyXML();
- dt.Rows.Add(r);
- }
- BulkToDB(dt);
- Console.WriteLine("finished");
- Console.ReadLine();
- }
- public static void BulkToDB(DataTable dt)
- {
- SqlConnection sqlConn = new SqlConnection(
- ConfigurationManager.ConnectionStrings["ConnStr1"].ConnectionString);
- SqlBulkCopy sqlBulkCopy = new SqlBulkCopy(sqlConn);
- sqlBulkCopy.BulkCopyTimeout = 0;
- sqlBulkCopy.BatchSize = dt.Rows.Count;
- sqlBulkCopy.DestinationTableName = "XMLTable";
- try
- {
- sqlConn.Open();
- if (dt != null && dt.Rows.Count != 0)
- {
- sqlBulkCopy.WriteToServer(dt);
- }
- }
- catch (Exception ex)
- {
- throw ex;
- }
- finally
- {
- sqlConn.Close();
- }
- }
- public static DataTable GetTableSchema()
- {
- DataTable dt = new DataTable();
- dt.Columns.AddRange(new DataColumn[]{
- new DataColumn("Id",typeof(int)),
- new DataColumn("XMLCol",typeof(string))});
- return dt;
- }
- public static int GetRandRange(int start, int end)
- {
- Random random = new Random(Guid.NewGuid().GetHashCode());
- return random.Next(start, end);
- }
- public static string GetPropertyXML()
- {
- StringBuilder buffer = new StringBuilder();
- buffer.AppendLine("<TJVICTOR>");
- for (int count = 0; count < GetRandRange(1, 10); count++)
- {
- int baseNum = GetRandRange(1, 100);
- buffer.AppendLine(string.Format("<Item{0} v=/"Property{0}/">Value{0}</Item{0}>", baseNum));
- }
- buffer.AppendLine("</TJVICTOR>");
- return buffer.ToString();
- }
3.执行一条查询语句,注意它的执行时间和执行计划:
select Id from XMLTable
where XMLCol.exist('/TJVICTOR/Item3')=1
由于机器配置不同,所以执行时间不会完全一样,这里只给出执行计划,以供参考:
所有时间都花在了Table Valued Function上,而且还是clustered index scan。
4.给这个表的XML字段加上索引。
- --XML主索引
- create primary xml index IPXML_XMLTable_XMLCol on XMLTable(XMLCol);
- --XML路径辅助索引
- create xml index IXML_XMLTable_XMLCol_Path on XMLTable(XMLCol)
- using xml index IPXML_XMLTable_XMLCol for path
- --XML属性辅助索引
- create xml index IXML_XMLTable_XMLCol_Property on XMLTable(XMLCol)
- using xml index IPXML_XMLTable_XMLCol for Property
- --XML内容辅助索引
- create xml index IXML_XMLTable_XMLCol_value on XMLTable(XMLCol)
- using xml index IPXML_XMLTable_XMLCol for value
注意:由于我们表中已经有60万条数据,所以建索引时间会很久,而且会占用大量内存和磁盘,本人就花费了10分钟左右,占了1G内存,和1.3G磁盘。请大家建索引时注意自己的硬盘空间,或者修改前面插入数据的程序,少插入一些数据。
5.重新执行上面的Sql语句:
select Id from XMLTable
where XMLCol.exist('/TJVICTOR/Item3')=1
你会发现,瞬间就出结果了,下面是执行计划,用到了XML index seek。
总结:建立XML索引后,查询效率会大大提高,经过本人的测试,xml.exist的执行效率最高,基本上提高了一个数据级,其它语句比如xml.query,xml.value等,查询速度提高了一倍左右,但总体不是太理想。但同时也发现,xml索引太占空间,比如上面的60万条记录吧,空间占用比例如下:
name rows reserved data index_size unused
XMLTable 600000 1479688 KB 160952 KB 1318184 KB 552 KB
关于xml.exist,xml.query,xml.value等基本使用方法,请参考下面的文章:
http://blog.csdn.net/tjvictor/archive/2009/07/21/4368511.aspx
如需转载,请注明本文原创自CSDN TJVictor专栏:
http://blog.csdn.net/tjvictor/archive/2009/07/22/4370771.aspx
SQL Server 2008中如何为XML字段建立索引的更多相关文章
- SQL Server 2008中新增的 1.变更数据捕获(CDC) 和 2.更改跟踪
概述 1.变更数据捕获(CDC) 每一次的数据操作都会记录下来 2.更改跟踪 只会记录最新一条记录 以上两种的区别: http://blog.csdn.n ...
- SQL Server 2008中新增的变更数据捕获(CDC)和更改跟踪
来源:http://www.cnblogs.com/downmoon/archive/2012/04/10/2439462.html 本文主要介绍SQL Server中记录数据变更的四个方法:触发器 ...
- 利用Ring Buffer在SQL Server 2008中进行连接故障排除
原文:利用Ring Buffer在SQL Server 2008中进行连接故障排除 出自:http://blogs.msdn.com/b/apgcdsd/archive/2011/11/21/ring ...
- SQL Server 2008中的CDC(Change Data Capture)功能使用及释疑
SQL Server 2008中的CDC(Change Data Capture)功能使用及释疑 关键词:CDC 原文:http://www.cnblogs.com/chenxizhang/arc ...
- SQL Server 2008中的MERGE(不仅仅是合并)
SQL Server 2008中的MERGE语句能做很多事情,它的功能是根据源表对目标表执行插入.更新或删除操作.最典型的应用就是进行两个表的同步. 下面通过一个简单示例来演示MERGE语句的使用方法 ...
- SQL Server 2008中的MERGE(数据同步)
OK,就像标题呈现的一样,SQL Server 2008中的MERGE语句能做很多事情,它的功能是根据源表对目标表执行插入.更新或删除操作.最典型的应用就是进行两个表的同步. 下面通过一个简单示例来演 ...
- SQL SERVER 2008中使用VARBINARY(MAX)进行图像存取的实现方法
在数据库应用项目开发中,经常会使用一些二进制的图像数据,存储和读取显示图像数据主要采用的是路径链接法和内存流法.路径链接法是将图像文件保存在固定的路径下,数据库中只存储图像文件的路径和名称 ...
- SQL Server 2008中的数据压缩
SQL Server 2008中引入了数据压缩的功能,允许在表.索引和分区中执行数据压缩.这样不仅可以大大节省磁盘的占用空间,还允许将更多数据页装入内存中,从而降低磁 盘IO,提升查询的性能.当然,凡 ...
- SQL Server 2008中增强的"汇总"技巧
本文转载:http://www.cnblogs.com/downmoon/archive/2012/04/06/2433988.html SQL Server 2008中的Pivot和UnPivot: ...
随机推荐
- Vue组件基础知识总结
组件系统是Vue.js其中一个重要的概念,它提供了一种抽象,让我们可以使用独立可复用的小组件来构建大型应用,任意类型的应用界面都可以抽象为一个组件树. 那么什么是组件呢?组件可以扩展HTML元素,封装 ...
- scrapy-splash抓取动态数据例子十一
一.介绍 本例子用scrapy-splash抓取活动树网站给定关键字抓取活动信息. 给定关键字:数字:融合:电视 抓取信息内如下: 1.资讯标题 2.资讯链接 3.资讯时间 4.资讯来源 二.网站信息 ...
- extjs4权限管理,actioncolumn列显示隐藏或禁用
//隐藏getClass: function(v, meta, rec) { if ( someCondition ) { return 'x-hidden' } }//加入其他样式getClass: ...
- 2017.11.15 linux软件安装管理(todo)
学习来自:http://www.imooc.com/learn/447 第一章 介绍 第二章 软件包简介 1.源码包 2.二进制包(RPM包或系统默认包) 脚本安装包其实是别人把软件安装的脚本写好了, ...
- PHPer 应聘见闻
关于我自己 我,很普通的一个开发,88年出生在皖南山区.从小学到高中毕业都没想过自己会从事软件开发,高考的误打误撞,被某普通二本院校收编.大学浑浑噩噩,对软件开发也没多大的兴趣,11年毕业后来杭,面试 ...
- pickle和cPickle:Python对象的序列化(上)
https://segmentfault.com/a/1190000002493548 pickle模块实现了一种算法,将任意一个Python对象转化成一系列字节(byets).此过程也调用了seri ...
- Windows如何定时关机
方法一:首先在"开始"菜单点击"运行",输入"at xx:xx shoutdown -s" 可以实现定时关机,xx:xx指的是具体关机时间. ...
- Struts2--百度百科
Struts 2是Struts的下一代产品,是在 struts 1和WebWork的技术基础上进行了合并的全新的Struts 2框架.其全新的Struts 2的体系结构与Struts 1的体系结构差别 ...
- Genymotion 在win10 下的安装
首先我在Genymotion官网上并没有找到他的安装程序.据说是在注冊后,通过邮件里的链接下载,结果也没有看到.最后详细在哪下的,忘了收藏.我下的是 genymotion-2.5.3-vbox.exe ...
- Android 自己定义控件开发入门(二)
上一次我们讲了一堆实现自己定义控件的理论基础.列举了View类一些能够重写的方法,我们对这些方法的重写是我们继承View类来派生自己定义控件的关键 我通过一个最简单的样例给大家展示了这一个过程,不管是 ...