SQL Server 在2024年11月开始进行社区私有预览（链接），由于涉及AI能力，我也是第一时间申请了内侧资格，悲剧的是，直到2025年2月，才拿到预览版的测试资格-.-，此时已经是CTP1.3了，也就是内侧的第四个版本了。

但whatever，late better than never。下面根据我的初步测试，做一些分享。

当前的测试的版本为：

原生向量支持与DiskANN向量索引

SQL Server作为一个典型的商业数据库，一直喜欢搞大而全，各种全家桶全塞进来，现在流行的说法叫“一站式”。基本逻辑是每个sql server版本都会结合当时流行的趋势和技术，将该技术集成进SQL Server，下面是一个简单的回顾

历代SQL Server结合当时背景的新增功能分析

SQL Server 2008 - 层级结构 (HierarchyID) 和地理信息 (Spatial Data):

Web 2.0 兴起，层级数据和位置服务应用普及。HierarchyID 高效管理组织结构等层级数据，Spatial Data 支持位置服务，满足 Web 2.0 时代对复杂数据管理和地理位置应用的需求。

SQL Server 2012 - 内存数据库 (In-Memory OLTP):

电商等高并发 OLTP 应用爆发，磁盘 I/O 成性能瓶颈。另外这个时代SSD还是贵的没边，稳定性还没这么靠谱的存储。内存优化表减少磁盘 I/O，大幅提升高并发 OLTP 性能，应对电商、金融等对极致性能的迫切需求。

但目前来看，这个功能使用率并不是很高，该功能通常通过外挂的缓存系统实现，比如Redis。

SQL Server 2014 - 列存储 (Columnstore):

大数据分析兴起，传统行式存储分析查询效率低下。列式索引优化分析查询，大幅提升大数据仓库性能，顺应大数据分析流行趋势，满足企业数据洞察需求。

SQL Server 2016 - JSON 支持 (JSON Support):

Web 服务和 NoSQL 流行，JSON 成 Web 数据交换主流格式。JSON 支持允许存储和查询 JSON 数据，灵活适应 Web 服务和半结构化数据，拥抱 NoSQL 趋势，拓展应用场景。

SQL Server 2017 - 图数据库 (Graph Database):

社交网络、推荐系统等关系复杂应用兴起，传统关系数据库效率不高。图数据库支持建模复杂关系，高效处理社交网络、推荐系统等应用。

SQL Server 2019 - HTAP (Hybrid Transactional/Analytical Processing):

实时数据分析需求强烈，传统数据仓库延迟高。HTAP 能力支持实时分析，提升决策效率，符合实时业务监控和快速决策需求，顺应混合处理趋势。

SQL Server 2022 - 账本 (Ledger Tables):

数据安全和合规性日益重要，区块链技术火的一塌糊涂（比特币价格起飞），需要防篡改数据记录。账本表提供防篡改数据记录，增强数据完整性和可信度，满足审计、合规等对数据可信有高要求的场景，拥抱区块链技术，提升数据安全水平。

SQL Server 2025 - 向量数据库 (Vector Database):

当下AI的爆发年代来看，需要向量数据库的背景无需多说，向量数据库在应用层面主要用于RAG、语义理解、大规模向量数据处理和多模态融合，并能显著降低向量检索计算成本。是AI应用中最重要的基础设施之一。

原生向量类型支持

SQL Server增加内置的Vector字段，最高支持1998维度（猜想是因为每个向量都是32精度的float，1998维度正好不超过SQL Server每页的8K存储，从而不溢出），通过测试可以发现，内部存储使用varbinary数据作为底层数据，做了一个简单的测试，通过新增变量类型为Vector，或表列定义为Vector列实现，如图所示:

基于DiskANN的向量相似度检索

DiskANN介绍

DiskANN基于微软2019年发表的论文《DiskANN: Fast Accurate Billion-point Nearest Neighbor Search on a Single Node》。在此之前，向量搜索领域中一个流行的主要算法是HNSW（分层可导航小世界图），这是一种利用多层图结构进行搜索的算法。HNSW的核心特点是涉及大量的随机内存访问，因此该算法需要消耗大量内存资源，要求原始向量和图数据都必须常驻内存中。

图.HNSW图查找示例

我们以阿里云的Millivs托管服务为例，如果涉及1千万的512维向量数据为例，推荐资源如下：

图. Millivs对于千万级512维向量的推荐资源

这种资源要求所带来的成本较高，会比较多限制AI的落地。针对于此，DisnANN的核心目标是，用有限的内存（几十GB）+大容量的SSD盘，支撑单节点存储和搜索十亿级别的数据集，同时保持高性能（低延迟、高召回率）。

DiskANN的核心算法是Vamana图，本质上是一种构建近似最近邻图的方法，它为每个节点构建一个有限数量的出边，这些出边连接到该节点的近似最近邻。与HNSW的多层结构不同，Vamana构建单层图，但通过精心设计的图构建过程确保搜索效率。举个例子理解是Vamana图就像一张城市地图，每个数据点是地图上的一个地点，边代表地点之间的邻近关系。DiskANN 的搜索过程就像在地图上导航，从某个起始点出发，沿着边不断“走”到离目标地点最近的位置。

同时DiskANN还做了一些优化，来适应磁盘换内存的场景，例如：

k-means聚类（分而治之），降低建图的内存需求。
PQ量化（数据压缩），减少内存和计算量。
SSD定长数据（高效存储），加速读取。
入口节点和邻居放内存（缓存热点），减少SSD访问。
beam-search（并行搜索），提升搜索效率。

下面是根据论文，做了一个DiskANN的简单数据：

SQL Server中相似度搜索使用方式

当前在SQL Server的CTP1.3版本中，向量搜索的核心函数主要是VECTOR_DISTENCE,可以结合在传统的T-SQL中使用，目前该函数还比较初级，当前仅支持余弦相似度、欧式距离和点积。一个简单的示例如下：

-- 创建一个包含向量字段的表

CREATE TABLE VectorTable (

    ID INT PRIMARY KEY IDENTITY(1,1),

    Description NVARCHAR(100),

    EmbeddingVector VECTOR(10) -- 创建10维向量字段

);

INSERT INTO VectorTable (Description, EmbeddingVector)

VALUES

    ('示例项目1', '[0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0]'),

    ('示例项目2', '[0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5]'),

    ('示例项目3', '[0.9, 0.8, 0.7, 0.6, 0.5, 0.4, 0.3, 0.2, 0.1, 0.0]');

DECLARE @queryVector VECTOR(10) = '[0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0, 0.1]';

-- 使用余弦相似度查找最相似的向量

SELECT

    ID,

    Description,

    vector_distance('cosine' , @queryVector, EmbeddingVector)

FROM VectorTable

余弦相似度的结果如下：

图. 计算余弦相似度

同时SQL Server也支持使用和传统的关系数据共同作用，进行相似度查询，例如该例子，结合where条件，帮助用户通过where做过滤，同时选出top 5相似度的产品：

  -- 假设我们有一个查询向量（可能来自用户当前正在查看的产品）

DECLARE @query_vector VECTOR(512) = CAST(CONCAT('[', REPLICATE('0.15,', 511), '0.15]') AS VECTOR(512));

-- 查找与当前产品最相似的5个产品（使用余弦相似度）

SELECT top 5

    id,

    category,

    description,

    vector_distance('cosine' , @query_vector, vector) AS similarity_score

FROM

    VectorDemo

where category = 'Clothing'

ORDER BY

    similarity_score

结果如下：

图.余弦相似度计算结果

相似度搜索的性能

由于当前我拿到的是私有预览版的sql server，并没有合适的帮助文档，因此不确定我的使用方式是否正确，按我的理解，可能需要针对向量列单独加索引，但目前没看到加索引的方式，下面的测试是基于没有加索引的测试。测试的数据量如下：

当前我们的测试表大约是200W+的数据，每列包含512维的向量，大约数据占用是6G左右，当我做一个简单的相似度搜索时，可以看到

虽然查询完成时间在334毫秒，从逻辑读（80万的逻辑读*8K每次读取，基本等于数据量大小）来看，基本走了全表扫描，而CPU使用也是非常高，基本需要1个CPU 100%，2.3S时间。

当前查询完成快是数据已经常驻内存，那么如果我将sql server使用内存调低，涉及到IO读写呢？比如当前数据量维6.9G，我将内存使用上限调整为6G会发生什么：

由于开始涉及物理读写，我们看到整个查询时间来到不可接受的节奏。大量的预读和IO操作使得CPU时间翻倍，同时整体时间增长50倍倍。

那么我们使用选择性很高的索引呢？

可以看到，category='test'的选择性非常高，导致向量相似度搜索成本直接通过IndexSeek+向量搜索完成。

后续等待更多文档出来再进一步观察，当前的观察是，如果没有对向量增加索引，则搜索基本需要全量比对+排序。如果用于实际生产，基本难以接受。

其他AI相关函数支持

VECTOR_NORM（向量标准化）

本例中VECTOR_NORM(image_embedding, ‘norm2’) > 3 主要作用：

去除纯色背景（因向量范数接近零）
去除模糊图像（因特征信息少，范数较小）
去除异常数据（因数据录入错误，导致范数极小或无效）

VECTOR_NORMALIZE（向量归一化）

该函数解释也比较简单，就是将向量的上限变为1，比如当前最大值是5，则对应的4变为0.8。一个简单的例子：

AI服务集成与T-SQL扩展

sp_invoke_external_rest_endpoint

直接通过 T-SQL 调用外部的 HTTPS REST 或 GraphQL 接口。简单来说，它让 SQL Server 数据库可以像客户端一样，直接和外部服务（比如 Azure Functions、Power BI、OpenAI API 、DeepSeek API等）交互。

想象你在 SQL Server 里写了个脚本，但需要外部服务（比如翻译文本、计算汇率、调用大模型等）。以前你得写个外部程序（比如用 Python 或 C#）去调用服务，再把结果写回数据库。现在，sp_invoke_external_rest_endpoint 可以做到数据不出数据库即可完成服务。

其实外部调用的优势和劣势我也简单做了一个总结，

优势：

数据就地处理，减少数据搬运（同时减少安全面）
统一的事务与安全机制（ACID支持，数据库权限、证书支持）
简化架构与减少依赖（集中化带来开发便利）
方便运维（集中化带来运维便利）
快速原型验证（验证后迁移服务层）

劣势：

数据库负载与性能冲突
数据库难以Scale-out
难以调试（T-SQL相比编程语言难以调试）
语言/生态局限（支持的Python包有限）
安全问题（需要数据库能够访问外部服务，需要额外启用防火墙）
数据库中生态极差（主流语言支持丰富的AI/ML库）

下面是一个简单的例子，我将SQL Server数据库的日志发送给大模型，寻求性能优化建议：

DECLARE

    @endpoint_url NVARCHAR(200) = N'https://',

    @api_key NVARCHAR(100) = N'sk-or-v1',

    @logs_context NVARCHAR(MAX),

    @payload NVARCHAR(MAX),

    @response_status_code INT,

    @response_message NVARCHAR(MAX);

-- 步骤1：获取最新的 SQL Server 日志信息作为上下文

SET @logs_context = N'2025-02-26 14:35:15.45 spid51 Query execution time exceeded 1s for SELECT * FROM Sales.Orders JOIN Sales.OrderDetails ON Orders.OrderID = OrderDetails.OrderID WHERE OrderDate > ''2025-01-01''. Table scan detected on Sales.OrderDetails due to missing index on OrderID. + 2025-02-26 14:35:18.19 spid47 CPU usage reached 92% for 30 seconds. High lock contention detected on table Sales.Orders. + 2025-02-26 14:35:19.19 spid47 Buffer pool hit ratio dropped to 7%. Memory pressure detected, available memory: 512 MB.';

-- 步骤2：构造请求体

SET @payload = N'{

    "model": "google/gemini-2.0-flash-001",

    "messages": [

        {"role": "system", "content": "You are a SQL Server expert."},

        {"role": "user", "content": "以下是我的SQL服务器日志信息：'

         + @logs_context

         + N'。请给出可能的性能优化或故障排查建议。"}

    ]

}';

-- 步骤3：构造请求头

DECLARE @headers NVARCHAR(MAX);

SET @headers = CONCAT(N'{"Content-Type": "application/json", "Authorization": "Bearer ', @api_key, '"}');

-- 步骤3：调用 sp_invoke_external_rest_endpoint 发送 POST 请求

EXEC sp_invoke_external_rest_endpoint

     @url = @endpoint_url,

     @payload = @payload,

     @method = 'POST',

     @headers = @headers,

     @response = @response_message OUTPUT,

     @timeout = 60; 

-- 步骤5：查看返回结果

SELECT @response_message AS [OpenRouter Response];

看到结果：

图. 调用外部模型返回的结果

返回的部分JSON截图：

图. 部分返回结果JSON化

sp_execute_external_script

在使用库数据库层直接完成推理或特征提取，sp_execute_external_script是 SQL Server 提供的一个系统存储过程，允许在 SQL Server 中直接执行外部脚本语言（如 R、Python 或 Java）的代码，并且可以与数据库中的数据无缝交互。它是 SQL Server 集成机器学习和高级分析能力的核心组件之一。

一个简单的例子：调用 Python + Hugging Face Transformer 做情感分析

图. 使用T-SQL调用外部Python包

结果：

图. 情感分析场景结果

支持 LangChain、Semantic Kernel、EF 等流行 AI 框架

这部分是在SQL Server之外完成的，本质上就是在这些流行的框架中，增加了对SQL Server的驱动支持，其实没什么好说的，例如：

在langchain中，直接支持SQL Server作为数据存储。

图. 将SQL Server作为向量数据源

直接在langchain中进行相似度搜索

图. SDK直接进行相似度搜索

图. 在C#的ORM直接支持相似度搜索

小结

本文基于SQL Server 2024年11月社区私有预览（CTP1.3版本）的初步测试，分享了新功能的体验。SQL Server 2025新增了原生向量支持和DiskANN向量索引，适应当前AI应用需求，可用于RAG、语义理解等场景，支持最高1998维向量存储及余弦、欧氏距离等相似度检索。测试中发现，向量搜索性能可能因缺乏索引或数据未驻留内存而下降，特别是在IO密集场景下表现不理想，但这可能与测试时缺乏官方文档、使用方法不当有关，待后续资料完善后再进一步验证。此外，新功能还包括向量标准化

通过sp_invoke_external_rest_endpoint和sp_execute_external_script实现外部服务调用和脚本执行，扩展了应用场景，但也带来了一些性能和调试上的挑战。同时，SQL Server对LangChain、Semantic Kernel等框架的支持也增强了其生态兼容性。总的来说，SQL Server 2025在功能整合上迈出了重要一步，但实际效果还有待更多文档支持和优化验证。

SQL Server 2025 AI相关能力初探的更多相关文章

sql server Service Broker 相关查询
sql server Service Broker 相关查询 -- 查看传输队列中的消息 --如果尝试从队列中移除时,列将表明哪里出现了问题 select * from sys.transmissio ...
SQL数据同步到ELK（四）- 利用SQL SERVER Track Data相关功能同步数据（上）
一.相关文档老规矩,为了避免我的解释误导大家,请大家务必通过官网了解一波SQL SERVER的相关功能. 文档地址: 整体介绍文档:https://docs.microsoft.com/en-us/ ...
SQL Server ->> 与SQL Server服务配置相关的DMV
1) sys.dm_server_services这个DMV可以告诉我们与当前版本的SQL Server相关的服务的启动状态和最后一次启动的时间,诸如这样的信息. SELECT * FROM sys. ...
MS SQL SERVER索引优化相关查询
查找缺失索引 -- ============================================= -- Description: 查询当前数据库中缺失的索引,知道你进行优化的 ...
sql server使用的相关基础知识
1.表的管理--表和列的命名必须以字母开头长度不能超过128字符不要使用sql server的保留字只能使用如下字符A-Z,a-z,0-9,$,#,_等等 2.表的管理--支持的数据类型字符 ...
Django连接SQL Server，安装相关扩展包及相关配置
1.python下载 https://www.python.org/downloads/windows/ 2.根据当前windows和python的版本,下载pymssql相应的exe安装文件. ht ...
sql server创建表相关
1,设置主键的sql的三种方式 a.字段名 int primary key b.字段名 int constraint 主键名 primary key clustered(字段名) c.创建表是,后置一 ...
补充：sql server 中的相关查询、case函数
相关查询(在同一个表中) 相关查询类似子查询,但是又不同于子查询:子查询中的子条件可以单独查出数据,但是相关查询的子条件不能查处数据.(可以理解成C#中for的穷举法,第一个for走一个,第二个for ...
SQL Server 与内存相关的术语
术语 1. virtual address space 虚拟地址空间它是一个应用程序可以访问的最大地址空间.32位机上是4G(2^32).虚拟地址空间中的数据不一定在物理内存里.可能在缓存文件中. ...
sql server 索引分析相关sql
select object_id('dbo.FT_CFP_TRADE_SUBACCOUNT') select * from sys.partitions where [object_id]=14672 ...

随机推荐

uni-app微信小程序GPS位置获取爬坑
前情 uni-app是我比较喜欢的跨平台框架,它能开发小程序/H5/APP(安卓/iOS),重要的是对前端开发友好,自带的IDE让开发体验也挺棒的,现在所在公司项目有抖音.快手.微信.支付.APP端, ...
黑苹果(Hackintosh) - 问题，修改CPU数量和内存数量后，系统重启失败
1. 问题复现安装完黑苹果后,内存默认的 1个处理器2个核心.2G内存,发现不够用. 于是,修改了 VMware 对此系统的硬件配置内存: 2G -> 8G 处理器:1个处理器 -> ...
PostgreSQL 的特点
title: PostgreSQL 的特点 date: 2024/12/24 updated: 2024/12/24 author: cmdragon excerpt: PostgreSQL 是当今最 ...
《jQueryEasyUI从零开始学》-施尧2018一书的配套源代码和学习资源
<jQueryEasyUI从零开始学>-施尧2018一书的配套源代码和学习资源:下载地址提取码:uuly
vue实现自定义音乐播放器
项目中遇到了,让实现一个音乐播放器的功能.修改其样式要求自定义,切需要有,进度条,时间,开关,应用于H5需要兼容ios与android.简单看一下如图播放器完成代码 audioCom.vue < ...
谈谈flutter的线程
本文同步发布于公众号:移动开发那些事谈谈flutter的线程刚接触flutter的同学肯定会对fluter所谓的单线程架构很蒙逼,因为这与我们学开发时,各种语言里的多线程的介绍有点出入,而且手机的C ...
彻底讲透Spring三级缓存，原理源码深度剖析！
一.前言循环依赖:就是N个类循环(嵌套)引用.通俗的讲就是N个Bean互相引用对方,最终形成闭环.在日常的开发中,我们都会碰到类似如下的代码 @Servicepublic class AService ...
如何快速的开发一个完整的iOS直播app(采集篇)
作者:袁峥链接:https://www.jianshu.com/p/c71bfda055fa来源:简书著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明出处. 开发一款直播app,首先需要 ...
Graph DataBase介绍-图数据库
前言分析社会关系这类复杂图壮结构的海量数据,使用图形数据库(Graph DataBase)是最好的选择.– 作者:李祎 <程序员>介绍各种NoSQL 数据库的文章已经很多,不过大部分都是基 ...
Phi小模型开发教程：用C#开发本地部署AI聊天工具，只需CPU，不需要GPU，3G内存就可以运行，不输GPT-3.5
大家好,我是编程乐趣. 行业诸多大佬一直在说:"‌2025年将是AI应用元年‌",虽然说大佬的说法不一定对,但AI趋势肯定没错的. 对于我们程序员来说,储备AI应用开发技能,不管对 ...

SQL Server 2025 AI相关能力初探