hook in PostgreSQL初探
HOOK IN POSTGRESQL 初探
前言
众所周知,PostgreSQL具有很好的扩展性,是一个可以"开发"的数据库。在PostgreSQL里面,你可以定制你自己的Types、Function、Operation,支持各种过程语言等等。还可以依据自己的喜好修改源码增加新功能。为方便扩展,PostgreSQL提供了很多有用的API、头文件扩展文件夹等等。然而其中一个很重要hook机制却不是特别为人所知,今天我们就来学习下PostgreSQL的hook机制。
hook机制来源于Windows平台。钩子(Hook),是Windows消息处理机制的一个平台,应用程序可以在上面设置子程以监视指定窗口的某种消息,当消息到达后,在目标窗口处理函数之前处理它。钩子机制允许应用程序截获处理window消息或特定事件。钩子实际上是一个处理消息的程序段,通过系统调用,把它挂入系统。每当特定的消息发出,在没有到达目的窗口前,钩子程序就先捕获该消息,亦即钩子函数先得到控制权。这时钩子函数即可以加工处理(改变)该消息,也可以不作处理而继续传递该消息,还可以强制结束消息的传递。
1.常用的hook
PostgreSQL中提供了很多种hook,与上面提到的类似,但是更多的是中断和替换操作。更重要的是该机制提供了一种修改PostgreSQL内核功能却不必修改内核代码的手段,且可以轻松的加载和还原。
首先我们还是看下PostgreSQL中都有哪些常用的hook吧。

其他的还有这些:

2.内部机制
所有的hook都和一个全局函数指针相关。在初始时该函数指针被设置为NULL,表示hook未被使用,当PostgreSQL执行到hook处的时候,如果hook为NULL它什么额外的事情也不做,但是如果hook被设置为某个函数的地址时(当然是你增加的那个函数了,通常是做成一个共享库咯),程序就开始转向你的新增函数中,执行你所期望的各种新功能啦。
那么问题来了,如何设置hook连接到你设置的共享库呢?PostgreSQL的配置文件中给出了shared_preload_libraries参数来加载你的共享库(当然了,设置完是需要重启的)。那么问题就又回到了:如何写一个被PostgreSQL所接受的共享库呢?
你至少要实现这三个函数:
_PG_init()
your_hook_function()
_PG_fini()
我们慢慢说。
首先,当PostgreSQL加载共享库(create extension xxxx)时,它需要把共享库加载到内存中。这时需要你写一个_PG_init函数,这种函数你在PostgreSQL源码的contrib目录下很容易找到,大概就像下面这样:
_PG_init()
{
prev_ExecutorRun_hook = ExecutorRun_hook;
ExecutorRun_hook = your_function_hook;
}
保存当前的hook值(保证你移除修改后能够还原),并将你的hook挂在到PostgreSQL的hook函数指针上。
那么与之相对应的,你要写一个_PG_fini函数在卸载(drop extension xxxx)的时候使用,也就是移除你的hook并且把它重置为之前的指针值。
_PG_fini()
{
ExecutorRun_hook = prev_ExecutorRun_hook;
}
这两个函数加上你的hook函数(your_hook_function())就构成了最基础的PostgreSQL的hook了。
3.举例说明
下面我们以上面提到的ClientAuthentication_hook举例说明吧。
这个hook的作用是帮助你在client得到验证之后并且服务端还未给client反馈的时候运行你的代码(contrib目录下的auth_delay和sepgsql使用了这个hook)。
首先,这个hook指针声明在
src/include/libpq/auth.h, line 27
/* Hook for plugins to get control in ClientAuthentication() */
typedef void (*ClientAuthentication_hook_type) (Port *, int);
extern PGDLLIMPORT ClientAuthentication_hook_type ClientAuthentication_hook;
它的调用点,也就是hook所在的位置是:
src/backend/libpq/auth.c, line 215
/*
* This hook allows plugins to get control following client authentication,
* but before the user has been informed about the results. It could be used
* to record login events, insert a delay after failed authentication, etc.
*/
ClientAuthentication_hook_type ClientAuthentication_hook = NULL;
我们可以看到该hook初始化为NULL。具体到函数里,它出现在:
src/backend/libpq/auth.c, line 580
if (ClientAuthentication_hook)
(*ClientAuthentication_hook) (port, status);
这很明显,就是如果你写好了一个ClientAuthentication_hook并且通过我们上面提到的方法把它挂到了ClientAuthentication_hook上,那么你的hook就会在这里被调用。
对于ClientAuthentication_hook,我们看到他有两个入参,分别是:
port PostGreSQL内部的一个Port结构体(定义在include/libpq/libpq-be.h)
Status 是PostgreSQL内部的状态码:STATUS_ERROR, STATUS_OK
那么我们写一个完整的extension吧,它的作用是 will deny connections if a specific file is present。
首先写一个初始化函数初始化hook。
static ClientAuthentication_hook_type next_client_auth_hook = NULL;
/* Module entry point */
void
_PG_init(void)
{
next_client_auth_hook = ClientAuthentication_hook;
ClientAuthentication_hook = my_client_auth;
}
很简单,我们先保存之前的hook值,在设置上我们自己的hook函数。
记住,初始化必须要在_PG_init函数里面做,该函数在PostgreSQL加载你的共享库的时候被调用。
然后就是咱们的hook函数,在这里你自由发挥,写下你想干的事儿,比如:
static void my_client_auth(Port *port, int status)
{
struct stat buf;
if (next_client_auth_hook)
(*next_client_auth_hook) (port, status);
if (status != STATUS_OK)
return;
if(!stat("/tmp/connection.stopped", &buf))
ereport(FATAL, (errcode(ERRCODE_INTERNAL_ERROR),
errmsg("Connection not authorized!!")));
}
这里,如果之前已经设置过ClientAuthentication_hook的话,我们不妨大方的先让他做完好了,然后如果Client的Authentication都不OK的话(都没通过验证),那我们后面的deny操作不是多余么,那就return吧。最后,我们再做我们事:如果不存在connection.stopped文件,我们拒绝connection。Wow,很cool很上帝。
最后,你再写一个_PG_fini咯:
_PG_fini(void)
{
ClientAuthentication_hook = next_client_auth_hook;
}
自此,c文件里面的活我们干完了。剩下的我们写这几个文件
Makefile
your_extension--1.0.control
your_extension--1.0.sql
首先,对于Makefile我们知道是用来编译c程序的。它大概是这样:
MODULE_big = your_hook
OBJS = your_hook.o
ifdef USE_PGXS
PG_CONFIG = pg_config
PGXS := $(shell $(PG_CONFIG) --pgxs)
include $(PGXS)
else
subdir = contrib/your_hook
top_builddir = ../..
include $(top_builddir)/src/Makefile.global
include $(top_srcdir)/contrib/contrib-global.mk
endif
通常你是要在PostgreSQL的源码目录结构中编译它,这样你就要在contrib目录下建立你自己的目录(这一点可以参考该目录下的其他extension),然后make。如果你不想在PostgreSQL的源码目录结构中编译它,of course,你可以使用PGXS选项,它定义在PostgreSQL的pg_config命令里。然后你就执行make USE_PGXS=1 吧。当然,你需要设置pg_config到你的PATH里面。
编译完了之后,你就make install吧,把你的共享库装载到PostgreSQL的lib目录中去。
而对于剩下的两个文件最后会被安装到PostgreSQL的share/extension目录下。
your_extension--1.0.control里面主要是写一些控制信息,
your_extension--1.0.sql用于创建一些你需要的数据库对象,比如表,触发器,函数等等。
而这两个文件在这个简单的例子里暂时用不到。我们后面再细说。
在这之后把你的共享库加入到Postgreql.conf文件的shared_preload_libraries中,重启数据库。
然后你就尽情的用起来吧。
这里说的比较简单,敬请期待第二部进阶版+_+
参考文献:http://wiki.postgresql.org/images/e/e3/Hooks_in_postgresql.pdf
hook in PostgreSQL初探的更多相关文章
- PostgreSQL的hook机制初步学习
磨砺技术珠矶,践行数据之道,追求卓越价值 回到上一级页面:PostgreSQL内部结构与源代码研究索引页 回到顶级页面:PostgreSQL索引页 本文的目的一是为了备忘,二是为了抛砖引玉,希望 ...
- 初探hook的键盘获取
初探hook的键盘获取 import pyHook import pythoncom class e(): keyIsPressed = False #键盘是否按下 按住.. def onKeyDow ...
- postgreSQL数据库的初探
kali是黑客的强大武器,还有一个也是哦——Metasploit postgreSQL数据库是Metasploit的默认数据库哦! 启动postgresql: service postgresql s ...
- [React]Hook初探
Hook是什么 Hook是React从16.8开始支持的特性,使用Hook可以在不使用class时使用state Hook支持在不需要修改组件状态的情况下复用逻辑状态,从而解决使用render pro ...
- [转]初探Metasploit的自动攻击
1. 科普Metasploit 以前只是个Back Track操作系统(简称:BT) 下的攻击框架,自成继承了后攻击渗透模块,隐隐有成为攻击平台的趋势. 我们都戏称它为美少妇,很简单,msf. 它 ...
- PostgreSQL与RPM
如何查看使用PostgreSQL的RPM包安装后的文件目录及相关路径(PostgreSQLRPM的spec文件已经帮我们创建好了postgres用户及postgres组). 查看RPM文档信息:/us ...
- PostgreSQL内部结构与源代码研究索引页
磨砺技术珠矶,践行数据之道,追求卓越价值 luckyjackgao@gmail.com 返回顶级页:PostgreSQL索引页 本页记录所有本人所写的PostgreSQL的内部结构和源代码研究相关文摘 ...
- Linux系统初探过程总结
Linux系统初探的过程大约用了一周的时间,这周基本将Linux系统安装,PostgreSQL安装,Nginx服务器安装,ASP.NET Core应用部署都走了一遍.由于以前没有怎么接触和使用过Lin ...
- 钩子编程(HOOK) 屏蔽全部按键、鼠标及系统功能键 (4)
摘要:上篇文章<钩子编程(HOOK) 安装系统全局钩子>已经具体的解说了全局钩子的安装.本文将增强一下钩子的功能.实现屏蔽全部按键鼠标与系统功能键.要实现这个功能.须要安装两个全局钩子,& ...
随机推荐
- GCD hdu1695容斥原理
GCD Time Limit: 6000/3000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Submiss ...
- Number Complement
Given a positive integer, output its complement number. The complement strategy is to flip the bits ...
- 简单说明如何设置系统中的NLS_LANG环境变量
概述:本地化是系统或软件运行的语言和文化环境.设置NLS_LANG环境参数是规定Oracle数据库软件本地化行为最简单的方式.NLS_LANG参数不但指定了客户端应用程序和Oracle数据库所使用的语 ...
- 关于AVALON总线动态地址对齐
在NIOS的使用中,我们往往要用到自定义外设,然后通过AVALON交换架构和NIOSII进行通信. AVALON总线,其实是一种交换架构的协议,在自定义外设挂在AVALON总线上时,一定要注意地址对齐 ...
- 【转】wireshark基本用法及过虑规则
Wireshark 基本语法,基本使用方法,及包过虑规则: 1.过滤IP,如来源IP或者目标IP等于某个IP 例子: ip.src eq 192.168.1.107 or ip.dst eq 19 ...
- python之decode、encode及codecs模块
一.先说说编解码问题 编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码. Eg: str ...
- c# 图片转二进制/字符串 二进制/字符串反转成图片
protected void Button1_Click(object sender, EventArgs e) { //图片转二进制 byte[] imageByte = GetPictureDat ...
- django celery的分布式异步之路(二) 高并发
当你跑通了前面一个demo,博客地址:http://www.cnblogs.com/kangoroo/p/7299920.html,那么你的分布式异步之旅已经起步了. 性能和稳定性是web服务的核心评 ...
- centos 7.3二进制安装mariadb10.2.8完美步骤
(1)在centos7系统上,yum info mariadb可以找到提供mariadb包的官方网站,在到官方网站下载最新的mariadb包,然后rz到linux系统上去 (2)准备用户 1.user ...
- 热门开源项目:Guns-后台管理系统
Guns基于SpringBoot,致力于做更简洁的后台管理系统,完美整合springmvc + shiro + mybatis-plus + beetl!Guns项目代码简洁,注释丰富,上手容易,同时 ...