Session 的原理及最佳实践
Http协议是基于请求和响应的一种无状态的协议,而通过session可以使得Http应用变得有状态,即可以“记住”客户端的信息。今天就来说说这个session和cookie。
Session 的原理
session是在服务器端保持用户会话数据的一种方法,对应的cookie是在客户端保持用户数据。为了在客户端(比如浏览器)可以跨页面交流数据,Netscape将cookie引入浏览器。所以,cookie是保存在浏览器端的。
那么服务器是如何获取这些浏览器的cookie的呢?是通过超全局变量$_COOKIE。就是说,服务端在接到请求(request)的时候通过这个$_COOKIE获取客户端的数据,而在响应(respsonse)的时候又通过$_COOKIE这个变量把数据传给客户端;对于客户端,通过$_COOKIE将自己的数据发送给服务端,而又通过$_COOKIE获取服务端方面想要传递的值。这是服务端和客户端交流数据cookie的方式。这里说的客户端,可以是浏览器,也可以是别的;相同的浏览器,不同的网页发的请求都属于统一客户端;不同浏览器发的相同请求属于不同的客户端。
那么服务器是如何记住众多用户的会话数据呢?首先要将客户端和服务端建立一一对应关系,使得每个客户端都要一个唯一标示,这样,服务器才能识别出来。建立唯一标识的方法是通过cookie或者通过GET方式在服务端建立session。php在使用session的时候,默认的会建立一个名叫"PHPSESSID"的cookie,值是唯一的(这个名字可以通过php.ini修改session.name值去改,这个唯一值的生成方式也可以修改),并在某个文件(session.save_path目录)下保存一个文件(文件名唯一由刚刚生成的那个PHPSESSID cookie决定),然后发送给客户端,客户端在再次发送请求的时候,就会把这个名叫"PHPSESSID"的cookie带过来,也就是$_COOKIE["PHPSESSID"],这个cookie的值不是session本身,而是一个session_id,一个和客户端一一对应的id。
php会根据这个session_id去找对应的session文件。比如:sess_vv9lpgf0nmkurgvkba1vbvj915,这里的vv9lpgf0nmkurgvkba1vbvj915就是一个session_id。这个文件和客户端也是一一对应的。这里面保存的值就是对应这个客户端在服务端所保存的数据。
使用Session之前为什么必须先执行session_start()?
了解的原理之后,所谓的session其实就是客户端一个session id服务器端一个session file。新建session之前执行session_start()是告诉服务器要种一个cookie($_COOKIE["PHPSESSID"])以及准备好对应的session文件,然后再发送出去,是谁发过来的请求,谁就会获得这个唯一的标示。读取session之前执行session_start()是告诉服务器,赶紧根据从客户端发过来的$_COOKIE中去获取$_COOKIE["PHPSESSID"]这个session_id,然后去某个路径下获取由session_id决定的唯一的文件(sess_vv9lpgf0nmkurgvkba1vbvj915),再把值读取出来。
需要注意的是:
- PHPSESSID这个名称是可以配置的
- ession保存的位置也是可以配置的通过php.ini中session.save_path设置,甚至,可以通过别的方式保存在数据库或者缓存中
- 在存session时限序列化,读取的时候,先反序列化
这就是session的实现机制和原理。在机制不变的情况下,每个环节的实现方式几乎都可以自定义。比如可以在这些方面实现自定义:
- 如果客户端不支持cookie,你也可以通过GET方式将session id发送到服务端
- 如果你想改变唯一session_id的生成方式,你也可以选择用uniqid
- 你也可以改变session存放的路径
- 可以改变session文件的前缀,后缀
- 甚至你可以把session存在数据库,缓存当中
因此,session的使用方式灵活多样,前提是你了解这个实现机制。大部分上面的DIY都可以在php.ini中通过配置实现。下面我们介绍下如何实现将session保存在除文件以外别的媒介中,毕竟,文件也只是一种而已。
自定义存储
要想将session保存在别的媒介(比如缓存)需要先介绍一个接口:SessionHandlerInterface
可以通过实现这个接口,来自定义session的存贮方式,比如数据库。当然,要实现一些基本的方法。
SessionHandlerInterface {
/* 方法 */
abstract public bool close ( void )
abstract public bool destroy ( string $session_id )
abstract public bool gc ( string $maxlifetime )
abstract public bool open ( string $save_path , string $name )
abstract public string read ( string $session_id )
abstract public bool write ( string $session_id , string $session_data )
}
比如自己来重新写一个:
<?php
class MySessionHandler implements SessionHandlerInterface
{
private $savePath;
public function open($savePath, $sessionName)
{
$this->savePath = $savePath;
if (!is_dir($this->savePath)) {
mkdir($this->savePath, 0777);
}
return true;
}
public function close()
{
return true;
}
public function read($id)
{
return (string)@file_get_contents("$this->savePath/sess_$id");
}
public function write($id, $data)
{
return file_put_contents("$this->savePath/sess_$id", $data) === false ? false : true;
}
public function destroy($id)
{
$file = "$this->savePath/sess_$id";
if (file_exists($file)) {
unlink($file);
}
return true;
}
public function gc($maxlifetime)
{
foreach (glob("$this->savePath/sess_*") as $file) {
if (filemtime($file) + $maxlifetime < time() && file_exists($file)) {
unlink($file);
}
}
return true;
}
}
$handler = new MySessionHandler();
session_set_save_handler($handler, true);
session_start();
如果是缓存(如memcached或者redis),就应该持有一个Cache或者Redis实例,并委托这个实例来实现open/close/read/write功能,整体不复杂,重在规范。
至于这个gc值得介绍下,为啥要有个gc?因为session总要有个过期或者失效时间,因此启用一个garbage collection机制,也就是几率性回收机制,。但是问题又来了,为啥不每次都去检测下当前过期的session并除之而后快呢?这里涉及到一个性能问题,对session读写操作是频繁的,如果每次都要在session操作时在所有的session当中检测下哪些过期,哪些没有过期,是不是太低效了点?尤其是session保存在文件中时尤其如此,一个session就是一个文件,客户连接数一多,文件的数量将非常巨大。因此不用每次检查,而是按照一定几率去回收,这样性能就不至于收到太大影响,在足够多次数访问后,绝大多数过期session也能得到清理。
那么,这又牵扯进另一个问题——什么是过期的session?
Session的过期问题
在php中设置session有很多方面,包括给session设置值或直接设置过期、失效和有效期。
服务端方面
在PHP中主要通过设置session.gc_maxlifetime来设定Session的生存周期:
ini_set('session.gc_maxlifetime', 3600); //设置时间
ini_get('session.gc_maxlifetime');//得到ini中设定值
超过这个gc_maxlifetime时间,session会被认为是garbage,有垃圾就有垃圾回收,但是垃圾回收的检查却不是每次都进行,而是按照一个几率,分别是这两个参数:
session.gc_probability = 1
session.gc_divisor = 1000
那么,每次请求,垃圾会被回收的概率就是 session.gc_probability / session.gc_divisor = 1/1000
所以,在服务端方面,session主要和session.gc_maxlifetime有关,次要和session.gc_probability及session.gc_divisor有关;
客户端方面
主要和cookie的过期时间有关。php.ini中通过session.name = PHPSESSID来保存session的cookie名字默认为PHPSESSID(可以修改),那么可以设定这个cookie的过期时间来实现session的过期。
session.use_cookies = 1;
把这个的值设置为1,利用cookie来传递sessionid;
session.cookie_lifetime = 0
这个代表SessionID在客户端Cookie储存的时间,默认是0,代表浏览器一关闭sessionid就作废。如果想使得PHPSESSID cookie永久有效,这个可以设为一个很大的值如999999999。另外也可以通过session_set_cookie_params()函数来设定PHPSESSID cookie的有效期
结论
不管是设置Session的为N秒过期还是永不过期,都要同时设定session.gc_maxlifetime和session.cookie_lifetime为同一值N;永不过期时可以设定为一个非常大的值(如9999999)
设置session过期的例子
有个设置session过期时间的例子可以参考下:
function start_session($expire = 0)
{
if ($expire == 0) {
$expire = ini_get('session.gc_maxlifetime');
} else {
ini_set('session.gc_maxlifetime', $expire);
}
if (empty($_COOKIE['PHPSESSID'])) {
session_set_cookie_params($expire);
session_start();
} else {
session_start();
setcookie('PHPSESSID', session_id(), time() + $expire);
}
}
使用方法:
//600秒以后过期
start_session(600);
最佳实践
session_start() 会创建新会话或者重用现有会话,与之相反session_commit()/session_write_close()即保存当前session数据,并且关闭当前会话。前者是open+read,后者是write+close,由此可见session_commit的重要性了吧?
为了防止并发的写session,任何时刻只能允许有一个PHP脚本在操作session,因此,一个脚本一旦session_start打开session,那么在此脚本终止或者调用session_write_close()之前,别的任何脚本都不能使用session。在默认情况下脚本结束时会自动写入和关闭session,但是在脚本执行时间比较长的时候,此脚本就一致占据锁使得别的脚本无法使用session,因此导致许多错误。
因此,最佳实践是,任何session变量,数据的更改(如$_SESSION[xx] = xxx),都要及时使用session_commit()保存数据,关闭会话。
下面介绍一个有可能在单点登录中会用到的例子:
//从数据库中获取先前登录的session_id
$pre_sid = $user_session['session_id'];
//当前登录的session_id
$now_sid = session_id();
//先将当前会话置为$pre_sid
session_id($pre_sid);
//open+read之前的会话数据
session_start();
//unset()掉之前会话数据
session_unset();
//write+close之前的会话数据
session_commit();
//再将会话设置成当前的
session_id($now_sid);
//open+read当前的会话数据
session_start();
$_SESSION['username'] = $username;
//write+close当前的会话数据
session_commit();
Session 的原理及最佳实践的更多相关文章
- Spark Shuffle调优原理和最佳实践
对性能消耗的原理详解 在分布式系统中,数据分布在不同的节点上,每一个节点计算一部份数据,如果不对各个节点上独立的部份进行汇聚的话,我们计算不到最终的结果.我们需要利用分布式来发挥Spark本身并行计算 ...
- 学习笔记TF061:分布式TensorFlow,分布式原理、最佳实践
分布式TensorFlow由高性能gRPC库底层技术支持.Martin Abadi.Ashish Agarwal.Paul Barham论文<TensorFlow:Large-Scale Mac ...
- SVN分支/合并原理及最佳实践
转自:http://blog.csdn.net/e3002/article/details/21469437 使用svn几年了,一直对分支和合并敬而远之,一来是因为分支的管理不该我操心,二来即使涉及到 ...
- (转)SVN分支/合并原理及最佳实践
先说说什么是branch.按照Subversion的说法,一个branch是某个development line(通常是主线也即trunk)的一个拷贝,见下图: branch存在的意义在于,在不干扰t ...
- Docker镜像原理和最佳实践
https://yq.aliyun.com/articles/68477 https://yq.aliyun.com/articles/57126 DockerCon 2016 深度解读: Dock ...
- SparkShuffle调优原理和最佳实践
在网络层,互联网提供所有应用程序都要使用的两种类型的服务,尽管目前理解这些服务的细节并不重要,但在所有TCP/IP概述中,都不能忽略他们: 无连接分组交付服务(Connectionless Packe ...
- Spring Boot学习笔记2——基本使用之最佳实践[z]
前言 在上一篇文章Spring Boot 学习笔记1——初体验之3分钟启动你的Web应用已经对Spring Boot的基本体系与基本使用进行了学习,本文主要目的是更加进一步的来说明对于Spring B ...
- 一篇文章彻底搞懂snowflake算法及百度美团的最佳实践
写在前面的话 一提到分布式ID自动生成方案,大家肯定都非常熟悉,并且立即能说出自家拿手的几种方案,确实,ID作为系统数据的重要标识,重要性不言而喻,而各种方案也是历经多代优化,请允许我用这个视角对分布 ...
- 彻底搞懂snowflake算法及百度美团的最佳实践
写在前面的话 一提到分布式ID自动生成方案,大家肯定都非常熟悉,并且立即能说出自家拿手的几种方案,确实,ID作为系统数据的重要标识,重要性不言而喻,而各种方案也是历经多代优化,请允许我用这个视角对分布 ...
随机推荐
- HighGUI图形图像界面初步—— 图像的载入、显示与输出
HighGUI模块为高层GUI图形用户界面模块,包含媒体的输入输出.视频捕捉.图像和视频的编解码.图形交互界面的接口等. 在本章中,我们将学到: 图像的载入.显示和输出到文件的详细分析 滑动条的创建和 ...
- Shell脚本编程学习入门 02
Shell脚本编程学习入门是本文要介绍的内容,我们可以使用任意一种文字编辑器,比如gedit.kedit.emacs.vi等来编写shell脚本,它必须以如下行开始(必须放在文件的第一行): #! ...
- sudo:无法解析主机 解决方案
你如果电脑中没有vim,用gedit也可以. 打开文件以后,将其中的 127.0.1.1 xxxxx xxx 替换成你电脑的自己的名字即可.
- AlarmManager(全局定时器/闹钟)详解
AlarmManager的使用机制有的称呼为全局定时器,有的称呼为闹钟.指定时长或以周期形式执行某项操作.通过对它的使用,个人觉得叫全局定时器比较合适,其实它的作用和Timer有点相似.都有两种相似的 ...
- 【mongodb系统学习之九】mongodb保存数据
九.mongodb保存数据: 1).插入.保存数据:insert:语法db.collectionName.insert({"key":value}),key是字段名,必须是字符串( ...
- PCI设备内存操作函数总结
1. ExAllocatePool() 函数说明: ExAllocatePool allocates pool memory of the specified type and returns a ...
- iOS - Quartz 2D 二维绘图
1.Quartz 2D 简介 Quartz 2D 属于 Core Graphics(所以大多数相关方法的都是以 CG 开头),是 iOS/Mac OSX 提供的在内核之上的强大的 2D 绘图引擎,并且 ...
- 【SPOJ】Longest Common Substring(后缀自动机)
[SPOJ]Longest Common Substring(后缀自动机) 题面 Vjudge 题意:求两个串的最长公共子串 题解 \(SA\)的做法很简单 不再赘述 对于一个串构建\(SAM\) 另 ...
- 【BZOJ4650】【NOI2016】优秀的拆分(后缀数组)
[BZOJ4650][NOI2016]优秀的拆分(后缀数组) 题面 BZOJ Uoj 题解 如果我们知道以某个位置为开始/结尾的\(AA\)串的个数 那就直接做一下乘法就好 这个怎么求? 枚举一个位置 ...
- 【CJOJ P1957】【NOIP2010冲刺十模拟赛】数字积木
[NOIP2010冲刺十模拟赛]数字积木 Description 小明有一款新式积木,每个积木上都有一个数,一天小明突发奇想,要是把所有的积木排成一排,所形成的数目最大是多少呢? 你的任务就是读入n个 ...