HTTP协议学习
面试过程中又一个常见的问题,http协议,因为做服务器开发如果用http协议的话,现在各种开源软件都封装好了,python中只需要简单的继承定义好的类,重写get或者post等方法,几行代码就可以搭建起来一个简单的http服务器,导致底层对程序员来说都是透明的了。但是面试中追求这个底层的问题还不少,所以最近入手了一本据说一天入门http协议的书籍《图解http》阅读一番,才觉http协议原来是这个样子~这里总结一下自己的学习心得吧。
现在理解http协议其实只是一些规定好的通信标准,其实发送的均为字符串,去处理字符串即可。(不知道这句话能不能理解,后面会再次解释一下)。
HTTP协议在TCP/IP协议栈中属于应用层协议,如果基于SSL或者TSL,这个协议就演变为更加安全的HTTPS协议。默认HTTP端口号80,HTTPS默认端口号443。
与HTTP协议协同工作的重要协议DNS,TCP,IP等协议,其中DNS同为应用层协议。

HTTP协议规定,请求从客户端发出,最后服务器端响应该请求并返回。这是目前HTTP协议的规定,服务器不支持主动响应,所以目前的HTTP协议版本都是基于请求,然后响应的这种模型。

另外,HTTP协议是一种无状态的应用层协议,即使同一个客户端的两次连续请求,在协议规定中也没有对应关系。所以为了解决无状态的这个问题,存在其他的技术解决方案进行补充。
HTTP请求报文和响应报文:
请求报文: 请求方法 , 请求URI , 协议版本 , 可选的请求首部字段和内容实体。(严格定义的字符串)

响应报文:协议版本 , 状态码 , 用以解释状态码的原因短语 , 可选的响应首部字段以及实体主体。(严格定义的字符串)

以上两个截图自己利用socket写了一个简单的服务端和客户端程序,分别用浏览器发送请求和向百度发送请求得到的字符串打印。HTTP具体还是基于TCP协议的,所以各种HTTP服务器底层应该是同样的机制,不过它们处理了很多关于HTTP协议处理的部分,这部分更多的感觉是协议规定好的字符串的内容,各种方法,各种头的属性。
HTTP请求,响应的模拟
另外除了自己利用socket去编辑,更简单观察相应的方法可以利用telnet去发送http请求头至百度。
telenet 开启方法 控制面板-程序-window程序开启与关闭-开启telnet客户端,这样就能够在cmd中使用telnet命令了。使用起来不是很方便。
异或是利用wireshark直接去抓取你访问某个网站整个过程的数据包也可以观察~。以下是抓取的请求www.baidu.com的数据包。

整个请求,响应过程包过滤后如下:

其中可以可到tcp的三次握手,以及请求,响应的过程。但是其中有几个包内容是TCP segment of a reassembled PDU不是很清楚,可以看到,tcp每次发送均有响应的ACK回应。具体的TCP得参考TCP协议的知识。
另外HTTP1.0和HTTP1.1的有一个主要区别就是HTTP1.1引入了持续连接的概念,不然完成一次请求必然导致TCP三次握手成本太高,引入持续连接的概念提高传输的效率。
HTTP请求支持的方法
GET 请求获取Request-URI所标识的资源
POST 在Request-URI所标识的资源后附加新的数据
HEAD 请求获取由Request-URI所标识的资源的响应消息报头
PUT 请求服务器存储一个资源,并用Request-URI作为其标识
DELETE 请求服务器删除Request-URI所标识的资源
OPTIONS 请求查询服务器的性能,或者查询与资源相关的选项和需求
TRACE 请求服务器回送收到的请求信息,主要用于测试或诊断
CONNECT 隧道机制
HTTP的状态响应码
1XX:指示信息,请求收到,继续处理
2XX:成功,操作成功收到,分析,接受
3XX:完成请求必须进一步处理,重定向
4XX:请求包含一个错误语法,不能完成。指示客户端错误
5XX:服务器执行一个有效请求失败,指示服务端错误
其他HTTP重要的知识就是报头信息中的具体字段信息:
报头字段的格式为 (名字)“:”(空格)(值);
通用报头字段:
Cache-Control
Date
Connection
请求报头字段:
Accept
Accept-Charset
Accept-Encoding
Accept-Language
Authorization
Host
User-Agent
响应报头字段:
Location
Server
实体报头字段:
Content-Encoding
Content-Language
Content-Length
Content-Type
Last-Modified
Expires
最后贴出自己利用winsock实现的测试http内容的简单程序:
实现流程图如下:

//TCP 客户端
#include <iostream>
#include <stdio.h>
#include <stdlib.h>
#include <windows.h>
#include <string.h>
#include <string>
using namespace std;
#pragma comment(lib,"ws2_32.lib")
#define PORT 8080
#define BACKLOG 10
int main(void) {
//client module
WSADATA r_wsadata;
if( WSAStartup(MAKEWORD(2,2),&r_wsadata) ) {
cout<<"WSAStartup error"<<endl;
WSACleanup();
}
SOCKET client_s;
if( (client_s = socket(AF_INET,SOCK_STREAM,0)) == INVALID_SOCKET ) {
cout<<"socket error"<<endl;
WSACleanup();
}
sockaddr_in server_addr;
server_addr.sin_family = AF_INET;
server_addr.sin_port = htons(80);
server_addr.sin_addr.s_addr = inet_addr("202.108.22.5");
if( connect(client_s,(sockaddr *)&server_addr,sizeof(server_addr)) ) {
cout<<"connect error"<<endl;
WSACleanup();
}
char *sbuf ="GET / HTTP/1.1\r\nHost:www.baidu.com\r\nUser-Agent: Mozilla/5.0 (Windows NT 5.1; rv:10.0.2) Gecko/20100101 Firefox/10.0.2\r\nAccept-Language: zh-cn,zh;q=0.5\r\nAccept-Encoding: gzip, deflate\r\nConnection:Keep-Alive\r\n\r\n";
char *sbuf1 ="GET / HTTP/1.1\r\nHost:www.baidu.com\r\nUser-Agent:Mozilla/5.0 (Windows;U;Windows NT 5.1; en-US; rv:1.7.6)\r\nGecko/20050225 Firefox/1.0.1\r\nConnection: Keep Alive\r\n\r\n";
int len = strlen(sbuf) + 1;
int sendlen = 0;
int res = send(client_s,sbuf,len,0);
char buf[10240];
int recvlen = recv(client_s,buf,sizeof(buf),0);
if(recvlen > 0)
buf[recvlen] = '\0';
cout<<string(buf)<<endl;
system("pause");
}
//TCP
//服务器端程序
#include <iostream>
#include <stdio.h>
#include <stdlib.h>
#include <windows.h>
#include <string.h>
#include <string>
using namespace std;
#pragma comment(lib,"ws2_32.lib")
#define PORT 8080
#define BACKLOG 10
int main(void) { //server module
WSADATA r_wsadata;
if( WSAStartup(MAKEWORD(2,2),&r_wsadata) ) {
cout<<"WSAStartup error"<<endl;
WSACleanup();
exit(0);
} SOCKET server_s;
if( ( server_s = socket(AF_INET,SOCK_STREAM,0) ) == INVALID_SOCKET ) {
cout<<"socket error"<<endl;
WSACleanup();
exit(0);
}
sockaddr_in server_s_addr;
server_s_addr.sin_family = AF_INET;
server_s_addr.sin_port = htons(PORT);
server_s_addr.sin_addr.s_addr = INADDR_ANY;
if( bind(server_s,(sockaddr *)&server_s_addr,sizeof(server_s_addr)) ) {
cout<<"bind error"<<endl;
WSACleanup();
exit(0);
}
if( listen(server_s,BACKLOG) ) {
cout<<"listen error"<<endl;
WSACleanup();
exit(0);
}
while(true) {
SOCKET accept_socket;
sockaddr_in client_s_addr;
int addr_len = sizeof(client_s_addr);
if( (accept_socket = accept(server_s,(sockaddr *)&client_s_addr,&addr_len)) == -1 ) {
cout<<"accept error"<<endl;
WSACleanup();
exit(0);
}
cout<<"request from host:"<<string( inet_ntoa(client_s_addr.sin_addr) )<<endl;
cout<<"-----------------------http request----------------------"<<endl;
//receive
char buf[1024];
int readLen = -1;
while(readLen < 0)
readLen = recv(accept_socket,buf,sizeof(buf),0);
buf[readLen] = '\0';
cout<<string(buf)<<endl;
closesocket(accept_socket);
}
}
HTTP协议学习的更多相关文章
- TCP/IP协议学习(五) 基于C# Socket的C/S模型
TCP/IP协议作为现代网络通讯的基石,内容包罗万象,直接去理解理论是比较困难的:然而通过实践先理解网络通讯的理解,在反过来理解学习TCP/IP协议栈就相对简单很多.C#通过提供的Socket API ...
- http协议学习系列
深入理解HTTP协议(转) http://www.blogjava.net/zjusuyong/articles/304788.html http协议学习系列 1. 基础概念篇 1.1 介绍 H ...
- BGP协议学习总结
BGP学习总结 BGP是目前使用的唯一的自治系统间的路由协议,它是一种矢量路由协议,基于TCP的179号端口,它采用单播增量更新的方式更新路由,与其他的路由协议不同的是,BGP只要TCP可达,就可以建 ...
- TCP/IP协议学习之实例ping命令学习笔记
TCP/IP协议学习之实例ping命令学习笔记(一) 一. 目的为了让网络协议学习更有效果,在真实网络上进行ping命令前相关知识的学习,暂时不管DNS,在内网中,进行2台主机间的ping命令的整个详 ...
- HTTP协议学习笔记(四)
HTTP协议学习笔记(四) 与 HTTP 协作的 Web 服务器 一台 Web 服务器可搭建多个独立域名的 Web 网站,也可作为通信路径上的中转服务器提升传输效率. 1.用单台虚拟主机实现多个域名 ...
- HTTP协议学习笔记(三)
HTTP协议学习笔记(三) 1.状态码告知从服务器端返回的请求结果 状态码的职责是当客户端向服务端向服务端发送请求时,描述返回的请求结果.借助状态码,用户可以知道服务端是正常处理了请求,还是出现了错误 ...
- HTTP协议学习笔记(二)
HTTP协议学习笔记(二) 1.HTTP报文 HTTP报文:用于HTTP协议交互的信息.请求报文:请求端(客户端)的HTTP报文叫做请求报文.响应报文:响应端(服务端)的HTTP报文叫做响应报文. H ...
- HTTP协议学习笔记(一)
HTTP协议学习笔记(一) 1.HTTP协议用于客户端和服务端之间的通信 客户端:请求访问文本或图像等资源的一端服务端:提供资源响应的一端 在两台计算机之间使用HTTP协议通信时,在一条通信线路上必定 ...
- 网关协议学习:CGI、FastCGI、WSGI
网关协议学习:CGI.FastCGI.WSGI https://www.biaodianfu.com/cgi-fastcgi-wsgi.html
- 苹果ANCS协议学习【转】
苹果ANCS协议学习 转自:http://www.cnblogs.com/alexcai/p/4321514.html 综述 苹果通知中心(Apple Notification Center Serv ...
随机推荐
- Getting the first day in a week with T-SQL
A colleague just asked me if I knew a way to get the first day in a week in SQL Server. While I'm su ...
- SQL SERVER--单回话下的死锁
很多时候,死锁由两个或多个会话请求其他Session持有的锁而同时又持有其他Session,但也有一些特殊的死锁仅由单个Session锁触发,今天看到一篇相关的文章,搬运过来与各位共享! 引发死锁的代 ...
- [51单片机] EEPROM 24c02 [I2C代码封装-保存实现流水灯]
这里把EEPROM 24c02封装起来,今后可以直接调用,其连线方式为:SDA-P2.1;SCL-P2.0;WP-VCC >_<:i2c.c /*--------------------- ...
- [C++] socket -7 [邮槽]
::利用邮槽实现windons进程通信 ::一般情况下CreateMailslot()常被使用在进程通信的服务器上,在客户端则是用函数CreateFile()打开指定的邮槽之后进行相关的操作. ::将 ...
- Win10年度更新开发必备:VS2015 Update 3正式版下载汇总
微软在06月27日发布了Visual Studio 2015 Update 3 .在MSDN中微软也提供下载,而且MSDN的Visual Studio 2015 Update 3与官方免费下载的文件是 ...
- [Python爬虫] 在Windows下安装PhantomJS和CasperJS及入门介绍(上)
最近在使用Python爬取网页内容时,总是遇到JS临时加载.动态获取网页信息的困难.例如爬取CSDN下载资源评论.搜狐图片中的“原图”等,此时尝试学习Phantomjs和CasperJS来解决这个问题 ...
- django with mysql (part-2)
step01: write a ( views.py ) file vim views.py Insert the below code : step02: configure your ( urls ...
- jQuery自动分页打印表格(HTMLtable),可以强制换页
最近做项目的时候需要做批量打印订单,一个订单可能在最后一页是的内容是不足一页的,这时候下一个订单需要下一页打印,这样就需要强制换页.在下一页再打印下一个订单 部分代码: 部分重要的css是分页的换页的 ...
- static成员函数
1.static成员函数不能定义为const的,这是因为static成员函数只是全局函数的一个形式上的封装,而且static成员函数不能访问类的非静态成员(没有this)指针,修改非静态数据成员又从何 ...
- 【高德地图API】如何设置Marker的offset?
一些朋友在往地图上添加标注的时候,往往会发现,图片的尖尖角对不上具体的点.比如,我要在上海东方明珠上扎一个点. 首先,我使用取点工具http://lbs.amap.com/console/show/p ...