深入理解URL

URI（Universal Resource Identifier）通常由三部分组成： ①访问资源的命名机制； ②存放资源的主机名； ③资源自身
的名称，由路径表示。如下面的URI：http://www.webmonkey.com.cn/html/html40/

URL（Uniform Resource Locator），通俗的来讲，URL是Internet上描述信息资源的字符串，主要用在各种WWW客户端和服务器上，可以用统一的格式来描述信息资源

URL格式的三部分： �第一部分是协议(或称为服务方式)。
　　　　　　　　　　�第二部分是存有该资源的主机 IP地址(有时也包括端口号
　　　　　　　　　　　�第三部分是主机资源的具体地址，如目录和文件名等

第一部分和第二部分用“ ://” 符号隔开，第二部分和第三部分用“ /” 符号隔开。第一部分和第二部分是不可缺少的，第三部分有时可以省略。

例子：1.http协议的URl示例： http://www.peopledaily.com.cn/channel/welcome.htm 其计算机域名为 www.peopledaily.com.cn。超级文本文件(文件类型为.html)是在目录/channel下的 welcome.htm。这是中国人民日报的一台计算机。
　　　　2.文件形式的URL

　　　　用 URL 表示文件时，服务器方式用 file 表示，后面要有主机 IP 地址、文件的存取路径(即目录)和文件名等信息。有时可以省略目录和文件名，但“ /” 符号不能省略。例： file://ftp.yoyodyne.com/pub/files/foobar.txt。上面这个 URL 代表存放在主机 ftp.yoyodyne.com 上的 pub/files/目录下的一个文件，文件名是 foobar.txt。例： file://ftp.yoyodyne.com/pub 代表主机ftp.yoyodyne.com 上的目录/pub。例： file://ftp.yoyodyne.com/ 代表主机ftp.yoyodyne.com 的根目录。

深入理解URL的更多相关文章

爬虫技术 -- 基础学习（三）理解URL和URI的联系与区别
网络爬虫的基本操作是抓取网页.首先要了解下URL~~ 在理解URL之前,先了解下URI,这两个概念我曾经混淆过~@_@|| 什么是URI? Web上每种可用的资源,如:html文档.视频,图片等都由一 ...
理解URL以及如何区分相对URL和绝对URL
URL(Uniform Resource Locator 统一资源定位符)可以理解为网络地址. url 包含了关于文件储存位置和浏览器应该如何处理文件的信息. URL的第一个部分称为模式scheme, ...
【基础进阶】URL详解与URL编码
作为前端,每日与 URL 打交道是必不可少的.但是也许每天只是单纯的用,对其只是一知半解,随着工作的展开,我发现在日常抓包调试,接口调用,浏览器兼容等许多方面,不深入去理解URL与URL编码则会踩到很 ...
【Python网络爬虫一】爬虫原理和URL基本构成
1.爬虫定义网络爬虫,即Web Spider,是一个很形象的名字.把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛.网络蜘蛛是通过网页的链接地址来寻找网页的.从网站某一个页面(通常 ...
URL详解与URL编码
作为前端,每日与 URL 打交道是必不可少的.但是也许每天只是单纯的用,对其只是一知半解,随着工作的展开,我发现在日常抓包调试,接口调用,浏览器兼容等许多方面,不深入去理解URL与URL编码则会踩到很 ...
不刷新改变URL: pushState + Ajax
如果你玩过Google+,看到过YouTube的新界面,便会体验到这个HTML5的新功能.使用pushState + Ajax(pjax),可以实现网页的ajax加载,同时又能完成URL的改变而没有网 ...
js正则表达式之解析——URL的正则表达式
首先,此片文章并不是直接告诉你,url的正则表达式是什么,以及怎么使用这个正则表达式去解析一个URL地址,相信这种问题在网络上已经能找到很多.本文的宗旨在于教你如何理解URL的正则表达式,以达到理解正 ...
python网络爬虫（一）：网络爬虫科普与URL含义
1. 科普通用搜索引擎处理的对象是互联网的网页,目前网页的数量数以亿计,所以搜索引擎面临的第一个问题是如何设计出高效的下载系统,已将海量的网页下载到本地,在本地形成互联网网页的镜像.网络爬虫 ...
[Python]网络爬虫（一）：抓取网页的含义和URL基本构成
一.网络爬虫的定义网络爬虫,即Web Spider,是一个很形象的名字. 把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛.网络蜘蛛是通过网页的链接地址来寻找网页的. 从网站某一个 ...

随机推荐

AMD高级应用（翻译）
Dojo now supports modules written in the Asynchronous Module Definition (AMD) format, which makes co ...
Bower 自定义组件文件夹名称
默认情况下, bower 会自动把文件安装在文件夹 bower_components 下面,如果希望自定义这个文件夹的名称为 components ,可以创建一个名称为 ".bowerrc& ...
OAF_开发系列23_实现OAF数据格式CSS和CSS库（案例）
20150716 Created By BaoXinjian
debian8 Apache 更改根目录
进入配置文件,路径为:/etc/apache2/sites-available/000-default.conf 然后找到DocumentRoot /var/www/html ,将其更改为 Docum ...
java安全沙箱（二）之.class文件检验器
java是一种类型安全的语言,它有四类称为安全沙箱机制的安全机制来保证语言的安全性,这四类安全沙箱分别是: 类加载体系 .class文件检验器内置于Java虚拟机(及语言)的安全特性安全管理器及J ...
JVM实用参数（六）吞吐量收集器
在实践中我们发现对于大多数的应用领域,评估一个垃圾收集(GC)算法如何根据如下两个标准: 吞吐量越高算法越好暂停时间越短算法越好首先让我们来明确垃圾收集(GC)中的两个术语:吞吐量(through ...
Solr整合Ansj中文分词器
Ansj的使用和相关资料下载参考:http://iamyida.iteye.com/blog/2220833 参考 http://www.cnblogs.com/luxh/p/5016894.html ...
Swagger .Net配置
1.NuGet 下载安装 Swagger Install-Package Swashbuckle -Version 5.5.3 2.http://localhost:xxx/swagger 3. 4. ...
oracle 单列索引多列索引的性能测试
清除oralce 缓存:alter system flush buffer_cache; 环境:oracle 10g . 400万条数据,频率5分钟一条 1.应用场景: 找出所有站点的最新一条数据. ...
牛客网程序员面试金典：1.2——原串翻转(java实现)
问题描述: 请实现一个算法,在不使用额外数据结构和储存空间的情况下,翻转一个给定的字符串(可以使用单个过程变量). 给定一个string iniString,请返回一个string,为翻转后的字符串. ...

深入理解URL

深入理解URL的更多相关文章

随机推荐

热门专题