URL类
java.net.URL类是对统一资源定位符(如http://www.lolcats.com)的抽象。它扩展了java.lang.Object,是一个final类。它采用策略模式,协议处理器(protocol handler)就是策略,URL类构成Context,通过它来选择不同的策略。
URL是一个字符串,但是对于URL类而言,这个字符串会被分解为URL类中的各个属性。URL类中的属性包括协议,主机名,端口,路径,查询字符串和片段标识。在构造了一个URL对象后其字段不再改变,所以URL是线程安全的。
构造URL对象
通过字符串构造URL对象
public URL(String url)
try {
URL u = new URL("http://www.xdysite.cn");
} catch (MalformedURLException e) {
System.out.println(e);
}
通过组成部分构造URL
pulbic URL(String protocol, String hostname, String file)
pulbic URL(String protocol, String hostname, int port String file)
try {
//采用默认端口构造
URL u1 = new URL("http", "www.xdysite.cn","/index.php");
//使用8000端口构造
URL u2 = new URL("http", "www.xdysite.cn", 8000, "/index.php");
} catch (MalformedURLException e) {
System.out.println();
}
构造相对URL
public URL(URL base, String relative)
try {
URL u1 = new URL("http://www.xdysite.cn/javafaq/index.xml");
URL u2 = new URL(u1, "mailinglists.html");
} catch (MalformedURLException e) {
System.out.println();
}
如果有一个基础的URL(http://www.xdysite.cn/javafaq/index.html),通过上述方式可以构造出一个新的URL(http://www.xdysite.cn/javafaq/mailinglists.html)
从URL获取数据
直接打开流来获取数据
public final InputStream openStream()
该方法会直接从URL指向的资源中获取数据,如果资源是HTML页面,那么会直接获取页面的数据。并不会获取关于HTTP头部的信息。
try {
URL u = new URL("http://www.xdysite.cn/index.php");
try(Reader r = new InputStreamReader(new BufferedInputStream(u.openStream()))){
int c;
while((c = r.read())!=-1){
System.out.print((char)c);
}
}
} catch (IOException e) {
System.out.println(e);
}
获取一个具体的对象
public final Object getContent()
该方法会获取URL指向的数据,并尝试建立某种类型的对象。如果URL指示某种文本(HTML/XML),返回的对象通常是某种InputStream。如果URL指示一个图像(如GIF或JPEG),getContent()通常会返回一个java.awt.ImageProducer。
try {
URL u = new URL("http://www.xdysite.cn/index.html");
try(Reader r = new InputStreamReader(new BufferedInputStream((InputStream)u.getContent()))){
int c;
while((c = r.read())!=-1){
System.out.print((char)c);
}
}
} catch (IOException e) {
System.out.println(e);
}
URL编码问题
由于在发明Web时Unicode编码还没有普及,使得URL中使用的字符必须来自于ASCII码中的一个固定的子集,确切的讲,包括:
就目前的而言只有上面的字符才能出现在URL中.如果在URL中需要出现一些上面没有的字符时,需要对URL进行编码。
URLEncoder类
可以使用该类对一个字符串进行编码,编码后会将将结果转为%和两个十六进制数。现在通用的编码机制是UTF-8
try {
System.out.println(URLEncoder.encode("This is a string", "UTF-8"));
System.out.println(URLEncoder.encode("This/is/a/string", "UTF-8"));
System.out.println(URLEncoder.encode("This\"is\"a\"string", "UTF-8"));
System.out.println(URLEncoder.encode("This_is.a-string*", "UTF-8"));
} catch (UnsupportedEncodingException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
过度编码
在URL中允许出现的字符是不需要进行编码的。但是使用URL类时,会对斜线(/),与号(&),等号(=)进行编码。我们知道在URL中斜线(/)表示下一级目录。如果对其进行编码会导致我们无法访问资源。这就是过度编码问题。为了解决这个问题,我们需要逐步分对URL进行编码,而不是对整个URL进行编码。
try {
String query = URLEncoder.encode("http://www.baidu.com/s?wd=火影&sp=on", "UTF-8");
System.out.println(query);
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
输出结果
我们看到URLEncoder对斜杠(/)都进行编码,这个不是我们想要的。我们只需要对“火影”进行编码即可。
try {
String query = "http://www.baidu.com/s?wd="+URLEncoder.encode("火影", "utf-8")+"&sp=on";
System.out.println(query);
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
输出结果
由于使用UTF-8对“火影”进行编码后需要6个字节进行存储(每个汉字三个字节),所以显示出来是%E7%81%AB%E5%BD%B1,每个%后是一个字节,用十六进制表示。
URL类的更多相关文章
- Java中的URL类
Java的网络类可以让你通过网络或者远程连接来实现应用.而且,这个平台现在已经可 以对国际互联网以及URL资源进行访问了.Java的URL类可以让访问网络资源就像是访问你本地的文件夹一样方便快捷.我们 ...
- Java-->利用URL类下载图片
--> 通过get 请求访问图片地址,将通过服务器响应的数据(即图片数据)存到本地文件中... --> HttpURLConnectionUtil 工具类 package com.drag ...
- java之URL类
Java的网络类可以让你通过网络或者远程连接来实现应用.而且,这个平台现在已经可 以对国际互联网以及URL资源进行访问了.Java的URL类可以让访问网络资源就像是访问你本地的文件夹一样方便快捷.我们 ...
- Java URL类踩坑指南
背景介绍 最近再做一个RSS阅读工具给自己用,其中一个环节是从服务器端获取一个包含了RSS源列表的json文件,再根据这个json文件下载.解析RSS内容.核心代码如下: class Presente ...
- MinerUrl.java 解析页面后存储URL类
MinerUrl.java 解析页面后存储URL类 package com.iteye.injavawetrust.miner; /** * 解析页面后存储URL类 * @author InJavaW ...
- Java使用URL类下载的图片不完整
问题 今天在使用URL类来下载网站中的图片的时候,出现了一个问题:下载的图片不完整,并且每次下载的图片大小也不是都相同,反正就是不完整. 问题代码如下: package cn.ganlixin.tes ...
- Java的URL类(二)
转:https://www.cnblogs.com/brokencolor/p/8575440.html Java的URL类(二) 实例: Java 通过HttpURLConnection Post方 ...
- Java的URL类(一)
转:https://www.cnblogs.com/blackiesong/p/6182038.html Java的URL类(一) Java的网络类可以让你通过网络或者远程连接来实现应用.而且,这个平 ...
- [19/04/14-星期日] 网络编程_java.net包(InetAddress类、InetSocketAddress类、URL类)
一.概念 Java为了可移植性,不允许直接调用操作系统,而是由java.net包来提供网络功能.Java虚拟机负责提供与操作系统的实际连接. InetAddress 作用:封装计算机的IP地址和 ...
随机推荐
- iOS 应用评分
为了提高应用的用户体验,经常需要邀请用户对应用进行评分 应用评分无非就是跳转到AppStore展示自己的应用,然后由用户自己撰写评论 如何跳转到AppStore,并且展示自己的应用 方法1 NSStr ...
- SharePoint 2013 工作流之使用Visio设计篇
SharePoint 2013增强了工作流,不仅仅基于WorkFlow Foundation 4.0了,设计方式也不仅仅是Designer,还包括Visio中设计,下面我们就一个简单的例子,介绍下. ...
- Mac版PhpStorm之XAMPP整合apache服务器配置
版权声明:本文为博主原创文章,未经博主允许不得转载. 选择在PhpStorm集成apache服务器,下面是我自己的亲测的步骤. 1.如何修改apache默认端口 xampp apache默认的http ...
- 【代码笔记】iOS-UITextField设置placeholder颜色
一,效果图. 二,工程图. 三,代码. RootViewController.h #import <UIKit/UIKit.h> @interface RootViewController ...
- MD5工具类
package com.liu.hellomavenweb.util; import java.security.MessageDigest; /** * * @author 刘楠 * */ publ ...
- python爬虫—爬取百度百科数据
爬虫框架:开发平台 centos6.7 根据慕课网爬虫教程编写代码 片区百度百科url,标题,内容 分为4个模块:html_downloader.py 下载器 html_outputer.py 爬取数 ...
- C#和ASP.NET之事件
事件是一种用于类和类之间传递消息或触发新的行为的编程方式.通过提供事件的句柄,能够把控件和可执行的代码联系在一起, 如用户单击Button控件触发Click事件后就执行相应的事件处理代码. 事件的声明 ...
- CLR简介(一)
什么是通用语言运行时(CLR),简单来讲: CLR是一个支持多种编程语言及多语言互操作,完整的高级虚拟机. 有点拗口,而且不是很有启发性,但上面的文字是将又大又复杂的CLR的功能归类以便容易理解的第一 ...
- MYSQL介绍安装及一些问题解决
一.简介 MySQL是最流行的开放源码SQL数据库管理系统,它是由MySQL AB公司开发.发布并支持的.有以下特点: MySQL是一种数据库管理系统. MySQL是一种关联数据库管理系统. MySQ ...
- Linux From Scratch(从零开始构建Linux系统,简称LFS)- Version 7.7(三)
八. 构建LFS系统 1. 准备虚拟内核文件系统 内核会挂载几个文件系统用于自己和用户空间程序交换信息.这些文件系统是虚拟的,并不占用实际磁盘空间, 它们的内容会放在内存里. mkdir -pv $L ...