使用UTL_HTTP包获取网页内容

UTL_HTTP 包提供了容易的方式通过HTTP协议获取网页内容，下面结合几个例子介绍一下：

----------------------------------------------------------------------------------------

1、小网页内容获取（<2000 bytes）：

1.1 创建函数p，供输出获取到的网页数据使用：

create or replace procedure p(p_string in varchar2) is

    l_string long default p_string;

begin

    loop

        exit when l_string is null;

        dbms_output.put_line(substr(l_string, 1, 250));

        l_string := substr(l_string, 251);

    end loop;

end;

1.2 获取网页内容函数：

declare

      l_page    long;

      l_url    varchar2(35) default   'http://www.baidu.com/';

  begin

      l_page := utl_http.request( l_url );

      p( l_page );

  end;

  /

2、超过2000 bytes内容获取：（使用request_pieces）

declare

     l_page    utl_http.html_pieces;

     l_url     varchar2(25) default 'www.baidu.com';

 begin

     l_page := utl_http.request_pieces( l_url,

                                        50 );

     for i in 1 .. l_page.count

     loop

         p( l_page(i) );

     end loop;

 end;

CREATE OR REPLACE FUNCTION readfromweb(url VARCHAR2) RETURN CLOB IS

    --TYPE html_pieces IS TABLE OF VARCHAR2(2000) INDEX BY BINARY_INTEGER;

    pcs  UTL_HTTP.Html_Pieces;

    retv CLOB;

BEGIN

    pcs := UTL_HTTP.request_pieces(url, 50);

    FOR i IN 1 .. pcs.COUNT LOOP

        retv := retv || pcs(i);

    END LOOP;

    RETURN retv;

END;

--官方例子：

declare

    x   utl_http.html_pieces;

    len pls_integer;

  begin

    x := utl_http.request_pieces('http://www.oracle.com/', 100);

    dbms_output.put_line(x.count || ' pieces were retrieved.');

    dbms_output.put_line('with total length ');

    len := 0;

    for i in 1..x.count loop

      len := len + length(x(i));

    end loop;

    dbms_output.put_line(len);

  end;

Here is the output:

Statement processed.

4 pieces were retrieved.

with total length

7687

3、ORA-24247问题解决，参考：

点击打开链接 http://blog.csdn.net/indexman/article/details/17048677

--------------------------------

Dylan presents.

使用UTL_HTTP包获取网页内容的更多相关文章

使用selenium和phantomJS浏览器获取网页内容的小演示
# 使用selenium和phantomJS浏览器获取网页内容的小演示 # 导入包 from selenium import webdriver # 使用selenium库里的webdriver方法调 ...
【C#】获取网页内容及HTML解析器HtmlAgilityPack的使用
最近经常需要下载一些东西,而这个下载地址又会经过层层跳转,每个页面上都有很多广告,烦不胜烦,所以做了一个一键获得最终下载地址的小工具.使用C#,来获取网页内容,然后通过HtmlAgilityPack获 ...
C#获取网页内容的三种方式
C#通常有三种方法获取网页内容,使用WebClient.WebBrowser或者HttpWebRequest/HttpWebResponse... 方法一:使用WebClient (引用自:http: ...
使用oracle utl_http包需要注意的事项
总结下几次使用utl_http包遇到的几个问题关于utl_http包功能还是很强大的可以通过他来捕捉网站页面的内容或者调用一个url的接口完成某项功能 Eg: declare req UT ...
C#获取网页内容 (WebClient、WebBrowser和HttpWebRequest/HttpWebResponse)
获取网页数据有很多种方式.在这里主要讲述通过WebClient.WebBrowser和HttpWebRequest/HttpWebResponse三种方式获取网页内容. 这里获取的是包括网页的所有信息 ...
定义一个方法get_page(url),url参数是需要获取网页内容的网址，返回网页的内容。提示（可以了解python的urllib模块）
定义一个方法get_page(url),url参数是需要获取网页内容的网址,返回网页的内容.提示(可以了解python的urllib模块) import urllib.request def get_ ...
使用Jsoup获取网页内容超时设置
使用Jsoup获取网页内容超时设置最近使用Jsoup来抓取网页,并对网页进行解析,发现很好用.在抓取过程中遇到一个问题,有些页面总是报Timeout异常,开始想是不是被抓取网站对IP进行了限制,后来 ...
基于apache —HttpClient的小爬虫获取网页内容
今天(17-03-31)忙了一下午研究webmagic,发现自己还太年轻,对于这样难度的框架(类库) 还是难以接受,还是从基础开始吧,因为相对基础的东西教程相多一些,于是乎我找了apache其下的 H ...
C#获取网页内容的三种方式(转)
搜索网络,发现C#通常有三种方法获取网页内容,使用WebClient.WebBrowser或者HttpWebRequest/HttpWebResponse... 方法一:使用WebClient (引用 ...
[PHP学习教程 - 网络]002.获取网页内容(URL Content)
引言:获取网页内容是我们实现网页操作的基本之基本,今天这一讲,我们和大家讲一下基本请求网页内容的几种方法. 我们似乎每天都要做这样一件事情,打开一个浏览器,输入网址,回车,一个空白的页面顿时有了东西, ...

随机推荐

.net core 3.0 获取 IServiceProvider 实例
.net core 3.0后,获取IServiceProvider需要绕点弯路首先,新建一个类: public class MyServiceProviderFactory : IServicePr ...
Linux-运行级别-init
百度网盘(百度云)SVIP超级会员共享账号每日更新（2023.11.23）
一.百度网盘SVIP超级会员共享账号可能很多人不懂这个共享账号是什么意思,小编在这里给大家做一下解答. 我们多知道百度网盘很大的用处就是类似U盘,不同的人把文件上传到百度网盘,别人可以直接下载,避免 ...
[转帖]TiDB 5.1 Write Stalls 应急文档
https://tidb.net/blog/ac7174dd#4.%E5%88%A4%E6%96%AD%E6%98%AF%E5%90%A6%E5%87%BA%E7%8E%B0%E4%BA%86%20w ...
[转帖]Jmeter之JDBC Request使用方法(oracle)
https://zhuanlan.zhihu.com/p/121747788 JDBC Request: 这个sampler可以向数据库发送一个jdbc请求(sql语句),它经常需要和JDBC Con ...
[转帖]Kubernetes-15：一文详解Pod、Node调度规则(亲和性、污点、容忍、固定节点)
https://www.cnblogs.com/v-fan/p/13609124.html Kubernetes Pod调度说明简介 Scheduler 是 Kubernetes 的调度器,主要任务 ...
[转帖]必看！PostgreSQL参数优化
https://zhuanlan.zhihu.com/p/333201734 前不久,一个朋友所在的公司,业务人员整天都喊慢. 朋友是搞开发的,不是很懂DB,他说他们应用的其实没什么问题,但是就是每天 ...
【转帖】【笔记】python连接神通数据库
https://www.cnblogs.com/wyongbo/p/17054924.html python连接国产神州通用数据库. 一.准备下载whl及dll: 链接: https://pan.b ...
Redislabs的简单使用与benchmark测试结果
Redislabs的简单使用与benchmark测试结果自己的理解仅是理解. 没有看过源码哨兵可以实现高可用, 但是对高吞吐是没有太大帮助的. 虽然可以实现主写从读, 但是在高并发的场景下延迟肯 ...
Vue中is属性的用法可以动态切换组件
is 是组件的一个属性,用来展示组件的名称 is和component联用哈 vue提供了component来展示对应的组件名称 compont是一个占位符,is这个属性,用来展示对应的组件名称三个子 ...

使用UTL_HTTP包获取网页内容

使用UTL_HTTP包获取网页内容的更多相关文章

随机推荐

热门专题