1. [代码][JavaScript]代码  
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
 
/**
* 视频工具类
* @author sunlightcs
* 2011-4-6
* http://hi.juziku.com/sunlightcs/
*/
public class VideoUtil {
         
        /**
         * 获取视频信息
         * @param url
         * @return
         */
        public static Video getVideoInfo(String url){
                Video video = new Video();
                 
                if(url.indexOf("v.youku.com")!=-1){
                        try {
                                video = getYouKuVideo(url);
                        } catch (Exception e) {
                                video = null;
                        }
                }else if(url.indexOf("tudou.com")!=-1){
                        try {
                                video = getTudouVideo(url);
                        } catch (Exception e) {
                                video = null;
                        }
                }else if(url.indexOf("v.ku6.com")!=-1){
                        try {
                                video = getKu6Video(url);
                        } catch (Exception e) {
                                video = null;
                        }
                }else if(url.indexOf("6.cn")!=-1){
                        try {
                                video = get6Video(url);
                        } catch (Exception e) {
                                video = null;
                        }
                }else if(url.indexOf("56.com")!=-1){
                        try {
                                video = get56Video(url);
                        } catch (Exception e) {
                                video = null;
                        }
                }
                 
                return video;
        }
         
         
        /**
         * 获取优酷视频
         * @param url  视频URL
         */
        public static Video getYouKuVideo(String url) throws Exception{
                Document doc = getURLContent(url);
                 
                /**
                 *获取视频缩略图 
                 */
                String pic = getElementAttrById(doc, "s_sina", "href");
                int local = pic.indexOf("pic=");
                pic = pic.substring(local+4);
                 
                /**
                 * 获取视频地址
                 */            
                String flash = getElementAttrById(doc, "link2", "value");
                 
                /**
                 * 获取视频时间
                 */    
                String time = getElementAttrById(doc, "download", "href");
                String []arrays = time.split("\\|");
                time = arrays[4];
                 
                Video video = new Video();
                video.setPic(pic);
                video.setFlash(flash);
                video.setTime(time);
                 
                return video;
        }
         
         
        /**
         * 获取土豆视频
         * @param url  视频URL
         */
        public static Video getTudouVideo(String url) throws Exception{
                Document doc = getURLContent(url);
                String content = doc.html();
                int beginLocal = content.indexOf("");
                content = content.substring(beginLocal, endLocal);
                 
                /**
                 * 获取视频地址
                 */    
                String flash = getScriptVarByName("iid_code", content);
                flash = "http://www.tudou.com/v/" + flash + "/v.swf";
                 
                /**
                 *获取视频缩略图 
                 */
                String pic = getScriptVarByName("thumbnail", content);
                 
                /**
                 * 获取视频时间
                 */    
                String time = getScriptVarByName("time", content);
 
                Video video = new Video();
                video.setPic(pic);
                video.setFlash(flash);
                video.setTime(time);
                 
                return video;
        }
         
         
        /**
         * 获取酷6视频
         * @param url  视频URL
         */
        public static Video getKu6Video(String url) throws Exception{
                Document doc = getURLContent(url);
                 
                /**
                 * 获取视频地址
                 */
                Element flashEt = doc.getElementById("outSideSwfCode");
                String flash = flashEt.attr("value");
                 
                /**
                 * 获取视频缩略图
                 */
                Element picEt = doc.getElementById("plVideosList");
                String time = null;
                String pic = null;
                if(picEt!=null){
                        Elements pics = picEt.getElementsByTag("img");
                        pic = pics.get(0).attr("src");
                         
                        /**
                         * 获取视频时长
                         */
                        Element timeEt = picEt.select("span.review>cite").first(); 
                        time = timeEt.text();手绘图片
                }else{http://www.bizhizu.cn/shouhui/​
                        pic = doc.getElementsByClass("s_pic").first().text();
                }
                 
                Video video = new Video();
                video.setPic(pic);
                video.setFlash(flash);
                video.setTime(time);
                 
                return video;
                 
        }
         
         
        /**
         * 获取6间房视频
         * @param url  视频URL
         */
        public static Video get6Video(String url) throws Exception{
                Document doc = getURLContent(url);
                 
                /**
                 * 获取视频缩略图
                 */
                Element picEt = doc.getElementsByClass("summary").first();
                String pic = picEt.getElementsByTag("img").first().attr("src");
                 
                /**
                 * 获取视频时长
                 */
                String time = getVideoTime(doc, url, "watchUserVideo");
                if(time==null){
                        time = getVideoTime(doc, url, "watchRelVideo");
                }
                 
                /**
                 * 获取视频地址
                 */
                Element flashEt = doc.getElementById("video-share-code");
                doc = Jsoup.parse(flashEt.attr("value"));  
                String flash = doc.select("embed").attr("src");
                 
                Video video = new Video();
                video.setPic(pic);
                video.setFlash(flash);
                video.setTime(time);
                 
                return video;
        }
         
         
        /**
         * 获取56视频
         * @param url  视频URL
         */
        public static Video get56Video(String url) throws Exception{
                Document doc = getURLContent(url);
                String content = doc.html();
                 
                /**
                 * 获取视频缩略图
                 */
                int begin = content.indexOf("\"img\":\"");
                content = content.substring(begin+7, begin+200);
                int end = content.indexOf("\"};");
                String pic = content.substring(0, end).trim();
                pic = pic.replaceAll("\\\\", "");               
                 
                /**
                 * 获取视频地址
                 */
                String flash = "http://player.56.com" + url.substring(url.lastIndexOf("/"), url.lastIndexOf(".html")) + ".swf";
                 
                Video video = new Video();
                video.setPic(pic);
                video.setFlash(flash);
                 
                return video;
        }
 
        /**
         * 获取6间房视频时长    
         */
        private static String getVideoTime(Document doc, String url, String id) {
                String time = null;
                 
                Element timeEt = doc.getElementById(id); 
                Elements links = timeEt.select("dt > a");
                 
                 
                for (Element link : links) {
                  String linkHref = link.attr("href");
                  if(linkHref.equalsIgnoreCase(url)){
                          time = link.parent().getElementsByTag("em").first().text();
                          break;
                  }
                }
                return time;
        }
         
                         
        /**
         * 获取script某个变量的值
         * @param name  变量名称
         * @return   返回获取的值 
         */
        private static String getScriptVarByName(String name, String content){
                String script = content;
                 
                int begin = script.indexOf(name);
                 
                script = script.substring(begin+name.length()+2);
                 
                int end = script.indexOf(",");
                 
                script = script.substring(0,end);
                 
                String result=script.replaceAll("'", "");
                result = result.trim();
                 
                return result;
        }
         
         
        /**
         * 根据HTML的ID键及属于名,获取属于值
         * @param id  HTML的ID键
         * @param attrName  属于名
         * @return  返回属性值
         */
        private static String getElementAttrById(Document doc, String id, String attrName)throws Exception{
                Element et = doc.getElementById(id);
                String attrValue = et.attr(attrName);
                 
                return attrValue;
        }
         
         
         
        /**
         * 获取网页的内容
         */
        private static Document getURLContent(String url) throws Exception{
                Document doc = Jsoup.connect(url)
                  .data("query", "Java")
                  .userAgent("Mozilla")
                  .cookie("auth", "token")
                  .timeout(6000)
                  .post();
                return doc;
        }
         
         
        public static void main(String[] args) {
                //String url = "http://v.youku.com/v_show/id_XMjU0MjI2NzY0.html";
                //String url = "http://www.tudou.com/programs/view/pVploWOtCQM/";
                //String url = "http://v.ku6.com/special/show_4024167/9t7p64bisV2A31Hz.html";
                //String url = "http://v.ku6.com/show/BpP5LeyVwvikbT1F.html";
                //String url = "http://6.cn/watch/14757577.html";
                String url = "http://www.56.com/u64/v_NTkzMDEzMTc.html";
                Video video = getVideoInfo(url);
                System.out.println("视频缩略图:"+video.getPic());
                System.out.println("视频地址:"+video.getFlash());
                System.out.println("视频时长:"+video.getTime());
        }
}
 
/************************************************************************************/
 
/**
* 视频封装
*/
public class Video {
        private String flash;
        private String pic;
        private String time;
        public String getFlash() {
                return flash;
        }
        public void setFlash(String flash) {
                this.flash = flash;
        }
        public String getPic() {
                return pic;
        }
        public void setPic(String pic) {
                this.pic = pic;
        }
        public String getTime() {
                return time;
        }
        public void setTime(String time) {
                this.time = time;
        }
}

用 Java 抓取优酷、土豆等视频的更多相关文章

  1. java平台利用jsoup开发包,抓取优酷视频播放地址与图片地址等信息。

    /********************************************************************************************  * aut ...

  2. python爬虫---抓取优酷的电影

    最近在学习爬虫,用的BeautifulSoup4这个库,设想是把优酷上面的电影的名字及链接爬到,然后存到一个文本文档中.比较简单的需求,第一次写爬虫.贴上代码供参考: # coding:utf-8 i ...

  3. wordpress如何利用插件添加优酷土豆等视频到自己的博客上

    wordpress有时候需要添加优酷.土豆等网站的视频到自己的博客上,传统的分享方法不能符合电脑端和手机端屏幕大小的需求,又比较繁琐,怎样利用插件的方法进行添加呢,本视频向你介绍一款这样的插件——Sm ...

  4. 爬虫(三)解析js,抓取优酷免费视频的真实播放地址

    工具:google浏览器 + fiddler抓包工具 说明:这里不贴代码,[只讲思路!!!] 原始url = https://v.youku.com/v_show/id_XMzIwNjgyMDgwOA ...

  5. java 抓取网页图片

    import java.io.File; import java.io.FileOutputStream; import java.io.InputStream; import java.io.Out ...

  6. php 解析 视频 信息 封面 标题 图片 支持 优酷, 土豆 酷6 56 新浪 qq播客 乐视 乐视

    原文地址:http://www.lianyue.org/2013/2497/ <?php /** * 解析 视频信息 类 * * 支持 优酷, 土豆 酷6 56 新浪 qq播客 乐视 乐视 ** ...

  7. 怎样获取优酷站内视频的MP4格式地址,嵌入到手机页面播放

    最近的有关项目需要使用video标签播放视频,并且视频的路径src是优酷里面的视频,所以需要得到优酷里面的mp4路径才能播放. 但是在网上查了下资料,看到优酷的播放格式是一个m3u8文件,如图所示: ...

  8. 爱斯达M2C服装定制系统介绍—在线播放—优酷网,视频高清在线观看

    爱斯达M2C服装定制系统介绍-在线播放-优酷网,视频高清在线观看 视频: 爱斯达M2C服装定制系统介绍

  9. Java 抓取网页中的内容【持续更新】

    背景:前几天复习Java的时候看到URL类,当时就想写个小程序试试,迫于考试没有动手,今天写了下,感觉还不错 内容1. 抓取网页中的URL 知识点:Java URL+ 正则表达式 import jav ...

随机推荐

  1. Html中的 http-equiv="X-UA-Compatible" 解释

    1.X-UA-Compatible X-UA-Compatible是自从IE8新加的一个设置,对于IE8以下的浏览器是不识别的. 通过在meta中设置X-UA-Compatible的值,可以指定网页的 ...

  2. C#深入学习:泛型修饰符in,out、逆变委托类型和协变委托类型

    在C#中,存在两个泛型修饰符:in和out,他们分别对应逆变委托和协变委托. 我们知道,在C#中要想将一个泛型对象转换为另一个泛型对象时,必须要将一个泛型对象拆箱,对元素进行显式或隐式转换后重新装箱. ...

  3. 转: 基于netty+ protobuf +spring + hibernate + jgroups开发的游戏服务端

    from: http://ybak.iteye.com/blog/1853335 基于netty+ protobuf +spring + hibernate + jgroups开发的游戏服务端 游戏服 ...

  4. nagios插件之登陆SBC监控电话数

    运行:sbc_calls_status_new auto_ssh_sbc_10_17.sh | auto_ssh_sbc_11_17.sh vi sbc_calls_status_new.c #inc ...

  5. FTPClient listFiles 阻塞问题

    Android端使用 FTPClient 实现上传文件到到filezilla server(filezilla server部署在阿里云服务器)出现 listFiles阻塞.具体的现象是 Ftp Cl ...

  6. 【每日Scrum】第四天(4.25) TD学生助手Sprint2站立会议

    站立会议 组员 昨天 今天 困难 签到 刘铸辉 (组长) 和小楠重写架构,使代码更加简洁,并增加了几个界面 今天增加了几个页面的子菜单,然后设计了几个要用的界面 遇到的困难是,菜单的事件处理真是神一样 ...

  7. OI知识体系

  8. 5分钟部署filebeat + ELK 5.1.1

    标题有点噱头,不过网络环境好的情况下也差不多了^_^   1. 首先保证安装了jdk.   elasticsearch, logstash, kibana,filebeat都可以通过yum安装,这里前 ...

  9. 基于EfCore的一个多租户Demo

    六月份如愿的转入了架构组,先上手搞了个CI服务器,把架构组的几个项目撸到上面去了.效果不错,接着就把其他两个项目组有单元测试的项目撸上去了,在桌子上放了个显示器当大屏用. 因为公司准备进行一个大的系统 ...

  10. 嵌入式开发之cgic库---cgi库的使用

    很幸运!用C语言写CGI程序还可以有比较简单的方式,那就是我们可以借助使用第三方库CGIC(CGIC是一个功能比较强大的支持CGI开发的标准C库,并支持Linux, Unix 和Windows等多操作 ...