1. [代码][JavaScript]代码  
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
 
/**
* 视频工具类
* @author sunlightcs
* 2011-4-6
* http://hi.juziku.com/sunlightcs/
*/
public class VideoUtil {
         
        /**
         * 获取视频信息
         * @param url
         * @return
         */
        public static Video getVideoInfo(String url){
                Video video = new Video();
                 
                if(url.indexOf("v.youku.com")!=-1){
                        try {
                                video = getYouKuVideo(url);
                        } catch (Exception e) {
                                video = null;
                        }
                }else if(url.indexOf("tudou.com")!=-1){
                        try {
                                video = getTudouVideo(url);
                        } catch (Exception e) {
                                video = null;
                        }
                }else if(url.indexOf("v.ku6.com")!=-1){
                        try {
                                video = getKu6Video(url);
                        } catch (Exception e) {
                                video = null;
                        }
                }else if(url.indexOf("6.cn")!=-1){
                        try {
                                video = get6Video(url);
                        } catch (Exception e) {
                                video = null;
                        }
                }else if(url.indexOf("56.com")!=-1){
                        try {
                                video = get56Video(url);
                        } catch (Exception e) {
                                video = null;
                        }
                }
                 
                return video;
        }
         
         
        /**
         * 获取优酷视频
         * @param url  视频URL
         */
        public static Video getYouKuVideo(String url) throws Exception{
                Document doc = getURLContent(url);
                 
                /**
                 *获取视频缩略图 
                 */
                String pic = getElementAttrById(doc, "s_sina", "href");
                int local = pic.indexOf("pic=");
                pic = pic.substring(local+4);
                 
                /**
                 * 获取视频地址
                 */            
                String flash = getElementAttrById(doc, "link2", "value");
                 
                /**
                 * 获取视频时间
                 */    
                String time = getElementAttrById(doc, "download", "href");
                String []arrays = time.split("\\|");
                time = arrays[4];
                 
                Video video = new Video();
                video.setPic(pic);
                video.setFlash(flash);
                video.setTime(time);
                 
                return video;
        }
         
         
        /**
         * 获取土豆视频
         * @param url  视频URL
         */
        public static Video getTudouVideo(String url) throws Exception{
                Document doc = getURLContent(url);
                String content = doc.html();
                int beginLocal = content.indexOf("");
                content = content.substring(beginLocal, endLocal);
                 
                /**
                 * 获取视频地址
                 */    
                String flash = getScriptVarByName("iid_code", content);
                flash = "http://www.tudou.com/v/" + flash + "/v.swf";
                 
                /**
                 *获取视频缩略图 
                 */
                String pic = getScriptVarByName("thumbnail", content);
                 
                /**
                 * 获取视频时间
                 */    
                String time = getScriptVarByName("time", content);
 
                Video video = new Video();
                video.setPic(pic);
                video.setFlash(flash);
                video.setTime(time);
                 
                return video;
        }
         
         
        /**
         * 获取酷6视频
         * @param url  视频URL
         */
        public static Video getKu6Video(String url) throws Exception{
                Document doc = getURLContent(url);
                 
                /**
                 * 获取视频地址
                 */
                Element flashEt = doc.getElementById("outSideSwfCode");
                String flash = flashEt.attr("value");
                 
                /**
                 * 获取视频缩略图
                 */
                Element picEt = doc.getElementById("plVideosList");
                String time = null;
                String pic = null;
                if(picEt!=null){
                        Elements pics = picEt.getElementsByTag("img");
                        pic = pics.get(0).attr("src");
                         
                        /**
                         * 获取视频时长
                         */
                        Element timeEt = picEt.select("span.review>cite").first(); 
                        time = timeEt.text();手绘图片
                }else{http://www.bizhizu.cn/shouhui/​
                        pic = doc.getElementsByClass("s_pic").first().text();
                }
                 
                Video video = new Video();
                video.setPic(pic);
                video.setFlash(flash);
                video.setTime(time);
                 
                return video;
                 
        }
         
         
        /**
         * 获取6间房视频
         * @param url  视频URL
         */
        public static Video get6Video(String url) throws Exception{
                Document doc = getURLContent(url);
                 
                /**
                 * 获取视频缩略图
                 */
                Element picEt = doc.getElementsByClass("summary").first();
                String pic = picEt.getElementsByTag("img").first().attr("src");
                 
                /**
                 * 获取视频时长
                 */
                String time = getVideoTime(doc, url, "watchUserVideo");
                if(time==null){
                        time = getVideoTime(doc, url, "watchRelVideo");
                }
                 
                /**
                 * 获取视频地址
                 */
                Element flashEt = doc.getElementById("video-share-code");
                doc = Jsoup.parse(flashEt.attr("value"));  
                String flash = doc.select("embed").attr("src");
                 
                Video video = new Video();
                video.setPic(pic);
                video.setFlash(flash);
                video.setTime(time);
                 
                return video;
        }
         
         
        /**
         * 获取56视频
         * @param url  视频URL
         */
        public static Video get56Video(String url) throws Exception{
                Document doc = getURLContent(url);
                String content = doc.html();
                 
                /**
                 * 获取视频缩略图
                 */
                int begin = content.indexOf("\"img\":\"");
                content = content.substring(begin+7, begin+200);
                int end = content.indexOf("\"};");
                String pic = content.substring(0, end).trim();
                pic = pic.replaceAll("\\\\", "");               
                 
                /**
                 * 获取视频地址
                 */
                String flash = "http://player.56.com" + url.substring(url.lastIndexOf("/"), url.lastIndexOf(".html")) + ".swf";
                 
                Video video = new Video();
                video.setPic(pic);
                video.setFlash(flash);
                 
                return video;
        }
 
        /**
         * 获取6间房视频时长    
         */
        private static String getVideoTime(Document doc, String url, String id) {
                String time = null;
                 
                Element timeEt = doc.getElementById(id); 
                Elements links = timeEt.select("dt > a");
                 
                 
                for (Element link : links) {
                  String linkHref = link.attr("href");
                  if(linkHref.equalsIgnoreCase(url)){
                          time = link.parent().getElementsByTag("em").first().text();
                          break;
                  }
                }
                return time;
        }
         
                         
        /**
         * 获取script某个变量的值
         * @param name  变量名称
         * @return   返回获取的值 
         */
        private static String getScriptVarByName(String name, String content){
                String script = content;
                 
                int begin = script.indexOf(name);
                 
                script = script.substring(begin+name.length()+2);
                 
                int end = script.indexOf(",");
                 
                script = script.substring(0,end);
                 
                String result=script.replaceAll("'", "");
                result = result.trim();
                 
                return result;
        }
         
         
        /**
         * 根据HTML的ID键及属于名,获取属于值
         * @param id  HTML的ID键
         * @param attrName  属于名
         * @return  返回属性值
         */
        private static String getElementAttrById(Document doc, String id, String attrName)throws Exception{
                Element et = doc.getElementById(id);
                String attrValue = et.attr(attrName);
                 
                return attrValue;
        }
         
         
         
        /**
         * 获取网页的内容
         */
        private static Document getURLContent(String url) throws Exception{
                Document doc = Jsoup.connect(url)
                  .data("query", "Java")
                  .userAgent("Mozilla")
                  .cookie("auth", "token")
                  .timeout(6000)
                  .post();
                return doc;
        }
         
         
        public static void main(String[] args) {
                //String url = "http://v.youku.com/v_show/id_XMjU0MjI2NzY0.html";
                //String url = "http://www.tudou.com/programs/view/pVploWOtCQM/";
                //String url = "http://v.ku6.com/special/show_4024167/9t7p64bisV2A31Hz.html";
                //String url = "http://v.ku6.com/show/BpP5LeyVwvikbT1F.html";
                //String url = "http://6.cn/watch/14757577.html";
                String url = "http://www.56.com/u64/v_NTkzMDEzMTc.html";
                Video video = getVideoInfo(url);
                System.out.println("视频缩略图:"+video.getPic());
                System.out.println("视频地址:"+video.getFlash());
                System.out.println("视频时长:"+video.getTime());
        }
}
 
/************************************************************************************/
 
/**
* 视频封装
*/
public class Video {
        private String flash;
        private String pic;
        private String time;
        public String getFlash() {
                return flash;
        }
        public void setFlash(String flash) {
                this.flash = flash;
        }
        public String getPic() {
                return pic;
        }
        public void setPic(String pic) {
                this.pic = pic;
        }
        public String getTime() {
                return time;
        }
        public void setTime(String time) {
                this.time = time;
        }
}

用 Java 抓取优酷、土豆等视频的更多相关文章

  1. java平台利用jsoup开发包,抓取优酷视频播放地址与图片地址等信息。

    /********************************************************************************************  * aut ...

  2. python爬虫---抓取优酷的电影

    最近在学习爬虫,用的BeautifulSoup4这个库,设想是把优酷上面的电影的名字及链接爬到,然后存到一个文本文档中.比较简单的需求,第一次写爬虫.贴上代码供参考: # coding:utf-8 i ...

  3. wordpress如何利用插件添加优酷土豆等视频到自己的博客上

    wordpress有时候需要添加优酷.土豆等网站的视频到自己的博客上,传统的分享方法不能符合电脑端和手机端屏幕大小的需求,又比较繁琐,怎样利用插件的方法进行添加呢,本视频向你介绍一款这样的插件——Sm ...

  4. 爬虫(三)解析js,抓取优酷免费视频的真实播放地址

    工具:google浏览器 + fiddler抓包工具 说明:这里不贴代码,[只讲思路!!!] 原始url = https://v.youku.com/v_show/id_XMzIwNjgyMDgwOA ...

  5. java 抓取网页图片

    import java.io.File; import java.io.FileOutputStream; import java.io.InputStream; import java.io.Out ...

  6. php 解析 视频 信息 封面 标题 图片 支持 优酷, 土豆 酷6 56 新浪 qq播客 乐视 乐视

    原文地址:http://www.lianyue.org/2013/2497/ <?php /** * 解析 视频信息 类 * * 支持 优酷, 土豆 酷6 56 新浪 qq播客 乐视 乐视 ** ...

  7. 怎样获取优酷站内视频的MP4格式地址,嵌入到手机页面播放

    最近的有关项目需要使用video标签播放视频,并且视频的路径src是优酷里面的视频,所以需要得到优酷里面的mp4路径才能播放. 但是在网上查了下资料,看到优酷的播放格式是一个m3u8文件,如图所示: ...

  8. 爱斯达M2C服装定制系统介绍—在线播放—优酷网,视频高清在线观看

    爱斯达M2C服装定制系统介绍-在线播放-优酷网,视频高清在线观看 视频: 爱斯达M2C服装定制系统介绍

  9. Java 抓取网页中的内容【持续更新】

    背景:前几天复习Java的时候看到URL类,当时就想写个小程序试试,迫于考试没有动手,今天写了下,感觉还不错 内容1. 抓取网页中的URL 知识点:Java URL+ 正则表达式 import jav ...

随机推荐

  1. VS2010 + WinDDK 搭建驱动开发环境(转)

    因工作需要,需要研究一下Windows驱动开发.我们知道,编译驱动程序主要是通过两种方案:第一种是通过WinDDK提供的build命令+source文件进行编译:另外一种是通过VC的IDE进行编译. ...

  2. SVG动画实践篇-音量变化效果

    git 地址:https://github.com/rainnaZR/svg-animations/tree/master/src/pages/step2/volumn 说明 这个动画的效果就是多个线 ...

  3. Android Studio 删除项目

    在项目上右键 点击“Open Module Settings”,然后你会看到你的项目排成一列,如果想删除哪个,点击项目,然后在左上角,点击“-”号,然后返回后发现这个项目变为灰色,点击项目右键,看到“ ...

  4. 【MyEcplise】设置右键快捷菜单的方法

    在我们右键新建项目或文件时,有许多的选项我们几乎是不用的,那就没有必要放在右键的快捷菜单中:而有些选项是我们经常会用的,但是右键快捷菜单有没有,我们总是需要选择其它去到弹出的对话框中取选取.这些操作很 ...

  5. zerorpc的安装

    1.简介及安装 rpc使构建分布式系统简单许多,在云计算的实现中有很广泛的应用 rpc可以是异步的 python实现rpc,可以使用标准库里的SimpleXMLRPCServer,另外zerorpc是 ...

  6. Redis及其Sentinel配置项详细说明

    Redis及其Sentinel配置项详细说明 http://lixiaohui.iteye.com/blog/2315516

  7. ruby简单的基础 4

    后缀标点符号 =结尾假设方法名字以=结尾的,那么在调用此方法时能够省略这个=. ?结尾作为一个实用惯例,那些返回布尔值的方法通常都有一个以问号结尾的名字. .结尾这个命名惯例通常时对两种方法区分:以感 ...

  8. 综合运用: C++11 多线程下生产者消费者模型详解(转)

    生产者消费者问题是多线程并发中一个非常经典的问题,相信学过操作系统课程的同学都清楚这个问题的根源.本文将就四种情况分析并介绍生产者和消费者问题,它们分别是:单生产者-单消费者模型,单生产者-多消费者模 ...

  9. Surrounded Regions 包围区域——dfs

    Given a 2D board containing 'X' and 'O', capture all regions surrounded by 'X'. A region is captured ...

  10. [ssh新闻公布系统三]存储新闻

    一.存储新闻dao方法 在NewsDao.java中新增存储新闻的saveOrupdate方法 public void saveOrupdate(News news){ getSession().sa ...