<?php

/*

http://baike.baidu.com/view/125547.htm#2

百度网新闻开放协议

*/

mysql_connect($CFG['db_host'] ,$CFG['db_user'],$CFG['db_pass']) or die('数据库连接错误!');

mysql_select_db($CFG['db_name']);

mysql_query("set names utf8");

$p=$CFG['tb_pre'];

$ids=array(1,2,3);

foreach ($ids as $k=>$v){//begin foreach

$query="select `a`.*,`c`.*,`d`.*,`a`.`linkurl` as `alinkurl` from `{$p}category` as `c` ,`{$p}article_21` as `a` , `{$p}article_data_21` as `d` where `a`.`catid`=`c`.`catid` and `a`.`itemid`=`d`.`itemid` and `a`.`status`=3 and `a`.`catid`='{$v}' order by `a`.`itemid` desc limit 100";

$result=mysql_query($query);

$m=0;

while($info=mysql_fetch_array($result,MYSQL_ASSOC)){

$data_array[$m]['title']='';

$data_array[$m]['link']='';

$data_array[$m]['description']='';

$data_array[$m]['text']='';

$data_array[$m]['image']='';

$data_array[$m]['keywords']='';

$data_array[$m]['category']='';

$data_array[$m]['author']='';

$data_array[$m]['source']='';

$data_array[$m]['pubDate']=''

$m++;

}

/*$data_array = array(

array(

"title"=>"",

"link"=>"",

"description"=>"",

"text"=>"",

"image"=>"123",

"keywords"=>'',

"category"=>"",

"author"=>"",

"source"=>"",

"pubDate"=>"2012-06-12 14:03"

)

);*/

//  属性数组

/*$attribute_array = array(

'title' => array(

'size' => 1

)

);

*/

//  创建一个XML文档并设置XML版本和编码。。

$dom=new DomDocument('1.0', 'gbk');

//  创建根节点document

$document = $dom->createElement('document');

$dom->appendchild($document);

//创建document->website

$website=$dom->createElement('website');

$document->appendchild($website);

$mytext = $dom->createTextNode('http://www.abc.net/');

$website->appendchild($mytext);

//创建document->webMaster

$webmaster=$dom->createElement('webMaster');

$document->appendchild($webmaster);

$mytext = $dom->createTextNode('songzhenghe89@126.com');

$webmaster->appendchild($mytext);

//创建document->updatePeri

$updateperi=$dom->createElement('updatePeri');

$document->appendchild($updateperi);

$mytext = $dom->createTextNode('60');

$updateperi->appendchild($mytext);

//批量创建document->item

foreach ($data_array as $data) {

$item = $dom->createElement('item');//创建一个item

$document->appendchild($item);

create_item($dom, $item, $data, $attribute_array);

}

//echo $dom->saveXML();

$dom->save("./"."{$v}.xml");

}//end foreach

function create_item($dom, $item, $data, $attribute) {

if (is_array($data)) {

foreach ($data as $key => $val) {

//  创建元素

$$key = $dom->createElement($key);

$item->appendchild($$key);

//  创建元素值

if($key!="pubDate"){

//使用cdata包含

$cdatasection=$dom->createCDATASection($val);

$$key->appendchild($cdatasection);

}else{

$mytext = $dom->createTextNode($val);

$$key->appendchild($mytext);

}

if (isset($attribute[$key])) {

//  如果此字段存在相关属性需要设置

foreach ($attribute[$key] as $akey => $row) {

//  创建属性节点

$$akey = $dom->createAttribute($akey);

$$key->appendchild($$akey);

// 创建属性值节点

$aval = $dom->createTextNode($row);

$$akey->appendChild($aval);

}

}   //  end if

}

}   //  end if

}   //  end function

?>

php生成百度新闻源xml的更多相关文章

  1. 第三百三十四节,web爬虫讲解2—Scrapy框架爬虫—Scrapy爬取百度新闻,爬取Ajax动态生成的信息

    第三百三十四节,web爬虫讲解2—Scrapy框架爬虫—Scrapy爬取百度新闻,爬取Ajax动态生成的信息 crapy爬取百度新闻,爬取Ajax动态生成的信息,抓取百度新闻首页的新闻rul地址 有多 ...

  2. 十三 web爬虫讲解2—Scrapy框架爬虫—Scrapy爬取百度新闻,爬取Ajax动态生成的信息

    crapy爬取百度新闻,爬取Ajax动态生成的信息,抓取百度新闻首页的新闻rul地址 有多网站,当你浏览器访问时看到的信息,在html源文件里却找不到,由得信息还是滚动条滚动到对应的位置后才显示信息, ...

  3. php生成百度站点地图sitemap.xml

    <?php header("Content-type:text/html;charset=utf-8"); //php生成百度站点地图sitemap.xml //http:/ ...

  4. C# 解析百度天气数据,Rss解析百度新闻以及根据IP获取所在城市

    百度天气 接口地址:http://api.map.baidu.com/telematics/v3/weather?location=上海&output=json&ak=hXWAgbsC ...

  5. 使用python抓取百度搜索、百度新闻搜索的关键词个数

    由于实验的要求,需要统计一系列的字符串通过百度搜索得到的关键词个数,于是使用python写了一个相关的脚本. 在写这个脚本的过程中遇到了很多的问题,下面会一一道来. ps:我并没有系统地学习过pyth ...

  6. windows定时执行百度新闻爬虫

    想要做个新闻文本识别分类的项目,就先写了个爬取百度新闻的爬虫. 环境:win7 32 bit python3.4 若干第三方库 可以实现的功能:定期按照百度新闻的分类抓取新闻的标题,所属类别及文本内容 ...

  7. H5类似易企秀/编辑器/页面制作/开发/生成工具/软件/源码/授权

    代码地址如下:http://www.demodashi.com/demo/14960.html 项目简介 H5DS (HTML5 Design software) 这是一款基于WEB的 H5制作工具. ...

  8. 基于HttpClient实现网络爬虫~以百度新闻为例

    转载请注明出处:http://blog.csdn.net/xiaojimanman/article/details/40891791 基于HttpClient4.5实现网络爬虫请訪问这里:http:/ ...

  9. 开发Nodejs(rest框架)版本的百度新闻系统--开发环境配置

    项目介绍:配置好开发环境,制作前端百度新闻界面,后台开发成Nodejs版本,做成做成rest风格API形式搭载mysql,使用Bootstrap搭建后台页面,完成对新闻的增删改查功能,利用Ajax配合 ...

随机推荐

  1. 【重走Android之路】【番外篇】关于==和equals

    [重走Android之路][番外篇]关于==和equals   在实际的编程当中,经常会使用==和equals来判断变量是否相同.但是这两种比较方式也常常让人搞得云里雾里摸不着头脑.下面是我个人做的总 ...

  2. Android 手机配office365邮箱

    1. 登录office365邮箱,Settings -> manager apps -> account -> Click "Settings for POP or IMA ...

  3. hdoj - 5202 Rikka with string (BestCoder Round #37 ($))

    http://acm.hdu.edu.cn/showproblem.php?pid=5202 字符串处理的题,要细心. 给定一个只包含小写字母和问号的字符串,让我们还原出本来的字符串,把问号替换成任意 ...

  4. ListView(3)关于listview滚动事件,何时滚动到顶部或底部

    给listview设置一个OnScrollListener就可 ListView.OnScrollListener scrollListener = new ListView.OnScrollList ...

  5. BZOJ 2351 Matrix(哈希)

    题目链接:http://61.187.179.132/JudgeOnline/problem.php?id=2351 题意:给出一个n*m的01矩阵.再给出10个A*B的小01矩阵.判断这些小的矩阵是 ...

  6. R语言实战读书笔记(四)基本数据管理

    4.2 创建新变量 几个运算符: ^或**:求幂 x%%y:求余 x%/%y:整数除 4.3 变量的重编码 with(): within():可以修改数据框 4.4 变量重命名 包reshape中有个 ...

  7. Qt之透明提示框

    简述 经常使用企鹅的小伙伴一定对登录失败的提示框很熟悉,主要涉及窗口透明并添加图标.提示信息.关闭按钮的显示等. 我们可以利用QWidget创建一个提示框,然后通过样式设置我们想要的效果. 简述 效果 ...

  8. postgresql之数据字典

    greenplum是基于postgresql开发的分布式数据库,里面大部分的数据字典是一样的.我们在维护gp的时候对gp的数据字典比较熟悉,特此分享给大家.在这里不会详细介绍每个字典的内容,只会介绍常 ...

  9. Scrum&Kanban在移动开发团队的实践 (二)

    Scrum&Kanban在移动开发团队的实践系列: Scrum&Kanban在移动开发团队的实践 (一) Scrum&Kanban在移动开发团队的实践 (二) 在第一篇分享文章 ...

  10. php多种实例理解无限极分类