dedecms 的采集】的更多相关文章

http://www.360doc.com/content/14/0521/09/13870710_379547377.shtml http://www.360doc.com/content/14/0521/10/13870710_379552297.shtml http://www.360doc.com/content/14/0521/10/13870710_379553539.shtml 什么是采集? 将一个不错的网站的文章里的(标题,内容)copy到自己的网站上. 这个过程就叫采集.(将别…
现在的采集真是无处不在,尤其是对一些原创性站点,真是烦透了这些采集的人们,如何预防和防止采集呢,站长们!今天先说一下dedecms防采集的办法. 1.随机模版 方法:你多复制N多模版,在body标记附近稍微修改一下 只要你的模版够多,人家就失去耐性,放过你了 缺点:就是要复制N多模版,麻烦 2.防采集混淆 方法:在body表示是插入大量混淆字符别人采集也一并把混淆字符采集过去了. 缺点:有可能对SEO造成影响,对于图片站来说,假如别人不在乎你的混淆字符的话,人家照样采集,别人下载你的图片给你带来…
到很多网友都为织梦(DEDECMS)的采集教程头疼,的确,官方出的教程太笼统了,什么都没说,换个网站你什么都做不了,这个教程是最详尽的教程,让你一看即会! 一.列表采集 第一步.我们打开织梦后台点击采集——采集节点管理——增加新节点 第二步.这里我们以采集普通文章为例,我们选择普通文章,然后确定 第三步.进入了采集的设置页面,填写节点名称. 第四步.打开你想要采集的文章列表页. 这里以这个网站为例,http://www.nanmafan.com/xunyicao/打开这个页面, 右键——查看源文…
http://www.tuicool.com/articles/VziaEz    dede 第一步.我们打开织梦后台点击采集——采集节点管理——增加新节点 第二步.新增节点-配置网址索引 填写要采集的网站的列表相关规则, 查看采集站点的编码和网站源码 我们右键单击,点击查看源码,在源码的开头位置,找到一个写有charset=某一编码的meta标签,比如charset="gb2312",这个就是所说的网站编码了 选择采集站点的编码 第三步. 新增节点-配置文章网址匹配规则 我们查看采集…
dedecms采集去除a标签代码 DedeCMS采集规则-过滤-替换-技巧2009-01-14 15:491.采集去除链接[Copy to clipboard]CODE:{dede:trim}]*)>([^<]*){/dede:trim}-------------------------------- 让field:title 标题突破30这个长度,修改代码的方法找到./include/inc_arcpart_view.php行291 :if($titlelen=="")…
dedecms:限制栏目列表生成的最大页数防止被采集 如果您的网站数据量较大,列表很多的话甚至达到上千页,生成列表时就特别耗费时间,这个缺点可以被优化掉:网站好不容易建起来,担心网站内容被采集走,如果列表不加以限制,全站的文章都可以被采集索引到,为了防止这两种情况出现,小编今天给大家介绍一下具体实现方法: 1.添加新变量登陆织梦网站后台,依次点击:系统 - 系统基本参数 - 添加新变量变量名称:cfg_listmaxpage变量值:5(值可以自己修改)变量说明:栏目生成列表最大页数 2.修改程序…
过滤与替换常用操作:点击"常用规则",选择要过滤的代码段,再编辑成我们需要的.如果会文章简单采集了,接下来就需要过滤掉采集内容中的广告和链接及其它代码.一般的写法是{dede:trim}要过滤的内容{/dede:trim}  ,举几个例子:1,去除超链接,这种最常用.{dede:trim replace=''}<a([^>]*)>{/dede:trim}{dede:trim replace=''}</a>{/dede:trim}如果填成这样,那就把链接的文…
1.采集去除链接[Copy to clipboard]CODE:{dede:trim}]*)>([^<]*){/dede:trim}-------------------------------- 让field:title 标题突破30这个长度,修改代码的方法找到./include/inc_arcpart_view.php行291 :if($titlelen=="") $titlelen = 30;修改为if($titlelen=="") $titlel…
本来想偷懒在网上找一些文档去解决织梦采集缩略图地址带“/”的问题的,可是找了找发现没有人写出解决方法,只好自己动手了. 过程很复杂,找了问题的原因也是找了半天,自己一点一点的测试.最后找到了问题所在.下面是解决方法: 在include 文件夹中找到dedehtml2.class.php文件并打开: 找到529行,或者搜索 list($aimg, $atitle) = explode(':txt:', $atitle); 把这一行改成如下代码即可: list($aimg, $atitle) = e…
我已经解决了.现在把方法告诉你.都是我自己摸索出来的..虽然我不知道什么意思...下面是步骤: 1:找到 co_export.php然后找到这段代码: else if($itemName == 'pubdate') { $pubdate = trim($ctag->GetInnerText()); if(preg_match("#[^0-9]#", $pubdate)) { $pubdate = $sortrank = GetMkTime($pubdate); } /* else…