163k地方门户网站系统自动审核信息脚本
本代码实现对163k地方门户网站系统发布信息的自动审核,以及对内容中链接全过滤
软件安装
Python 安装
http://www.python.org/download/
pymssql安装
https://code.google.com/p/pymssql/downloads/list
两者版本要对应。
程序代码
kill.py
#coding=utf8
#!/usr/bin/env python
# 网站自动审核系统 import pymssql
import re
import sys
import datetime DB_HOSTNAME = r'127.0.0.1:1433'
DB_USERNAME = 'username'
DB_PASSWORD = 'password'
DB_DATABASE = 'menhu_163k' reload(sys)
sys.setdefaultencoding('utf-8') #*******Connection MSSQL *************
stat = False try:
ms_conn = pymssql.connect(host=DB_HOSTNAME, user=DB_USERNAME, password=DB_PASSWORD, database=DB_DATABASE, charset="UTF-8")
cur = ms_conn.cursor()
cur2 = ms_conn.cursor()
stat = True
except:
print 'Could nont connect to DB server.' def content_filter(content):
content = row[1]
re_a_qs = re.compile('<[aA][^>]*>')
content = re_a_qs.sub('', content)
re_a_js = re.compile('</[aA]>')
content = re_a_js.sub('', content)
return content if stat:
str_log = ''
# 信息模块内容审核
strSQL = "SELECT detailsid, chrmark FROM mh163k_live WHERE iskill=0"
cur.execute(strSQL)
rowcount = 0
for row in cur:
rowcount += 1 detailsid = str(row[0])
chrmark = content_filter(row[1])
#print row
strSQL = "UPDATE mh163k_live SET chrmark='" + chrmark + "', iskill=1 WHERE detailsid=" + str(detailsid)
#print strSQL
cur2.execute(strSQL)
ms_conn.commit() if rowcount:
str_log += str(datetime.datetime.now().strftime('%Y-%m,-%d %H:%M:%S')) + ': 信息模块审核' + str(rowcount) + "条\n" # 出租出售内容审核
strSQL = "SELECT id, chrmark FROM mh163k_house_chuzhu WHERE iskill=0"
cur.execute(strSQL)
rowcount = 0
for row in cur:
rowcount += 1 detailsid = str(row[0])
chrmark = content_filter(row[1])
#print row
strSQL = "UPDATE mh163k_house_chuzhu SET chrmark='" + chrmark + "', iskill=1 WHERE id=" + str(detailsid)
#print strSQL
cur2.execute(strSQL)
ms_conn.commit() if rowcount:
str_log += str(datetime.datetime.now().strftime('%Y-%m,-%d %H:%M:%S')) + ': 出租出售审核' + str(rowcount) + "条\n" #房产中介 内容审核
strSQL = "SELECT maniddd FROM mh163k_house_zhongjie WHERE iskill=0"
cur.execute(strSQL)
rowcount = 0
for row in cur:
rowcount += 1 row_id = str(row[0])
#print row
strSQL = "UPDATE mh163k_house_chuzhu SET iskill=1 WHERE manid=" + str(row_id)
#print strSQL
cur2.execute(strSQL)
ms_conn.commit() if rowcount:
str_log += str(datetime.datetime.now().strftime('%Y-%m,-%d %H:%M:%S')) + ': 房产中介审核' + str(rowcount) + "条\n" # 便民信息 内容审核
strSQL = "SELECT detailsid, chrcode FROM mh163k_live WHERE iskill=0"
cur.execute(strSQL)
rowcount = 0
for row in cur:
rowcount += 1 row_id = str(row[0])
content = content_filter(row[1])
#print row
strSQL = "UPDATE mh163k_live SET chrcode='" + content + "', iskill=1 WHERE detailsid=" + str(row_id)
#print strSQL
cur2.execute(strSQL)
ms_conn.commit() if rowcount:
str_log += str(datetime.datetime.now().strftime('%Y-%m,-%d %H:%M:%S')) + ': 便民信息审核' + str(rowcount) + "条\n" print str_log ms_conn.close()
f = open("./kill_log.txt", "a+")
f.write(str_log)
f.close #print '写入日志成功'
print '审核完成'
kill.bat
CD C:\Python27
C:
python D:\python\kill.py
添加Windows计划任务
设成为每10分钟运行一次
163k地方门户网站系统自动审核信息脚本的更多相关文章
- 163k地方门户网站系统js小Bug
163k地方门户网站系统后台在Firefox下无法通过选择区域来获取相对应的地段,IE浏览器下无些问题. Firebug提示错误为: ReferenceError: requestdataquyu i ...
- 对163k地方门户网站系统QQ互联功能修改
163k地方门户网站QQ互联申请时遇到的问题: "禁止开发商强制用户重新注册或绑定其他帐号" 原因是用户登录完QQ还需要注册帐号或者绑定原有帐号 163k地方门户网站的QQ互联登录 ...
- 163k地方门户网站系统团购定时结束限量控制
#coding=utf8 #!/usr/bin/env python # 网站自动审核系统 import pymssql import re import sys import datetime im ...
- United States Department of Agriculture 美国农业部网站数据自动下载小脚本
帮对象写的自动点击页面的小脚本,如果有需要的可以试试,(#^.^#) https://apps.fas.usda.gov/gats/ExpressQuery1.aspx var year = '199 ...
- MsSQLserver中修改字段值系统自动生成的脚本
主要参考一下脚本的实现思路: ①创建临时表 ②创建临时表 ③向临时表插入数据 ④删除原表 ⑤临时表改名 /* 为了防止任何可能出现的数据丢失问题,您应该先仔细检查此脚本,然后再在数据库设计器的上下文之 ...
- 我的ubuntu新系统自动装软件脚本
装一些常用软件 配一下环境变量 #!/bin/bash #download g++sudo apt-get install g++ -y#download codeblockssudo apt-get ...
- 2016/07/07 mymps(蚂蚁分类信息/地方门户系统)
mymps(蚂蚁分类信息/地方门户系统)是一款基于php mysql的建站系统.为在各种服务器上架设分类信息以及地方门户网站提供完美的解决方案. mymps,整站生成静态,拥有世界一流的用户体验,卓越 ...
- 外网主机访问虚拟机下的Web服务器_服务器应用_Linux公社-Linux系统门户网站
body{ font-family: "Microsoft YaHei UI","Microsoft YaHei",SimSun,"Segoe UI& ...
- 中小团队快速构建SQL自动审核系统
SQL审核与执行,作为DBA日常工作中相当重要的一环,一直以来我们都是通过人工的方式来处理,效率低且质量没办法保证.为了规范操作,提高效率,我们决定引入目前市面上非常流行的SQL自动审核工具Incep ...
随机推荐
- Ubuntu常用命令速查手册-珍藏版-完整版
sudo apt-get install 软件名 安装软件命令 sudo nautilus 打开文件(有root权限) su root 切换到“root” ls 列出当前目录文件(不包括隐含文件) l ...
- android获取屏幕宽高与获取控件宽高
获取屏幕宽高 // 获取屏幕宽高(方法1) int screenWidth = getWindowManager().getDefaultDisplay().getWidth(); // 屏幕宽(像素 ...
- iptables 顺序
-A INPUT -s 115.236.6.6/32 -p udp -m udp --dport 111 -j ACCEPT -A INPUT -s 10.175.197.98/32 -p udp - ...
- Linux企业级项目实践之网络爬虫(12)——处理HTTP应答头
Web服务器的HTTP应答一般由以下几项构成:一个状态行,一个或多个应答头,一个空行,内容文档.设置HTTP应答头往往和设置状态行中的状态代码结合起来.例如,有好几个表示"文档位置已经改变& ...
- Linux企业级项目实践之网络爬虫(9)——通过URL抓取网页内容
基本URL包含模式(或称协议).服务器名称(或IP地址).路径和文件名,如"协议://授权/路径?查询".完整的.带有授权部分的普通统一资源标志符语法看上去如下:协议://用户名: ...
- Linux企业级项目实践之网络爬虫(7)——DNS解析
DNS 是Domain Name Service的缩写.域名系统为Internet上的主机分配域名地址和IP地址.IP地址不易于记忆,然而域名地址相比较而言是方便于记忆的.用户如果使用域名地址,当想获 ...
- js基础例子dom+原型+oop基础知识记录01
//oo:概念是计算机中对于现实世界的理解和抽象的方法 //由计算机利用编程技术发展到现在的产物 //面向对象几要素 //对象:由属性和方法组成的集合 //属性:保存数据,存储在对象内存空间中的唯一的 ...
- 基于Cordova5.0开发自己定义插件(android)
1.开发插件java部分 watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvenhmMjE2MjE2/font/5a6L5L2T/fontsize/400/fi ...
- [Cycle.js] Main function and effects functions
We need to give structure to our application with logic and effects. This lessons shows how we can o ...
- IOS 6.0+ Autolayout — UITableViewCell 高度调整
要实现的效果 要求: storyboard上的准备工作 建好cell自定义AutoCell 类,关联好控件,事先准备好一些数据源 实现tableview的委托方法 核心部分,HeightForRow方 ...