工作中需要判断某个文本中的URL是否能正常访问,并且随机获取其中N行能正常访问的URL数据,我的思路是:读取文本每一行数据,用urlopen访问,将返回状态码为200的URL保存到一个列表,获得列表长度,使用random产生一个随机值作为列表下标,获取该行数据.具体实现如下: import urllib2,random from sets import Set def get_responses(url): global good_list global bad_list if not url.…
--sql server 随机读取数据 * FROM [tablename] ORDER BY NEWID() pk from [tablename] ORDER BY NEWID()) --这两个方法都需要排序,因此IO的逻辑读取会比较多,而且CPU占用也多很多 * from tbname TABLESAMPLE(XXX rows) --XXX应该为整数,算法如下: --按照你表的行大小,计算一个数据页大概装多少行,XXX最少为每页的行数,建议填为2-3倍每页行数 --如果不愿意去算这个数,也…