用Python编一个抓网页的程序是非常快的,下面就是一个例子: import urllib2 html = urllib2.urlopen('http://blog.raphaelzhang.com').read() 但是在实际工作中,这种写法是远远不够的,至少会遇到下面几个问题: 网络会出错,任何错误都可能.例如机器宕了,网线断了,域名出错了,网络超时了,页面没有了,网站跳转了,服务被禁了,主机负载不够了… 服务器加上了限制,只让常见浏览器访问 服务器加上了防盗链的限制 某些2B网站不管你HT…