Need 在如今的互联网市场上相关的网络爬虫软件已然很多,要想赢得客户,高效.稳定.创新都必不可少的. 我们初步阅读和运行了上一届团队的项目,决定从以下几个方面修改和完善创新这一项目: 1.改善对爬取网页的分类策略 某些URL抓取的数目会十分庞大,而用户的使用该软件的需求就是要快速地找到最需要的信息,如果直接把这一大串URL或者初略地进行分类返回给用户,反而让用户不知从何下手.我们的软件是针对计算机科学来爬取的,而计算机领域中信息多种多样,这要求我们需要一个更为高效和快速的分类器,尽可能运用最佳