为什么使用离线维基百科?一是因为最近英文维基百科被封,无法访问;二是不受网络限制,使用方便,缺点是不能及时更新,可能会有不影响阅读的乱码。

  目前,主要有两种工具用来搜索和浏览离线维基百科数据:Kiwix 和 WikiTaxi 。这两种都是免费的,但 WikiTaxi 只有 Windows 版本,而 Kiwix 不仅支持 Windows、Linux 和 Mac,而且还支持 Android 和 iOS 。

Kiwix

Kiwix 是免费开源软件。使用 Kiwix Reader 应用浏览维基百科内容,支持内容包的格式为 VIM。

官方网址为 https://www.kiwix.org

Kiwix Reader下载网址为 https://www.kiwix.org/en/downloads/kiwix-reader/

VIM 内容包下载网址为 https://wiki.kiwix.org/wiki/Content_in_all_languages ,从中你可以选择各种语言的维基百科内容包,支持两种下载方式:种子下载和直接下载。同时 Kiwix 还支持在 Kiwis Reader 应用内部下载,在应用的左侧栏选择 “ALL Files”,即可看到可供下载的内容。

使用方法:在 Kiwix Reader 中,°°° -> File -> Open file,选择下载的 维基百科内容包,即可。

注:Kiwix Version : 2.0-beta5-18-gc42d2d0;  Build date : Fri 06/14/2019

WikiTaxi

WikiTaxi 是一个单文件应用,无需数据库引擎和 HTML 浏览器,就可以离线查看、搜索和浏览下载到计算机上的维基百科数据库。

官方网址为 https://www.yunqa.de/delphi/products/wikitaxi/index

下载网址为 https://www.yunqa.de/delphi/downloads/WikiTaxi_1.3.0.zip

使用方法:

  1. 首先使用 WikiTaxi_1.3.0.zip 压缩包中的 WikiTaxi_Importer.exe 将 .xml.bz2 格式转为 taxi 格式;
  2. 然后使用压缩包中的 WikiTaxi.exe 打开 taxi 格式文件,即可使用。

注:最新的维基百科数据库文件 (xml.bz2 格式)需要从如下网址下载:

最新的中文维基百科数据库下载网址:https://download.wikipedia.org/zhwiki/latest/zhwiki-latest-pages-articles.xml.bz2

最新的英文维基百科数据库下载网址:https://download.wikimedia.org/enwiki/latest/enwiki-latest-pages-articles.xml.bz2

参考资料

[1] 分享离线版维基百科. https://zhuanlan.zhihu.com/p/25410565

[2] How can I browse Wikipedia's offline database on Linux? https://askubuntu.com/questions/171860/how-can-i-browse-wikipedias-offline-database-on-linux

[3] How To Download And View Wikipedia Offline. https://www.investintech.com/resources/blog/archives/4198-view-download-wikipedia-offline.html

[4] WikiTaxi 离线中英文维基百科数据库搜索阅读工具绿色免费版下载 (可装进U盘随处使用查询). https://www.iplaysoft.com/wikitaxi.html

搜索和浏览离线 Wikipedia 维基百科(中/英)数据工具的更多相关文章

  1. wikipedia 维基百科 语料 获取 与 提取 处理 by python3.5

    英文维基百科 https://dumps.wikimedia.org/enwiki/ 中文维基百科 https://dumps.wikimedia.org/zhwiki/ 全部语言的列表 https: ...

  2. Sqlite3,维基百科中的练习:

    https://en.wikibooks.org/wiki/SQL_Exercises/The_computer_store 两个相连的表格 Manufactures: code, name prod ...

  3. 安装使用离线版本的维基百科(Wikipedia)

    1 相关背景 平常大家在上网查询一些基本概念的时候常常会参考维基百科上面的资料,但是由于方校长研制的GFW(长城防火墙系统)强大的屏蔽功能,好多链接打开以后,不出意外会出现著名的“404NOT FOU ...

  4. 使用JWPL (Java Wikipedia Library)操作维基百科数据

    使用JWPL (Java Wikipedia Library)操作维基百科数据 1. JWPL介绍 JWPL(Java Wikipedia Library)是一个开源的访问wikipeida数据的Ja ...

  5. 中英文维基百科语料上的Word2Vec实验

    最近试了一下Word2Vec, GloVe 以及对应的python版本 gensim word2vec 和 python-glove,就有心在一个更大规模的语料上测试一下,自然而然维基百科的语料进入了 ...

  6. JWPL工具处理维基百科wikipedia数据用于NLP

    JWPL处理维基百科数据用于NLP 处理zhwiki JWPL是一个Wikipedia处理工具,主要功能是将Wikipedia dump的文件经过处理.优化导入mysql数据库,用于NLP过程.以下以 ...

  7. 110G离线维基百科数据免费拿

    110G离线维基百科数据免费拿.. 资料获取方式,关注公总号RaoRao1994,查看往期精彩-所有文章,即可获取资源下载链接 更多资源获取,请关注公总号RaoRao1994

  8. 从维基百科等网站复制公式到MathType中

    在写论文的时候你会想要一些比书本上更好的实例,所以你会在网上寻找资源.当你发现一个你想要的公式时,发现网页公式复制粘贴后太模糊而不适合打印或者投影.这种问题在MathType中如何解决呢? 你可以将网 ...

  9. 通过维基API实现维基百科查询功能

    通过英文维基的免费API,可以实现对维基百科的搜索查询或者标题全文查询等,尝试了一下通过title实现全文查询,返回的结果是wikitext格式,暂时不知道该如何应用,所以仅实现了查询功能,可以返回最 ...

随机推荐

  1. OI蒟蒻收集的各种网址集合(无标记

    本地收藏夹伤不起…… https://zh.wikipedia.org/wiki/Template:%E7%AE%97%E6%B3%95 https://courses.csail.mit.edu/6 ...

  2. Makefile之编译运行连接库方法

    LIBS+= -L $$PWD/../HKUnifyCamera_one/Debug -lHKUnifyCamera -luuid -Wl,-rpath=$$PWD/../HKUnifyCamera_ ...

  3. nginx 配置参数优化

    nginx作为高性能web服务器,即使不特意调整配置参数也可以处理大量的并发请求.以下的配置参数是借鉴网上的一些调优参数,仅作为参考,不见得适于你的线上业务. worker进程 worker_proc ...

  4. Java 集合系列之四:Queue基本操作

    1. Java Queue 1. Java Queue 重要观点 Java Queue接口是Java Collections Framework的成员. Queue 实现通常不允许插入 null 元素 ...

  5. 7种 JVM 垃圾收集器特点、优劣势及使用场景(多图)

    7种 JVM 垃圾收集器特点.优劣势及使用场景(多图)  mp.weixin.qq.com 点击上方"IT牧场",选择"设为星标"技术干货每日送达! 一.常见垃 ...

  6. Idea 设置单击打开文件或者双击打开文件、自动定位文件所在的位置

    以下定位,框架下,打开文件的点击方式,以及点击标签导航页上的已打开文件定位到展开路径,如下图:

  7. 【VS开发】【C/C++开发】关于boost库的C++11导致的undefined符号问题

    undefined reference to boost::program_options::options_description::m_default_line_length 问题最终解决依靠的是 ...

  8. 实现简单的AOP前置后置增强

    AOP操作是我们日常开发经常使用到的操作,例如都会用到的spring事务管理.今天我们通过一个demo实现对一个类的某一个方法进行前置和后置的增强. //被增强类 public class PetSt ...

  9. Spring的NamedParameterJdbcTemplate的简单使用

    原文地址:https://www.iteye.com/blog/itommy-2354746 Spring JDBC包提供了JdbcTemplate和它的两个兄弟SimpleJdbcTemplate和 ...

  10. Python3版本号比较代码实现

    一.版本号比较的困难 不能直接以字符串形式进行比较:对于1.3和1.4直接以字符串进行比较是可以正确得出1.4比1.3大:但如果是1.3和1.14还直接进字符串比较那就是1.3比1.14大那就不对了. ...