trade2の日記

2008/4/11(金)
ウィキペディアをオフラインのデスクトップで使う

最近Googleで検索していると、個人サイトでウィキペディアのサービスをやっている方のページが引っかかる。郵便番号みたいにデータが公開されているのかな?と思って調べてみた。


Wikipedia:データベースダウンロード
http://ja.wikipedia.org/wiki/Wikipedia:%E3%83%87%E3%83%BC%E3%82%BF%E3%83%99%E3%83%BC%E3%82%B9%E3%83%80%E3%82%A6%E3%83%B3%E3%83%AD%E3%83%BC%E3%83%89


ここにまとまっているようだ。
データベースを公開されている方も利用者の方の利便性からいったらこういう風に公開していただけるとありがたいなぁと思う。まさに痒いところに手が届く感じだ。Namazだけだと全部検索語か番号を打ち込まなければならず、大変なのだ。トラフィックも大変だろうし。Wgetという便利なフリーソフトもあるけれど、やっぱ総当りでURLを何万回とサーバに問い合わせるよりひとつのファイルに圧縮していただけるとありがたいのだ。
一つ一つ見にくればいいじゃないか、という考え方もあるんだけれど、いつなくなってもおかしくないのがインターネットの世界、ピンと来た情報はそのときに保存しておかないともう二度とお目にかかれないことが多いのだ。
まあだからってデータベース作者の方に、データをまとめて一つのファイルにしてくれ、とは頼めないけれど。手間だし。
ただこういうウィキペディアみたいにまとめてあると本当に助かるし、ありがたいのだった。


で、ダウンロード。回線が細いのか時間がかかる。


今回はFree Dictionary でよく使われているEBWin Unicode版というのでDesktop環境にWikipediaをもってこようと思う。

で、まず

EBWin Unicode版
http://www.vector.co.jp/soft/dl/winnt/writing/se403151.html

をダウンロードしてインストール。いつもWindows2000をつかっているので、Windows2000にインストール。



次に、

FreePWING patch
http://ikazuhiro.s206.xrea.com/staticpages/index.php/freepwing

から
freepwing-1.4.4+20071226.tar.gz

wikipedia-fpw
http://ikazuhiro.s206.xrea.com/staticpages/index.php/wikipedia-fpw

から
wikipedia-fpw-20071202-src.tar.gz

をUbuntuの入ったパソコンにダウンロード。


あと
http://download.wikimedia.org/jawiki/

から
http://download.wikimedia.org/jawiki/20080408/jawiki-20080408-pages-articles.xml.bz2
をダウンロード。


まずfreepwing-1.4.4+20071226.tar.gzをインストール。



$ tar zxvf freepwing-1.4.4+20071226.tar.gz
$ cd freepwing-1.4.4+20071226
$ ./configure
$ sudo checkinstall




checkinstallについては

ソースファイルからRPMファイルを作成するには
http://www.atmarkit.co.jp/flinux/rensai/linuxtips/530mkrpmfs.html

を参照。Ubuntuはパッケージがあるのでapt-get install checkinstallでインストールできる。

UbuntuはDebian系なのでDで。

次にwikipedia-fpw-20071202-src.tar.gzを展開。これは展開するだけ。展開したらそのフォルダーの中にjawiki-20080408-pages-articles.xml.bz2を移動してくる。ドラッグアンドドロップでもいいし、cpでコピーしてきてもいい。で、wikipedia-fpw-20071202の中でbunzip2を使って解凍して、名前をjawiki-latest-pages-articles.xmlから wikipedia.xmlに変更する。





$ tar xzvf wikipedia-fpw-20071202-src.tar.gz
$ cd wikipedia-fpw-20071202

(ここで、このいまできたばかりのフォルダーに
jawiki-latest-pages-articles.xml.bz2を
コピーしておく)

$ bunzip2 jawiki-latest-pages-articles.xml.bz2
$ mv jawiki-latest-pages-articles.xml wikipedia.xml







でその後同じフォルダーの中で






$ fpwmake
$ fpwmake catalogs
$ fpwmake package 




を処理する。

最初の$ fpwmakeが大体5,6時間かかる。後は10分とかそんなにかからないので、最初のファイルを作るときは空き時間を上手に使わないととんだ目にあう。

最後の$ fpwmake packageが終わると、wikipedia-fpw-20071202.zipというファイルが出来上がっているので、それをWindows2000へ移動する。今回のは705.9MBになった。


+Lhacaで展開後、EBWin同梱のEBshrinkを使って1GB超になったファイルを780MBくらいに圧縮。圧縮率はデフォルトの3段階目にしておいた。


早速EBWinで使ってみると快適に動く。いつも関連URLを押すと表示されるまでに時間がかかっていらいらしていたのが、これだとぱっぱっぱと次々現れる。ただし、図表関係は表示されない。図表がいるときにはネットで見ればいいだろう。

EBWinをつかうと、Windows2000にPHPやMysqlなどをインストールしなくてもいいので楽だ。

今後のデータの更新はこちらのページで。(気が向いたときにアップデートします)

フリーソフト紹介のページ





BACKNUMBER


女の子お絵かき掲示板ナスカiPhone修理