|
2008年4月11日(金):ウィキペディアをオフラインのデスクトップで使う |
最近Googleで検索していると、個人サイトでウィキペディアのサービスをやっている方のページが引っかかる。郵便番号みたいにデータが公開されているのかな?と思って調べてみた。
Wikipedia:データベースダウンロード
http://ja.wikipedia.org/wiki/Wikipedia:%E3%83%87%E3%83%BC%E3%82%BF%E3%83%99%E3%83%BC%E3%82%B9%E3%83%80%E3%82%A6%E3%83%B3%E3%83%AD%E3%83%BC%E3%83%89
ここにまとまっているようだ。
データベースを公開されている方も利用者の方の利便性からいったらこういう風に公開していただけるとありがたいなぁと思う。まさに痒いところに手が届く感じだ。Namazだけだと全部検索語か番号を打ち込まなければならず、大変なのだ。トラフィックも大変だろうし。Wgetという便利なフリーソフトもあるけれど、やっぱ総当りでURLを何万回とサーバに問い合わせるよりひとつのファイルに圧縮していただけるとありがたいのだ。
一つ一つ見にくればいいじゃないか、という考え方もあるんだけれど、いつなくなってもおかしくないのがインターネットの世界、ピンと来た情報はそのときに保存しておかないともう二度とお目にかかれないことが多いのだ。
まあだからってデータベース作者の方に、データをまとめて一つのファイルにしてくれ、とは頼めないけれど。手間だし。
ただこういうウィキペディアみたいにまとめてあると本当に助かるし、ありがたいのだった。
で、ダウンロード。回線が細いのか時間がかかる。
今回はFree Dictionary でよく使われているEBWin Unicode版というのでDesktop環境にWikipediaをもってこようと思う。
で、まず
EBWin Unicode版
http://www.vector.co.jp/soft/dl/winnt/writing/se403151.html
をダウンロードしてインストール。いつもWindows2000をつかっているので、Windows2000にインストール。
次に、
FreePWING patch
http://ikazuhiro.s206.xrea.com/staticpages/index.php/freepwing
から
freepwing-1.4.4+20071226.tar.gz
wikipedia-fpw
http://ikazuhiro.s206.xrea.com/staticpages/index.php/wikipedia-fpw
から
wikipedia-fpw-20071202-src.tar.gz
をUbuntuの入ったパソコンにダウンロード。
あと
http://download.wikimedia.org/jawiki/
から
http://download.wikimedia.org/jawiki/20080408/jawiki-20080408-pages-articles.xml.bz2
をダウンロード。
まずfreepwing-1.4.4+20071226.tar.gzをインストール。
$ tar zxvf freepwing-1.4.4+20071226.tar.gz
$ cd freepwing-1.4.4+20071226
$ ./configure
$ sudo checkinstall
checkinstallについては
ソースファイルからRPMファイルを作成するには
http://www.atmarkit.co.jp/flinux/rensai/linuxtips/530mkrpmfs.html
を参照。Ubuntuはパッケージがあるのでapt-get install checkinstallでインストールできる。
UbuntuはDebian系なのでDで。
次にwikipedia-fpw-20071202-src.tar.gzを展開。これは展開するだけ。展開したらそのフォルダーの中にjawiki-20080408-pages-articles.xml.bz2を移動してくる。ドラッグアンドドロップでもいいし、cpでコピーしてきてもいい。で、wikipedia-fpw-20071202の中でbunzip2を使って解凍して、名前をjawiki-latest-pages-articles.xmlから wikipedia.xmlに変更する。
$ tar xzvf wikipedia-fpw-20071202-src.tar.gz
$ cd wikipedia-fpw-20071202
(ここで、このいまできたばかりのフォルダーに
jawiki-latest-pages-articles.xml.bz2を
コピーしておく)
$ bunzip2 jawiki-latest-pages-articles.xml.bz2
$ mv jawiki-latest-pages-articles.xml wikipedia.xml
でその後同じフォルダーの中で
$ fpwmake
$ fpwmake catalogs
$ fpwmake package
を処理する。
最初の$ fpwmakeが大体5,6時間かかる。後は10分とかそんなにかからないので、最初のファイルを作るときは空き時間を上手に使わないととんだ目にあう。
最後の$ fpwmake packageが終わると、wikipedia-fpw-20071202.zipというファイルが出来上がっているので、それをWindows2000へ移動する。今回のは705.9MBになった。
+Lhacaで展開後、EBWin同梱のEBshrinkを使って1GB超になったファイルを780MBくらいに圧縮。圧縮率はデフォルトの3段階目にしておいた。
早速EBWinで使ってみると快適に動く。いつも関連URLを押すと表示されるまでに時間がかかっていらいらしていたのが、これだとぱっぱっぱと次々現れる。ただし、図表関係は表示されない。図表がいるときにはネットで見ればいいだろう。
EBWinをつかうと、Windows2000にPHPやMysqlなどをインストールしなくてもいいので楽だ。
今後のデータの更新はこちらのページで。(気が向いたときにアップデートします)
フリーソフト紹介のページ
|
|
|