namazu_utf8 コマンド

最近の Unix 環境は UTF-8 なので、namazu コマンドが使いづらくなっています。

以下のような内容のラッパシェルスクリプト  namazu_utf8 を作成しました。

#!/bin/sh

LC_ALL=ja_JP.eucJP
LANGUAGE=ja_JP.eucJP
LANG=ja_JP.eucJP
namazu `echo -n $* | iconv -f UTF-8 -t EUC-JP` | iconv -f EUC-JP -t UTF-8

この namazu_utf8 に実行属性を付けて、パスの通ったところ(例えば /usr/local/bin )にでも入れておけば、namazu_utf8 を namazu コマンドの代わりに使えます。

$ chmod +x namazu_utf8
$ su
# cp namazu_utf8 /usr/local/bin

ただし、漢字コード変換に iconv を使っているので、iconv  がインストールされている必要があります。

例えば

$ namazu 検索式 index

の代わりに ja_JP.utf8 環境では

$ namazu_utf8 検索式 index

とすることで、日本語を含む検索式の検索結果を得ることができます。 (インデックスは正しく作られている前提です。)

 

PGP 公開鍵サーバ

昔は多くの PGP 公開鍵サーバがありましたが、有名なところも含めていろいろと閉鎖されています。

現在、生きている公開鍵サーバを以下にリストアップしておきます。(11/08/2015現在)

なお、Namazu の tarball は PGP 公開鍵で署名されています。

 

Namazu の EPUB フィルタ

はじめに

電子書籍用ファイル EPUB の文書フィルタ(epub.pl)を追加しました。

Namazu でEPUBの検索が可能となります。
DRM フリーなものに限りますが、DRM がかけられたものも文書情報ぐらいは取れると思います。(未確認)

EPUB2 のテストデータ tests/data/ja/epub2.epub も追加しています。

動作環境

epub.pl フィルタは、EXT_ZIP, EXT_UTF8 をサポートしている環境でのみ動作します。(NKF や Compress::Zlib Perl モジュールがインストールされておれば大丈夫です。)

実行例

$ mknmz epub2.epub

 

epub2.epub ファイルのインデキシングを行います。

最後に

Namazu 2.0.22 からの対応となります。