NAME
AozoraBunko::Tools::Checkerkun - 青空文庫の工作員のための文字チェッカー(作:結城浩)をライブラリ化したもの
SYNOPSIS
use AozoraBunko::Tools::Checkerkun;
use utf8;
my $checker = AozoraBunko::Tools::Checkerkun->new();
$checker->check('森鴎※[#「區+鳥」、第3水準1-94-69]外💓'); # => '森鴎※[#「區+鳥」、第3水準1-94-69] → [78hosetsu_tekiyo]【鴎】 外💓 [gaiji]【💓】 '
DESCRIPTION
AozoraBunko::Tools::Checkerkun は、青空文庫工作員のための文字チェッカーで、結城浩氏が作成したツールを私がライブラリ化したものです。
METHODS
$checker = AozoraBunko::Tools::Checkerkun->new(\%option)
新しい Aozorabunko::Tools::Checkerkun インスタンスを生成する。
my $checker = AozoraBunko::Tools::Checkerkun->new(
'gaiji' => 1, # JIS外字をチェックする
'hansp' => 1, # 半角スペースをチェックする
'hanpar' => 1, # 半角カッコをチェックする
'zensp' => 0, # 全角スペースをチェックする
'78hosetsu_tekiyo' => 1, # 78互換包摂の対象となる不要な外字注記をチェックする
'hosetsu_tekiyo' => 1, # 包摂の対象となる不要な外字注記をチェックする
'78' => 0, # 78互換包摂29字をチェックする
'jyogai' => 0, # 新JIS漢字で包摂規準の適用除外となる104字をチェックする
'gonin1' => 0, # 誤認しやすい文字をチェックする(1)
'gonin2' => 0, # 誤認しやすい文字をチェックする(2)
'gonin3' => 0, # 誤認しやすい文字をチェックする(3)
'simplesp' => 0, # 半角スペースは「_」で、全角スペースは「□」で出力する
);
上記のコードで設定されている値がデフォルト値です。
$checked_text = $checker->check($text)
new で指定したオプションでテキストをチェックします。戻り値はチェック済みのテキストです。
LICENSE
Copyright (C) pawa.
This library is free software; you can redistribute it and/or modify it under the same terms as Perl itself.
SEE ALSO
JIS漢字で包摂の扱いが変わる文字([78] [jyogai] など)
AUTHOR
pawa pawa@pawafuru.com