文字列に日本語が含まれているかどうかを調べる

文字列に日本語が含まれているかどうかを調べるには、正規表現を利用することができます。次のメタ文字を使って、漢字かひらがなかカタカナが含まれていることをチェックします。文字列は、内部文字列になっている必要があります。

文字種 メタ文字
漢字 \p{Han}
ひらがな \p{Hiragana}
カナカナ \p{Katakana}
use strict;
use warnings;
use utf8;

my $str = 'あいウエ三';
if ($str =~ /[\p{Han}\p{Hiragana}\p{Katakana}]/) {
  # 日本語を含んでいる
}