UTF-8 テキストファイルの先頭識別子

UTF-8 で保存されたテキストファイルは、先頭に 0xEF 0xBB 0xBF の識別子が挿入されている
そのため、ファイル読込等で先頭に識別子がくっついたまま取得される場合がある

PHPの場合
$flag = chr(0xEF). chr(0xBB) . chr(0xBF);
if(substr($line, 0, 3) === $flag){
$line = substr($line, 3);
}



のようにして、識別子を除去しておかなければ、パターンマッチング(特に先頭行)しないという状況に陥る

コメント