分け入っても分け入っても...

mb_check_encodingは何をチェックするのか(その3 UTF-8編)で指摘していただいた (thx!) バグを直しているときに気づいた。

みんなよく聞いてくれ!悪いのはmbstringだけじゃないんだ!

といって自己正当化してみるテスト。

<?php
var_dump(utf8_decode("\xc0\xb1\xc0\xb2\xc0\xb3"));
var_dump(htmlentities("\xc0\xbc\xc0\xbe", ENT_QUOTES, "UTF-8"));
?>

結果

string(3) "123"
string(8) "&lt;&gt;"

もうやめ (ry