分け入っても分け入っても...
mb_check_encodingは何をチェックするのか(その3 UTF-8編)で指摘していただいた (thx!) バグを直しているときに気づいた。
みんなよく聞いてくれ!悪いのはmbstringだけじゃないんだ!
といって自己正当化してみるテスト。
<?php var_dump(utf8_decode("\xc0\xb1\xc0\xb2\xc0\xb3")); var_dump(htmlentities("\xc0\xbc\xc0\xbe", ENT_QUOTES, "UTF-8")); ?>
結果
string(3) "123"
string(8) "<>"
もうやめ (ry