PHPのhtmlentities()で (HTML4.0的に) 余計に実体参照に変換されてしまう文字の一覧
Bug #46478でid:hnwさんに報告していただいたバグを修正しようと思って作成したものですが…
そもそもこのバグを作ったのは私で、5年くらい前の話になりますが、HTML4.0でサポートされている実体参照のテーブルではなく、Unicode 1.1 以降は obsolete となっている SGML マッピングを採用してしまったのが事の発端であり、若気の至りなわけです。
例えば
┌|∵|┘
このようなはにわのAAが
┌|∵|┘
になってしまうところから推し測られるように、日本中のユーザサポートの方々のCPU時間を無駄に浪費させるような、凶悪極まりないバグとなっています。
∵などでググることで、影響の大きさが分かると思われます。
潔くfaviconの絵のような髪型にしたのでどうか許してください m(__)m
vArr | 8661 | ⇕ |
lAarr | 8666 | ⇚ |
rAarr | 8667 | ⇛ |
rarrw | 8669 | ⇝ |
comp | 8705 | ∁ |
nexist | 8708 | ∄ |
epsis | 8714 | ∊ |
notni | 8716 | ∌ |
bepsi | 8717 | ∍ |
coprod | 8720 | ∐ |
mnplus | 8723 | ∓ |
plusdo | 8724 | ∔ |
setmn | 8726 | ∖ |
compfn | 8728 | ∘ |
ang90 | 8735 | ∟ |
angmsd | 8737 | ∡ |
angsph | 8738 | ∢ |
mid | 8739 | ∣ |
nmid | 8740 | ∤ |
par | 8741 | ‖ |
npar | 8742 | ∦ |
conint | 8750 | ∮ |
becaus | 8757 | ∵ |
bsim | 8765 | ∽ |
wreath | 8768 | ≀ |
nsim | 8769 | ≁ |
sime | 8771 | ≃ |
nsime | 8772 | ≄ |
ncong | 8775 | ≇ |
nap | 8777 | ≉ |
ape | 8778 | ≊ |
bcong | 8780 | ≌ |
asymp | 8781 | ≍ |
bump | 8782 | ≎ |
bumpe | 8783 | ≏ |
lE | 8806 | ≦ |
gE | 8807 | ≧ |
lnE | 8808 | ≨ |
gnE | 8809 | ≩ |
Lt | 8810 | ≪ |
Gt | 8811 | ≫ |
twixt | 8812 | ≬ |
nlt | 8814 | ≮ |
ngt | 8815 | ≯ |
nles | 8816 | ≰ |
nges | 8817 | ≱ |
lsim | 8818 | ≲ |
gsim | 8819 | ≳ |
lg | 8822 | ≶ |
gl | 8823 | ≷ |
pr | 8826 | ≺ |
sc | 8827 | ≻ |
cupre | 8828 | ≼ |
sscue | 8829 | ≽ |
prsim | 8830 | ≾ |
scsim | 8831 | ≿ |
npr | 8832 | ⊀ |
nsc | 8833 | ⊁ |
nsup | 8837 | ⊅ |