Subscribed unsubscribe Subscribe Subscribe

PHPのhtmlentities()で (HTML4.0的に) 余計に実体参照に変換されてしまう文字の一覧

Bug #46478id:hnwさんに報告していただいたバグを修正しようと思って作成したものですが…

そもそもこのバグを作ったのは私で、5年くらい前の話になりますが、HTML4.0でサポートされている実体参照のテーブルではなく、Unicode 1.1 以降は obsolete となっている SGML マッピングを採用してしまったのが事の発端であり、若気の至りなわけです。

例えば

┌|∵|┘

このようなはにわのAAが

┌|∵|┘

になってしまうところから推し測られるように、日本中のユーザサポートの方々のCPU時間を無駄に浪費させるような、凶悪極まりないバグとなっています。

∵などでググることで、影響の大きさが分かると思われます。

潔くfaviconの絵のような髪型にしたのでどうか許してください m(__)m

vArr 8661
lAarr 8666
rAarr 8667
rarrw 8669
comp 8705
nexist 8708
epsis 8714
notni 8716
bepsi 8717
coprod 8720
mnplus 8723
plusdo 8724
setmn 8726
compfn 8728
ang90 8735
angmsd 8737
angsph 8738
mid 8739
nmid 8740
par 8741
npar 8742
conint 8750
becaus 8757
bsim 8765
wreath 8768
nsim 8769
sime 8771
nsime 8772
ncong 8775
nap 8777
ape 8778
bcong 8780
asymp 8781
bump 8782
bumpe 8783
lE 8806
gE 8807
lnE 8808
gnE 8809
Lt 8810
Gt 8811
twixt 8812
nlt 8814
ngt 8815
nles 8816
nges 8817
lsim 8818
gsim 8819
lg 8822
gl 8823
pr 8826
sc 8827
cupre 8828
sscue 8829
prsim 8830
scsim 8831
npr 8832
nsc 8833
nsup 8837