Objevila se u mne potřeba ošetřit uživatelské texty tak, aby neobsahovaly emoji a podobné patvary, které umožňuje UTF-8 kódování. Pár napsaných funkcí jsem objevil, ale nic, co by bylo bezchybné. No a tak jsem přemýšlel co s tím, a netrvalo dlouho, a předkládám vlastní řešení.
Je to jednoduché. Stačí uživatelský vstup v UTF-8 převést do kódování WINDOWS-1250 a zpět, s příznakem IGNORE. Veškerý bordel, který WINDOWS-1250 neumí, se ztratí. Hotovo, dobrá práce :)
function remove_emoji($vstup=null) { $vystup=iconv("UTF-8","WINDOWS-1250//IGNORE",$vstup); $vystup=iconv("WINDOWS-1250","UTF-8",$vystup); return $vystup; }