Функция PHP фильтр ложной кириллицы убирает ложную кириллицу из текста. Ложную кириллицу часто используют для уникализации текстов, поэтому парсер часто может наткнуться на подобные "грязные" тексты, которые вручную очистить очень трудно. Функция очищает текст от ложной кириллицы, при этом обычно не трогает слова на английском языке - считает, что ложной кириллицей являются не все латинские символы, а лишь те которые рядом без пробела с кирилличными.
Собственно код состоит из 2-х функций, одна из которых - служебнаяя callback функция. Также для работы функция определяет глобальную переменную $__fauxCyrCharsReplaced, анализируя которую, можно узнать, сколько символов ложной кириллицы было заменено на настоящие.
Пример использования:
echo cleanup_faux_cyr( 'Текcт с лoжной kириллицeй' );