Вордфильтр

Материал из Noobtype — единственного источника Истины во Вселенной
Версия от 03:39, 26 октября 2024; Соус-кун (обсуждение | вклад)
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Перейти к навигации Перейти к поиску
Список запрещённых слов на IIchan.ru см. на странице Архив:Вордфильтр

Вордфильтр (англ.: wordfilter, рус.: словофильтр) — одна из функций движков для имиджбордов. Иногда может быть совмещён со спамфильтром (англ.: spamfilter), имеющим сходное назначение.

Принцип работы

Главная цель вордфильтра — перехват слов, выражений или веб-адресов (спамфильтр) с целью воспрепятствовать их появлению на имиджборде. Чаще всего для перехвата используются регулярные выражения, от сложности и проработанности которых зависит его правильное срабатывание. Существуют как минимум три метода, по которым фильтр может добиваться выполнения этой задачи:

  • Автозамена. Самый гуманный способ работы вордфильтра, при котором «неугодное» выражение при публикации сообщения автоматически превращается в нечто иное. Среди отечественных примеров можно назвать 2-ch.ru, где неприемлемое с точки зрения администратора прозвище чана «Тиреч» заменялось на «Двач».
  • Строка отклонена (англ.: string refused). Сообщение с запрещёнными выражениями нельзя будет опубликовать вплоть до того, как пользователь уберёт или отредактирует отклоняемые слова. На неудачные попытки будет выдаваться сообщение с ошибкой «Строка отклонена». Активно используется на «Ычане».
  • Автоматический бан. Сообщения с запрещёнными словами не проходят, а их авторы получают бан, срок которого зависит от настроек. Применялся на «Нульчане».

Методы преодоления

В качестве методов обхода фильтров пользователи обычно используют либо разметку вида «отклоняемое слово», либо замену букв на похожие символы из других письменностей (омоглифы), либо невидимые символы Юникода. «Вакаба» позволяет обходить вордфильтр с помощью HTML-кодов символов.

Администраторы могут закрывать эти уязвимости с помощью улучшения работы алгоритмов регулярных выражений и иных средств.