Вордфильтр: различия между версиями

Материал из Noobtype — единственного источника Истины во Вселенной
Перейти к навигации Перейти к поиску
мНет описания правки
 
(не показаны 3 промежуточные версии 2 участников)
Строка 3: Строка 3:


== Принцип работы ==
== Принцип работы ==
Главная цель вордфильтра — перехват слов, выражений или веб-адресов (спамфильтр) с целью воспрепятствовать их появлению на имиджборде. Существуют как минимум три метода, по которым фильтр может добиваться выполнения этой задачи:
Главная цель вордфильтра — перехват слов, выражений или веб-адресов (спамфильтр) с целью воспрепятствовать их появлению на имиджборде. Чаще всего для перехвата используются [[:wikipedia:ru:Регулярные_выражения|регулярные выражения]], от сложности и проработанности которых зависит его правильное срабатывание. Существуют как минимум три метода, по которым фильтр может добиваться выполнения этой задачи:
* '''Автозамена'''. Самый гуманный способ работы вордфильтра, при котором «неугодное» выражение при публикации сообщения автоматически превращается в нечто иное. Среди отечественных примеров можно назвать [[2-ch.ru]], где неприемлемое с точки зрения администратора прозвище чана «Тиреч» заменялось на «Двач».
* '''Автозамена'''. Самый гуманный способ работы вордфильтра, при котором «неугодное» выражение при публикации сообщения автоматически превращается в нечто иное. Среди отечественных примеров можно назвать [[2-ch.ru]], где неприемлемое с точки зрения администратора прозвище чана «Тиреч» заменялось на «Двач».
* '''Строка отклонена''' ({{lang-en|string refused}}). Сообщение с запрещёнными выражениями нельзя будет опубликовать вплоть до того, как пользователь уберёт или отредактирует отклоняемые слова. На неудачные попытки будет выдаваться сообщение с ошибкой «Строка отклонена». Активно используется на [[IIchan.ru]].
* '''Строка отклонена''' ({{lang-en|string refused}}). Сообщение с запрещёнными выражениями нельзя будет опубликовать вплоть до того, как пользователь уберёт или отредактирует отклоняемые слова. На неудачные попытки будет выдаваться сообщение с ошибкой «Строка отклонена». Активно используется на «[[Ычан]]е».
* '''Автоматический бан'''. Сообщения с запрещёнными словами не проходят, а их авторы получают бан, срок которого зависит от настроек. Применялся на [[Нульчан]]е.
* '''Автоматический бан'''. Сообщения с запрещёнными словами не проходят, а их авторы получают бан, срок которого зависит от настроек. Применялся на «[[Нульчан]]е».


== Методы преодоления ==
== Методы преодоления ==
В качестве методов обхода фильтров пользователи обычно используют либо разметку вида «откл''о''няемое с'''л'''ово», либо замену букв на похожие символы из других письменностей (омоглифы), либо невидимые символы Юникода. [[Вакаба]] позволяет обходить вордфильтр с помощью HTML-кодов символов.
В качестве методов обхода фильтров пользователи обычно используют либо разметку вида «откл''о''няемое с'''л'''ово», либо замену букв на похожие символы из других письменностей (омоглифы), либо невидимые символы Юникода. «[[Вакаба]]» позволяет обходить вордфильтр с помощью HTML-кодов символов.


Администраторы могут закрывать эти уязвимости с помощью регулярных выражений и иных средств.
Администраторы могут закрывать эти уязвимости с помощью улучшения работы алгоритмов регулярных выражений и иных средств.
[[Категория:Функции и компоненты движков]]
[[Категория:Функции и компоненты движков]]

Текущая версия от 03:39, 26 октября 2024

Список запрещённых слов на IIchan.ru см. на странице Архив:Вордфильтр

Вордфильтр (англ.: wordfilter, рус.: словофильтр) — одна из функций движков для имиджбордов. Иногда может быть совмещён со спамфильтром (англ.: spamfilter), имеющим сходное назначение.

Принцип работы

Главная цель вордфильтра — перехват слов, выражений или веб-адресов (спамфильтр) с целью воспрепятствовать их появлению на имиджборде. Чаще всего для перехвата используются регулярные выражения, от сложности и проработанности которых зависит его правильное срабатывание. Существуют как минимум три метода, по которым фильтр может добиваться выполнения этой задачи:

  • Автозамена. Самый гуманный способ работы вордфильтра, при котором «неугодное» выражение при публикации сообщения автоматически превращается в нечто иное. Среди отечественных примеров можно назвать 2-ch.ru, где неприемлемое с точки зрения администратора прозвище чана «Тиреч» заменялось на «Двач».
  • Строка отклонена (англ.: string refused). Сообщение с запрещёнными выражениями нельзя будет опубликовать вплоть до того, как пользователь уберёт или отредактирует отклоняемые слова. На неудачные попытки будет выдаваться сообщение с ошибкой «Строка отклонена». Активно используется на «Ычане».
  • Автоматический бан. Сообщения с запрещёнными словами не проходят, а их авторы получают бан, срок которого зависит от настроек. Применялся на «Нульчане».

Методы преодоления

В качестве методов обхода фильтров пользователи обычно используют либо разметку вида «отклоняемое слово», либо замену букв на похожие символы из других письменностей (омоглифы), либо невидимые символы Юникода. «Вакаба» позволяет обходить вордфильтр с помощью HTML-кодов символов.

Администраторы могут закрывать эти уязвимости с помощью улучшения работы алгоритмов регулярных выражений и иных средств.