资 源 简 介
Automatic correction of the language for words in the text because of the wrong keyboard layout
Автоматическое исправление языка для слов в тексте из-за неправильной раскладки клавиатуры
Purpose
Корректировка поисковых запросов
Корректировка существующих и новых текстов, публикуемых посетителями на веб-сайтах.
Features
Режим SIMILAR_CHARS. Исправление ошибочно набранных букв в словах, которые выглядят одинаково в разных раскладках клавиатуры. Незаметные латинские буквы среди русских исправляются в русские и наоборот. Алгоритм работает достаточно надёжно и быстро.
Режим KEYBOARD_LAYOUT. Исправление ошибочно набранных слов в другой раскладке клавиатуры. Для определения языка используются N-граммы. Алгоритм может иногда ошибаться, работает в разы медленнее, чем SIMILAR_CHARS. Алгоритм постоянно совершенствуется. Для поддержания качества существует тестовый набор слов, кото