fuzzy: Нечеткое сравнение строк в SQLite
Расширение nalgeon/fuzzy помогает сравнивать строки на похожесть и транслитерировать текст.
Одни функции считают расстояние между строками (чем оно больше, тем сильнее отличаются строки):
-- Расстояние Дамерау-Левенштейна
select fuzzy_damlev('awesome', 'aewsme');
-- 2
-- Расстояние Хэмминга
select fuzzy_hamming('awesome', 'aewsome');
-- 2
-- Расстояние Джаро-Винклера
select fuzzy_jarowin('awesome', 'aewsme');
-- 0.907142857142857
Другие функции рассчитывают фонетический код строки (помогает определять слова, которые похоже звучат):
-- Caverphone
select fuzzy_caver('awesome');
-- AWSM111111
select fuzzy_caver('owesome');
-- AWSM111111
-- Refined soundex
select fuzzy_rsoundex('awesome');
-- A03080
select fuzzy_rsoundex('awssome');
-- A03080
Транслитерация преобразует строку в ASCII-строку (только латинские символы), чтобы с ней могли работать функции расстояния и фонетики:
select fuzzy_translit('sí señor');
-- si senor
select fuzzy_translit('привет');
-- privet
★ Подписывайтесь на новые заметки.