Все расширения для SQLite

Мне очень нравится SQLite. Это миниатюрная встраиваемая база, которая отлично подходит как для исследовательского анализа данных, так и в качестве хранилища для небольших приложений (писал об этом, не буду повторяться).

Но есть у нее один недостаток: маловато встроенных функций по сравнению с PostgreSQL или Oracle. К счастью, авторы заложили в SQLite механизм расширений, на котором можно сделать почти все что угодно. В результате интернет заполнен обрывочными расширениями, которые добавляют функцию-другую.

Мне хотелось большой системности. В результате появился проект sqlean — в нем я собираю вместе недостающие в SQLite функции, распределяю их по модулям, рефакторю код, пишу тесты и документацию. Получается что-то вроде стандартной библиотеки, как в Python или Go, только для SQLite.

Я планирую подробно написать про каждый модуль в отдельной статье, а пока — вот краткий обзор.

Основной набор

Это самые популярные функции, которых не хватало в SQLite:

  • crypto: криптографические хеш-функции вроде MD5, SHA-1 и SHA-256.
  • fileio: работа с файловой системой — чтение и запись файлов, создание каталогов.
  • fuzzy: нечеткое сравнение строк, фонетические алгоритмы, транслитерация.
  • ipaddr: манипуляция IP-адресами и подсетями.
  • json1: работа с JSON.
  • math: математические функции.
  • re: регулярные выражения.
  • stats: статистика — медиана, процентили, стандартное отклонение.
  • text: работа со строками.
  • unicode: поддержка юникода для функций upper(), lower() и LIKE.
  • uuid: генерация уникальных идентификаторов.
  • vsv: работа с CSV-файлами как с таблицами базы.

Все расширения можно скачать для Windows, Linix и macOS.

Инкубатор

Функции, которые пока не вошли в основной набор. Эти расширения могут быть плохо структурированы, но я их постепенно рефакторю и переношу в основные.

  • array: работа с массивами (почти как в постгресе).
  • besttype: преобразует строку в подходящий числовой тип.
  • bloom: быстрый вероятностный способ понять, есть значение в таблице или нет.
  • cbrt: кубический корень из числа.
  • classifier: бинарный классификатор на логистической регрессии.
  • compress и sqlar: архивация и распаковка данных.
  • cron: проверяет даты по cron-шаблонам.
  • define: динамически создает скалярные и табличные функции прямо из SQL.
  • envfuncs: читает переменные среды.
  • eval: выполняет произвольные SQL-запросы.
  • fcmp: сравнение и округление десятичных дробей.
  • isodate: дополнительные функции для работы с датами.
  • math2: больше математических функций и битовой арифметики.
  • pearson: корреляция Пирсона между двумя наборами данных.
  • pivotvtab: сводные таблицы.
  • recsize: считает размер записи в таблице.
  • spellfix: быстрый поиск похожих слов в словаре.
  • stats2 и stats3: еще больше матстатистики.
  • text2: еще больше функций для работы со строками.
  • uint: натуральная сортировка и сравнение строк, содержащих числа (natsort).
  • unhex: преобразует строку в бинарные данные (обратная операция для hex()).
  • xmltojson: преобразует XML в JSON.
  • zipfile: читает и пишет zip-архивы.

Голосуйте за расширения в инкубаторе! Чем популярнее расширение, тем быстрее оно попадет в основной набор.

Инкубаторные расширения тоже можно скачать.

Как подключить расширение

Есть три способа. Если работаете с командной строкой SQLite (sqlite.exe):

sqlite> .load ./stats
sqlite> select median(value) from generate_series(1, 99);

Если используете инструмент вроде DB Browser for SQLite, SQLite Expert или DBeaver:

select load_extension('c:\Users\anton\sqlite\stats.dll');
select median(value) from generate_series(1, 99);

Если работаете из Python (в других языках аналогично):

import sqlite3

connection = sqlite3.connect(":memory:")
connection.enable_load_extension(True)
connection.load_extension("./stats.so")
connection.execute("select median(value) from generate_series(1, 99)")
connection.close()

Что дальше

Если почувствуете, что в SQLite вам не хватает какой-то функции — приходите в репозиторий sqlean, там наверняка найдется.

Я продолжаю добавлять новые расширения в инкубатор, а расширения из инкубатора рефакторю и переношу в основные. По каждому основному модулю планирую написать отдельную статью с примерами.

А если захотите поучаствовать — присылайте свои или чужие расширения.

Всем SQLite!

Подписывайтесь на канал и рассылку, чтобы не пропустить новые заметки 🚀