Датасет слов английского языка
Обнаружил, что у Оксфордского университета есть списки распространенных слов и выражений английского языка. Доступны в традиционно «удобном» формате — html-амбразуре на сайте либо PDF.
Извлек их и сделал нормальные наборы данных в CSV. Например:
word | level | pos | definition_url | voice_url |
---|---|---|---|---|
abandon | b2 | verb | 📄 | 🗣️ |
ability | a2 | noun | 📄 | 🗣️ |
able | a2 | adjective | 📄 | 🗣️ |
abolish | c1 | verb | 📄 | 🗣️ |
и еще 5000 слов... |
Атрибутика:
word
— словоpos
— часть речиlevel
— уровень (A1, A2, B1, B2, C1)definition_url
— ссылка на подробное определениеvoice_url
— ссылка на озвучку в ogg
Посмотреть и скачать:
github.com/nalgeon/words
★ Подписывайтесь на новые заметки.