Лев Константиновский

Практическое занятие по обработке текста в gensim с помощью алгоритма word2vec Льва Константиновского

Яндекс организует семинар Льва Константиновского, посвящённый обработке текста. https://events.yandex.ru/events/science-seminars/26-oct-2016/register/

При себе участникам нужно иметь ноутбуки со всеми необходимыми приложениями и Jupyter notebook, их можно скачать здесь. Также потребуется установить Google News word2vec model (1,5 ГБ). Опыт анализа текстов не нужен.

 

Автор прочтёт практическое введение в обработку текстов, написанных на естественных языках с помощью open source приложения gensim, познакомит участников с теорией алгоритма word2vec. Слушатели смогут научиться автоматически привязывать теги к документам на примере жанров и киносценариев. Также рассмотрят семь разных алгоритмов обработки текста: word2vec, doc2vec и другие.