Проект «Приглашённый спикер». Лекция Вадима Шульгинова, ведущего специалиста Департамента бизнес-анализа «Ростелеком»
14 декабря в рамках проекта «Приглашённый спикер» в 10.10 в аудитории 1431 состоится встреча с Вадимом Шульгиновым — ведущим специалистом Департамента бизнес-анализа «Ростелеком», участником гранта «Исследование когнитивной организации электронного гипертекста с помощью методов цифровой гуманитаристики».
Тема встречи: «Использование NLP-методов при разработке когнитивной модели электронного гипертекста».
1). Проект по сбору, обработке текстов и ссылок в СМИ с использованием Python и MongoDB;
2). Задачи проекта и технические решения;
3). Особенности сбора информации из СМИ, Instagram, Telegram;
4). Многопоточный парсинг;
5). Библиотеки Python для работы с текстом – PyMorphy, Udpipe, NLTK;
6). Обработка текстов и ссылок, нюансы html-разметки;
7). Векторизованные представления текстов, Word2Vec;
8). Выбор базы данных – Sql/NoSql;
9). Переход с личного ноутбука на облако.
Организаторы: Кафедра информационных технологий и систем ВГУЭС