Проект «Приглашённый спикер». Лекция Вадима Шульгинова, ведущего специалиста Департамента бизнес-анализа «Ростелеком»

14 Декабря, 10:10

Аудитория 1431

14 декабря в рамках проекта «Приглашённый спикер» в 10.10 в аудитории 1431 состоится встреча с Вадимом Шульгиновым — ведущим специалистом Департамента бизнес-анализа «Ростелеком», участником гранта «Исследование когнитивной организации электронного гипертекста с помощью методов цифровой гуманитаристики».

 Тема встречи: «Использование NLP-методов при разработке когнитивной модели электронного гипертекста».

 1). Проект по сбору, обработке текстов и ссылок в СМИ с использованием Python и MongoDB;

 2). Задачи проекта и технические решения;

 3). Особенности сбора информации из СМИ, Instagram, Telegram;

 4). Многопоточный парсинг;

5). Библиотеки Python для работы с текстом –  PyMorphy, Udpipe, NLTK;

 6). Обработка текстов и ссылок, нюансы  html-разметки;

 7). Векторизованные представления текстов, Word2Vec;

 8). Выбор базы данных – Sql/NoSql;

 9). Переход с личного ноутбука на облако.

Организаторы: Кафедра информационных технологий и систем ВГУЭС