(2022) Анализ тональности комментариев в YouTube
VAL |
|
Offline

Мэтр, проФАН любви... proFAN of love
    
Профиль
Группа: Администраторы
Сообщений: 38059
Пользователь №: 1
Регистрация: 6.03.2004

|
(2022) Сравнительный анализ тональности комментариев в YouTube (осторожно, ненормативная лексика)Источники: - https://habr.com/ru/post/599445/- https://www.pvsm.ru/data-mining/371091 QUOTE | Привет! Чем еще заняться на каникулах любителю Data Scienсe как не анализом тональности комментариев под новогодними обращениями?! На эту мысль меня натолкнули алгоритмы YouTube, выдавшие к просмотру первого января 2022 года два видео, с очень разными по эмоциональной окраске комментариями.
Тогда я подумал, что пошаговый разбор решения задачи классификации этих комментариев по их тональности мог бы стать довольно наглядным примером для знакомства с базовыми техниками обработки естественного языка, а о том, насколько это получилось предлагаю судить вам. |
QUOTE | Итак, в процессе классификации наших комментов мы поучимся :
Писать парсер комментариев YouTube
Предобрабатывать тексты для их последующего анализа
Получать частотность слов в наборах текстов
Создавать красивые графики "облака тэгов"
Находить размеченные наборы текстов и оценивать их пригодность для задачи
Получать векторные представления текстов bag of words и TF-IDF
лассифицировать комментарии с помощью логистической регрессии
Оценивать качество классификации с помощью графиков ROC-кривых и матрицы ошибок
Визуализировать наиболее важные для классификации слова
Применять полученный классификатор для анализа тональности комментариев
A для работы нам понадобится только: компьютер, доступ в интернет, настроенная среда Jupyter Notebook и пару вечеров свободного времени. |
--------------------
|
|
|
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей: