ЖМК-301/2. Методика медиаисследований. Практическое занятие №5-6. Sentiment-анализ и кластерный анализ

№5. Sentiment-анализ:

Вам нужно проанализировать на эмоциональную составляющую любые два текста (можно взять тексты из предыдущего задания, либо использовать новые) достаточного объема с использованием моделей MDS и Feature Statistics.

Для этого подготовьте каждый из текстов отдельно. Откройте Microsoft Excel и расставьте весь текст поабзацно в строки первой колонки, затем сохраните его в формате CSV. Можно также использовать Google таблицы: https://docs.google.com/spreadsheets/u/0/. Для сохранения файла используйте путь: файл - скачать - формат csv.

1) Формируете форк по схеме:



2) В компоненте Corpus указываете путь к вашему первому текстовому csv файлу;

3) В компоненте Sentiment Analysis выбираете мультиязычный компонент и устанавливаете русский язык;

4) Подключаете компонент Topic Modelling. В нем выбираете модель Latent Semantic Indexing;

5) Подключаете Sentiment Analysis к компоненту MDS. В нем устанавливаете PCA и жмете start. В цвете выбираете любой из тематических блоков текста, в размере - stress, в лейбле - заголовок текста. Включаете подсветку общих полей. Перед вами MDS-модель эмоциональной нагрузки текста, разбитого на слова:



6) Подключите инструмент Topic Modeling к Feature Statistics. В цвете задаете любой из доступных параметров. Перед вами распределение эмоций по абзацам текста. Чем больше отклонение дисперсии от среднего значения, тем более выражены эмоции в тексте.




Описание результата: сделайте скриншоты из пунктов 5 и 6 для первого и второго текста, на их основе сделайте вывод о доминирующем эмоциональном посыле текстов, укажите какой из них наиболее эмоционален, а также - какая модель на ваш взгляд дает наиболее точную оценку.

№6. Кластерный анализ:

Подготовьте данные для анализа, выбрав 10 текстов на схожую тему и сохраните их в виде .txt файлов (типа блокнот) в общей папке.

1) Формируете форк по схеме:

Описание анализа: верхний уровень - проверка отображения данных, нижний - непосредственная процедура анализа.

Управление в Orange: правая клавиша мыши открывает меню. Начните набирать текст для поиска инструмента. Левая клавиша мыши используется для выбора виджетов. Для соединения виджетов в единый форк (цепь) зажмите левую клавишу мыши и ведите линию вправо к следующему виджету. Все виджеты открываются кликом по их иконке.

Анализ:

2) Откройте Import Documents и укажите путь к папке, в которой лежат все ваши тексты;

3) Подключите виджет к corpus viewer чтобы увидеть источники;

4) Соедините виджет с Preprocess Text и выберите параметр Regexp;

5) Соедините Preprocess Text с Bag of Words. Regularization установите со значением Euclidean;

6) Выберите Distances и затем Cosine metric;

7) Присоедините виджет Hierarchical Clustering в конце форка;

8) Откройте кластер и выберите следующие группы параметров: linkage - ward, annotation - name, после чего передвиньте вертикальный разделитель (пунктир) так, чтобы тексты разбились по группам кластеров, согласно их логике.



Описание результата: сделайте скриншот с разделением массива текста на кластеры. Кратко опишите тексты какой тематики вы использовали? Поясните на какие группы разделились выбранные вами тексты и дайте обоснование почему именно такие группы были выделены?

Ссылки на выполненное в вашем блоге задание принимаются в комментарии к данному посту до 17:00 понедельника, 17 ноября.

РЕЗУЛЬТАТЫ:

Акимкина Олеся - 5,5

Ананина Виктория - 5,5

Ахрарова Виктория - в задании нет скриншотов

Власов Максим - 5,5

Гайфуллина Анна - 5,5

Гостева Полина - 5,5

Григорьева Екатерина - 5,5

Дашенко Александра - 5,4

Жукова Виктория - 5,5

Зубко Сабина - 5,5

Климович Мария - 5,5

Кобякова Дарья - 5,5

Козилова Елизавета - 5,5

Корнилова Полина - 4,5

Куликова Мария - 5,5

Мамонтова Мария - 5,5

Маханек Вера - 5,5

Новая Валентина - 5,4

Орлова Арина - 5,5

Слободская Елизавета - 4,5

Фомин Александр - 5,5

Хайруддинов Тимур - 5,4

Цветкова Виктория - 5,5

Чугунова Елизавета - 5,5

Широкоумова Полина - 5,5




Комментарии

  1. https://vikki0s.blogspot.com/2025/11/sentiment-sentiment.html

    ОтветитьУдалить
  2. https://darkzet76.blogspot.com/2025/11/sentiment.html

    ОтветитьУдалить
  3. https://sabinazubko.blogspot.com/2025/11/blog-post_14.html?m=1

    ОтветитьУдалить
  4. https://philosopherarishka.blogspot.com/2025/11/sentiment.html

    ОтветитьУдалить
  5. https://sirokoumovapolina.blogspot.com/2025/11/5-6-sentiment.html

    ОтветитьУдалить
  6. Жукова Виктория ЖМК 302
    https://whisk0ss.blogspot.com/2025/11/sentiment.html

    ОтветитьУдалить
  7. https://cityhistory12.blogspot.com/2025/11/mds-sentiment.html

    ОтветитьУдалить
  8. https://kulikovamariaa22.blogspot.com/2025/11/5-6-sentiment.html?m=1

    ОтветитьУдалить
  9. https://kedamo.blogspot.com/2025/11/302-5-6-sentiment.html Чугунова Елизавета

    ОтветитьУдалить
  10. Этот комментарий был удален автором.

    ОтветитьУдалить
  11. https://marywow.blogspot.com/2025/11/3012-5-6-sentiment.html Мамонтова Мария

    ОтветитьУдалить
  12. Гайфуллина Анна, ЖМК-302.
    https://praltikakonoplyova.blogspot.com/2025/11/5.html

    ОтветитьУдалить
  13. Полина Корнилова https://www.blogger.com/blog/post/edit/5900203894718149697/3854966839315209232

    ОтветитьУдалить
  14. Задание Новой Валентины
    https://kulikovamariaa22.blogspot.com/2025/11/blog-post.html

    ОтветитьУдалить
  15. Козилова Елизавета
    https://ekozil.blogspot.com/2025/11/sentiment.html

    ОтветитьУдалить
  16. Фомин Александр
    https://fomin11.blogspot.com/2025/11/2.html

    ОтветитьУдалить
  17. Дашенко Александра
    https://dashnko.blogspot.com/2025/11/sentiment.html

    ОтветитьУдалить
  18. https://mediaeconomicsananina.blogspot.com/2025/11/5-6-sentiment.html

    ОтветитьУдалить