ЖМК-301/2. Методика медиаисследований. Практическое занятие №4. Автоматизированный фоносемантический и контент-анализ

Для данного задания потребуются любые два текста на общую тематику (укажите, что за тексты вы рассматривали) достаточного объема, сохраненные отдельно в формате .txt в две разные папки.

Предустановленное ПО: Vaal Mini (для фоносемантического анализа) и Orange Biolab Si с плагинами: Orange3-text, Orange3-textable, Orange3-timeseries и Orange3-ImageAnalytics (контент-анализ). 

При выполнении задания укажите какие тексты вы рассматривали.

Часть 1: Фоносемантический анализ.

1) Запустите программу Vaal.
2) Укажите путь к первому тексту: файл - открыть - ваш файл
3) Далее в верхнем меню: анализ - эмоциональная оценка текста
4) Сохраняете результаты и проделываете то же самое со вторым текстом
5) Сравниваете ваши тексты и делаете вывод о том, чем они отличаются с точки зрения эмоционального посыла. Аргументируйте. Используйте скриншоты с результатами в качестве иллюстраций.

Часть 2: Контент-анализ.

1) Запустите программу Orange Biolab Si. Взять ее можно здесь: https://orangedatamining.com/ Также установите в программу плагины text, textable и timeseries (options - add ons в меню);
2) Вам нужно построить цепочку анализа (форк) из виджетов. Они открываются правой клавишей мыши, затем выбираются из списка. Открытие виджета - два клика на нем. Соединение со следующим компонентом - движение курсора вправо с зажатой левой клавишей мыши;
3) Создайте форк со связями: import documents - preprocess text - word cloud
import documents - preprocess text - bag of words - topic modelling: 




4) В import documents укажите путь к папке с первым текстом. В preprocess text в tokenization выставьте regexp, в stopwords - russian. В bag of words нужны параметры: count, none, L2. В topic modelling - latent semantic indexing;

5) В виджете word cloud вы увидите все слова в ваших текстах по их частотности, а в topic modelling основные темы, которым посвящены тексты. Сделайте скриншоты из этих виджетов для каждого из текстов.

6) Прокомментируйте - насколько на ваш взгляд модель текста точно отражает содержание текстов? А word cloud? По какой методике легче определять тематику текстов?

Ссылки на выполненное в вашем блоге задание принимаются в комментарии к данному посту до 17:00 понедельника, 3 ноября.

РЕЗУЛЬТАТЫ:

Акимкина Олеся - 5

Ананина Виктория - 5

Андрюк Анастасия - 5

Власов Максим - 5

Гайфуллина Анна - 5

Гостева Полина - 5

Григорьева Екатерина - 5

Дашенко Александра - 5

Кобякова Дарья - 5

Козилова Елизавета - 5

Корнилова Полина - 5

Куликова Мария - 5

Мамонтова Мария -  5

Маханек Вера - 5

Митюнин Андрей - 5

Новая Валентина - 5

Орлова Арина - 5

Слободская Елизавета - 5

Султанова Ирина - 5

Фомин Александр - 5

Хайруддинов Тимур - 5

Цветкова Виктория - 5

Чубаков Константин - нет первой части

Чугунова Елизавета - 5

Шабалина Виктория - 5

Шестакова Вероника - 5

Широкоумова Полина - 5

Щербакова Ангелина - нет первой части

Комментарии

  1. https://darkzet76.blogspot.com/2025/10/blog-post_31.html

    ОтветитьУдалить
  2. Чугунова Елизавета https://kedamo.blogspot.com/2025/11/302-4.html

    ОтветитьУдалить
  3. https://marywow.blogspot.com/2025/11/3012-4.html Мамонтова Мария

    ОтветитьУдалить
  4. https://philosopherarishka.blogspot.com/2025/11/blog-post.html

    ОтветитьУдалить
  5. Корнилова Полина https://polypropyleneeeee.blogspot.com/2025/11/302-4.html

    ОтветитьУдалить
  6. Широкоумова Полина https://sirokoumovapolina.blogspot.com/2025/11/blog-post.html

    ОтветитьУдалить
  7. Чубаков Константин
    https://chhkss.blogspot.com/2025/11/blog-post.html

    ОтветитьУдалить
  8. Гайфуллина Анна:
    https://praltikakonoplyova.blogspot.com/2025/11/4.html

    ОтветитьУдалить