Методика медиаисследований. ЖМК-301. Практическое задание №2. Автоматизированный контент-анализ

Вам нужно провести контент-анализ двух любых текстов, схожей тематики. Для этого вы:


1) Выбираете два текста и сохраняете их (например, в виде двух текстовых файлов в блокноте). Сложите их в две разные папки. При выполнении задания сначала укажите путь к одной папке, потом - к другой;
2) Запускаете программу Orange Biolab Si. Взять ее можно здесь: https://orangedatamining.com/ Также установите в программу плагины text, textable и timeseries (options - add ons в меню);
3) Вам нужно построить цепочку анализа (форк) из виджетов. Они открываются правой клавишей мыши, затем выбираются из списка. Открытие виджета - два клика на нем. Соединение со следующим компонентом - движение курсора вправо с зажатой левой клавишей мыши;
4) Создайте форк со связями: import documents - preprocess text - word cloud
import documents - preprocess text - bag of words - extract keywords: 

5) В import documents укажите путь к папке с файлом. В preprocess text в tokenization выставьте regexp, в stopwords - russian. В bag of words нужны параметры: count, none, L2. В extract keywords - TF-IDF и YAKE! в языке укажите русский;

6) В виджете word cloud вы увидите все слова в вашем тексте по их частотности, а в extract keywords по их важности. Сделайте скриншоты из этих виджетов. Повторите то же самое со вторым текстом. 

7) Сравните оба текста с опорой на результаты автоматического контент-анализа. Чем отличаются выбранные вами тексты? Как это влияет на их содержание?

Ссылки на выполненное в вашем блоге задание принимаются в комментариях к данному посту до 15:00 четверга, 7 марта.

Комментарии

  1. https://victoriatoshik.blogspot.com/2024/03/blog-post.html
    Привалова Виктория

    ОтветитьУдалить
  2. https://nadezhdaamedia.blogspot.com/2024/03/123.html

    ОтветитьУдалить
  3. https://nadezhdaamedia.blogspot.com/2024/03/8.html Фирсова Анастасия

    ОтветитьУдалить
  4. https://kleanata.blogspot.com/2024/03/blog-post.html Клепач Анастасия

    ОтветитьУдалить
    Ответы
    1. Оценка "хорошо", из вашего ответа не ясно как вы выявили общность стиля.

      Удалить
  5. https://haliullinakarina.blogspot.com/2024/03/2-8.html

    ОтветитьУдалить
  6. Первое задание: https://biktimirovaoksana.blogspot.com/2024/03/1.html
    Второе задание: https://biktimirovaoksana.blogspot.com/2024/03/2.html

    ОтветитьУдалить
    Ответы
    1. Текущее задание - "отлично", предыдущее - "хорошо".

      Удалить
  7. https://malsa15.blogspot.com/2024/03/blog-post.html Мальцева

    ОтветитьУдалить
    Ответы
    1. Оценка "хорошо", вы не сделали обобщающего вывода по общему и разному в выбранных текстах, с опорой на программный анализ.

      Удалить

Популярные сообщения