ЖМК-301. Методы медиаисследований. Практическое задание №6 Кластерный анализ из внешней базы данных

Подготовка:

1. Добавьте виджет Guardian, нажмите на API key, затем ок. Укажите на английском ключевые слова запроса и диапазон времени (берите небольшой, чтобы анализировать не более 15-25 файлов, иначе анализ займет очень много времени),выберите блок headline и content, нажмите search:

Внимание! Виджет анализирует англоязычную газету Guardian, поэтому ключевое слово/слова запроса должны быть также английскими.






Схема анализа:



Подключение и настройка виджетов проводится также как и в предыдущем задании.

Анализ:

3. Откройте Preprocess Text и установите значения: Lowercase, Regexp, Stopwords.

4. Соедините виджет с Word Cloud чтобы увидеть частотность слов.

5. Соедините Preprocess Text с Bag of Words с параметрами: count, none, eucledian.

6. Соедините Bag of Words с Distances, укажите параметр columns type. Regularization выставляется с параметром Euclidean.

7. Соедините Distances с Statistics с параметрами word count и character count.

8. Подключите в конце форка Line Chart.

9. Откройте Line Chart и установите 2-3 ключевых слова (plots) чтобы увидеть пересечения.



10. Сохраните итоговый вариант как картинку и опубликуйте отдельным постом в блоге, аргументированно объяснив как связано взаимное употребление указанных слов в выбранных текстах.

Ссылки на выполненное задание принимаются в комментариях к данному посту до 15:00 5 мая.

Комментарии

  1. https://cucumber1245.blogspot.com/2022/04/putin-e-putin-russia-ukraine.html

    ОтветитьУдалить
  2. https://levshaaa.blogspot.com/2022/04/blog-post_29.html

    ОтветитьУдалить
    Ответы
    1. Оценка "отлично". Особенности вашего результата в том, что если вы ищете по ключевому слову "оружие", то это, конечно weapon, а не gun.

      Удалить
  3. https://vladislav-yakovlev.blogspot.com/2022/05/blog-post.html

    ОтветитьУдалить
  4. https://gizinger7437.blogspot.com/2022/05/2.html

    ОтветитьУдалить

Отправить комментарий

Популярные сообщения