Методика медиаисследований. ЖМК-301. Практическое задание №4. Автоматизированный контент-анализ с моделью текста
Вам нужно провести контент-анализ двух текстов достаточного объема, имеющих общие основания (похожая тема, общий автор, общий жанр и так далее).
Для этого вы:
1) Выбираете эти тексты и сохраняете их в виде отдельных текстовых файлов в блокноте. Сложите их в две разных папки. При выполнении задания укажите путь к этим папкам - сначала для первого текста, потом для второго;
2) Запускаете программу Orange Biolab Si. Взять ее можно здесь: https://orangedatamining.com/ Также установите в программу плагины text, textable и timeseries (options - add ons в меню);
2) Запускаете программу Orange Biolab Si. Взять ее можно здесь: https://orangedatamining.com/ Также установите в программу плагины text, textable и timeseries (options - add ons в меню);
3) Вам нужно построить цепочку анализа (форк) из виджетов. Они открываются правой клавишей мыши, затем выбираются из списка. Открытие виджета - два клика на нем. Соединение со следующим компонентом - движение курсора вправо с зажатой левой клавишей мыши;
4) Создайте форк со связями: import documents - preprocess text - word cloud
import documents - preprocess text - bag of words - topic modelling:
5) В import documents укажите путь к папке с файлом. В preprocess text в tokenization выставьте regexp, в stopwords - russian. В bag of words нужны параметры: count, none, L2. В topic modelling - latent semantic indexing;
6) В виджете word cloud вы увидите все слова в ваших текстах по их частотности, а в topic modelling основные темы, которым посвящены тексты. Сделайте скриншоты из этих виджетов для каждого из текстов.
7) Прокомментируйте - насколько на ваш взгляд модель текста точно отражает содержание текстов? А word cloud? По какой методике легче определять тематику текстов?
Ссылки на выполненное в вашем блоге задание принимаются в комментариях к данному посту до 15:00 20 марта.
https://grystno1.blogspot.com/2025/03/1.html
ОтветитьУдалитьОценка "отлично"
Удалитьhttps://bulanovaaa.blogspot.com/2025/03/17032025.html Буланова
ОтветитьУдалитьОценка "хорошо", нет описания текстов, которые вы рассматривали
Удалитьhttps://zatykina.blogspot.com/2025/03/4.html
ОтветитьУдалитьОценка "отлично"
Удалитьhttps://danabobrova.blogspot.com/2025/03/4.html
ОтветитьУдалитьОценка "отлично"
Удалитьhttps://guseva-elizaveta.blogspot.com/2025/03/4.html
ОтветитьУдалитьОценка "отлично"
Удалитьhttps://rnsft.blogspot.com/2025/03/4.html
ОтветитьУдалитьОценка "отлично"
Удалитьhttps://golomazdinadarya.blogspot.com/2025/03/4.html
ОтветитьУдалитьГоломаздина
Оценка "отлично"
Удалитьhttps://solovevaolga.blogspot.com/2025/03/10-3.html
ОтветитьУдалитьОценка "отлично"
Удалитьhttps://sokolovskayakristinaa.blogspot.com/2025/03/word-cloud-topic-modelling.html
ОтветитьУдалитьОценка "отлично"
Удалитьhttps://karinariede.blogspot.com/2025/03/4.html
ОтветитьУдалитьОценка "отлично"
Удалитьhttps://dianesavina.blogspot.com/2025/03/4.html
ОтветитьУдалитьОценка "отлично"
Удалитьhttps://olesyanesteruk.blogspot.com/2025/03/4.html
ОтветитьУдалитьОценка "отлично"
Удалить