Методика медиаисследований. ЖМК-301. Практическое задание №5. Автоматизированный кластерный анализ
1. Откройте Orange Data Mining. Закройте информационное окно.
2. Подготовьте данные для анализа, выбрав 10 текстов на схожую тему и сохраните их в виде .txt файлов (типа блокнот) в общей папке.
Простой кластерный анализ:
Описание анализа: верхний уровень - проверка отображения данных, нижний - непосредственная процедура анализа.
Управление в Orange: правая клавиша мыши открывает меню. Начните набирать текст для поиска инструмента. Левая клавиша мыши используется для выбора виджетов. Для соединения виджетов в единый форк (цепь) зажмите левую клавишу мыши и ведите линию вправо к следующему виджету.
Все виджеты открываются кликом по их иконке.
Анализ:
3. Откройте Import Documents и укажите путь к папке, в которой лежат все ваши тексты.
4. Подключите виджет к corpus viewer чтобы увидеть источники.
5. Соедините виджет с Preprocess Text и выберите параметр Regexp.
6. Соедините Preprocess Text с Bag of Words. Regularization установите со значением Euclidean.
7. Выберите Distances и затем Cosine metric.
8. Присоедините виджет Hierarchical Clustering в конце цепи.
9. Откройте кластер и выберите следующие группы параметров: linkage - ward, annotation - name, после чего передвиньте вертикальный разделитель (пунктир) так, чтобы тексты разбились по группам кластеров, согласно их логике.
10. Сохраните результат как скриншот и опубликуйте у себя в блоге с пояснением:
I. Укажите тексты какой тематики вы использовали?
II. Поясните на какие группы разделились выбранные вами тексты и дайте обоснование почему именно такие группы были выделены.
III. Оцените будет ли меняться число групп по общности текстов при изменении уровня кластеризации (меняется через перемещение разделителя масштаба анализа)? В какую сторону (меньшего числа групп текстов или большего числа?) происходят эти изменения?
Ссылка на выполненное в вашем блоге задание принимается в комментариях к данному посту до 15:00 четверга 27 марта.
https://danabobrova.blogspot.com/2025/03/4_24.html
ОтветитьУдалитьОценка "отлично"
Удалитьhttps://guseva-elizaveta.blogspot.com/2025/03/blog-post.html
ОтветитьУдалитьОценка "отлично"
Удалитьhttps://grystno1.blogspot.com/2025/03/blog-post.html
ОтветитьУдалитьОценка "отлично"
УдалитьБуланова https://bulanovaaa.blogspot.com/2025/03/24032025.html
ОтветитьУдалитьОценка "отлично"
Удалитьhttps://solovevaolga.blogspot.com/2025/03/11-3.html
ОтветитьУдалитьОценка "отлично"
Удалитьhttps://sokolovskayakristinaa.blogspot.com/2025/03/3.html
ОтветитьУдалитьОценка "отлично"
УдалитьДз №3 Долг:
ОтветитьУдалитьhttps://galinasolidovnicowa.blogspot.com/2025/03/3-sentiment-analysis.html
Дз №5
https://galinasolidovnicowa.blogspot.com/2025/03/5.html
Долг - "хорошо", текущее задание - "отлично"
УдалитьЭтот комментарий был удален автором.
ОтветитьУдалитьhttps://golomazdinadarya.blogspot.com/2025/03/5.html
ОтветитьУдалитьГоломаздина
Оценка "отлично"
Удалитьhttps://olesyanesteruk.blogspot.com/2025/03/5.html
ОтветитьУдалитьОценка "отлично"
Удалитьhttps://dianesavina.blogspot.com/2025/03/5.html
ОтветитьУдалитьОценка "отлично"
Удалитьhttps://zatykina.blogspot.com/2025/03/5.html
ОтветитьУдалитьОценка "отлично"
Удалить