Методика медиаисследований. ЖМК-301. Практическое задание №7. Sentiment-анализ текста
Вам нужно проанализировать на наличие позитивной или негативной тональности любой текст достаточного объема. Можно взять как русскоязычный так и англоязычный текст. Порядок действий будет несколько отличаться.
Для англоязычного текста:
1. Оформите его в CSV-файл. Для этого откройте google таблицы: https://docs.google.com/spreadsheets/u/0/ и расставьте весь текст поабзацно в строки первой колонки, после чего сохраните в нужном формате (файл - скачать - формат csv);
2. Запустите в Orange инструмент Corpus и загрузите в него ваш файл;
3. Соедините Corpus с Sentiment Analysis. Выберите в последнем режим Vader;
4. Соедините Sentiment Analysis с Heat Map. В разделе кластеризации выберите - clustering, в аннотации - интересующую вас тональность.
5. Подключите Sentiment Analysis к Extract Keywords. Выберите методы TF-IDF и YAKE! и внизу окна укажите все слова.
6. Подключите к Extract Keywords инструмент Scater Plot. Выставите TF-IDF и YAKE! на осях Х и У. В атрибуте лейбла укажите "words". У вас сгенерируется проекция текста с общими полями слов.
7. На основе данных из пунктов 4 и 6 кратко проанализируйте какая тональность доминирует в тексте и какие слова объединяются в общие группы.
Для русскоязычного текста:
Также создайте CSV-файл. Для этого откройте google таблицы: https://docs.google.com/spreadsheets/u/0/ и расставьте весь текст поабзацно в строки первой колонки, после чего сохраните в нужном формате (файл - скачать - формат csv);
2) В компоненте Sentiment Analysis выбираете мультиязычный компонент и устанавливаете русский язык;
3) Подключаете компонент Corpus Viewer. В нем должны отобразиться все абзацы публикации;
4) Подключаете Sentiment Analysis к компоненту Extract Keywords. В нем выбираете методику term frequency inverse document frequency (важность упоминаемых слов) и модель Yet Another Keyword Extractor. Переключаетесь на русский язык, внизу выбираете опцию учитывать все слова;
7) На основе полученных данных проанализируйте какая тональность доминирует в тексте и какие слова объединяются в общие группы. Ссылки на выполненное задание принимаются в комментариях к данному посту до 15:00 среды, 22 мая.
https://haliullinakarina.blogspot.com/2024/05/prada-versace-balenciaga.html предыдущее
ОтветитьУдалитьhttps://haliullinakarina.blogspot.com/2024/05/blog-post.html текущее
Текущее задание - "отлично", предыдущее - "хорошо".
Удалитьhttps://nadezhdaamedia.blogspot.com/2024/05/1.html - текущее
ОтветитьУдалитьhttps://nadezhdaamedia.blogspot.com/2024/05/1_20.html - предыдущее
Оценка "отлично", прошлое задание - "хорошо"
Удалитьhttps://biktimirovaoksana.blogspot.com/2024/05/7-sentiment.html
ОтветитьУдалитьОценка "отлично"
Удалитьhttps://dvornikovdanil201.blogspot.com/2024/05/7.html
ОтветитьУдалитьОценка "отлично"
Удалитьhttps://kleanata.blogspot.com/2024/05/blog-post_22.html Клепач Анастастасия
ОтветитьУдалитьОценка "отлично"
Удалитьhttps://gingerpataki.blogspot.com/2024/05/blog-post_20.html Фирсова Анастасия
ОтветитьУдалитьОценка "отлично"
Удалитьзадание 2: https://shevtssovaa.blogspot.com/2024/05/2.html
ОтветитьУдалитьзадание 3: https://shevtssovaa.blogspot.com/2024/05/3.html
текущее задание: https://shevtssovaa.blogspot.com/2024/05/7-sentiment.html
Текущее задание - "отлично", предыдущие - "хорошо"
Удалитьhttps://malkovanatalie.blogspot.com/2024/05/7.html Малкова Наталья
ОтветитьУдалитьОценка "отлично"
Удалить