Современные технологии поиска и обработки информации. МЖСО-1. Практическое задание №6. Графический анализ информации с кластеризацией и t-распределением

Для графического анализа вам потребуется не менее 10-12 фото, которые вы будете классифицировать. Можете взять фото, которые вы использовали в предыдущем задании.

Для графического анализа в Orange должен быть установлен плагин (Options - Add-ons) Image Analytics 0.10.0 После установки перезапустите программу.

Организуйте форк следующим образом:




Пояснения к виджетам форка:

Import Images - укажите путь к папке с изображениями.

Image Embedding - в атрибуте укажите image, в Embedder - Inception.

Distances - используйте любую метрику. В моем примере это cosine в положении rows.

Hierarchical Clustering - также используйте те значения, что кажутся вам наиболее подходящими. Расположите уровень кластеров так, чтобы они сформировали группы иллюстраций.

t-SNE - укажите в настройках атрибуты size (для color и size) и image name в label. Нажмите start.

Результат анализа: 

Hierarchical Clustering. Общие цветовые поля указывают на схожие кластеры иллюстраций. Используйте скриншот в вашем ответе.



Image Grid. Выставите параметр image name в labels. Ваши фото сгруппируются по логике классификации графического анализа. Также используйте скриншот в ответе.




t-SNE. Здесь сформируется модель иллюстраций по их близости друг к другу. Сохраните результат как скриншот.



1) Сравните результаты из кластеризации, Image Grid и алгоритма t-SNE. Есть ли между ними разница? Если да, то какая модель на ваш взгляд точнее.

2) Опишите, что за фото вы брали для анализа. Почему, на ваш взгляд, они разделились именно на такие группы? Согласны ли вы с такой логикой разделения?

Ссылки на выполненное задание принимаются в комментариях к данному посту до 15:00 13 апреля.

Комментарии