МФЖ-101. Современные технологии поиска и обработки информации. Практическое задание №8. Регрессионный анализ информации с линейной проекцией и моделью SVM

Вам нужно оценить взаимозависимость двух переменных друг от друга, опираясь на регрессионный анализ. Для этого необходимо создать файл excel с двумя рядами данных и хронологическими параметрами (например, с указанием года). 

Для этого подготовьте файл excel.

1) Формируете форк по схеме:

2) В компоненте Polynomial Regression вам нужно выбрать предиктор из ваших переменных и цель, чтобы увидеть график линейной регрессии. Все, что выше ее тренда - имеет явную корреляцию, что ниже - скорее всего нет:



3) Компонент Linear Projection показывает распределение данных по вариантам значений:



4) В инструменте Select Columns вам нужно указать ваши два типа данных в значениях (features), а столбик хронологии в цели (target). В Linear Regression выбираете ридж-регрессию. В Data Table вы увидите коэффициенты корреляции по вашим переменным.

5) Инструмент Interactive k-Means показывает графическое распределение переменных в общем поле.

6) SVM модель (Support Vector Machines) должна быть установлена со значениями SVM и RBF. В Outliers устанавливаете евклидову метрику, В Concatenate выбираете галку отображения ID данных. Scater Plot покажет вам общую модель данных с трендом регрессии:



7) Ваша задача используя все указанные модели сделать вывод о том, связаны ли те группы данных которые вы сравниваете или нет, а также указать какая модель на ваш взгляд дает наиболее точную оценку. В качестве иллюстраций используйте скриншоты каждого инструмента, формирующего итоговые данные.


Ссылки на выполненные задания принимаются в комментариях к данному посту до 20:00 6 ноября.

Комментарии

Отправить комментарий

Популярные сообщения