помогите пожалуйста написать код к задаче, совсем не разбираюсь как это сделать.
Задача классификации.
Вам предлагается датасет. Необходимо изучить описание данных, при его наличии. Необходимо разработать модель классификации для предсказания класса целевой переменной по вектору признаков.
Порядок действий:
1. Загрузить данные. Если данные разбиты на файлы, необходимо объединить их в одну общую базу.
2. Осуществить предобработку данных.
a. Удаление лишних неинформативных признаков
b. Удаление (либо заполнение пропущенных значений). Обоснуйте ваш метод.
c. Обработка категориальных данных, нормализация количественных признаков.
d. Создание обучающей и тестовой выборки.
3. Разработайте модель методом KNN, подберите оптимальное значение k такое, чтобы точность модели была максимальная при отсутствующем переобучении. Выведите метрики полученной модели. Постройте графики зависимости точности классификатора от числа k.
код можно написать в Google Colaboratory
данные датасета загружены в вложении
Задача классификации.
Вам предлагается датасет. Необходимо изучить описание данных, при его наличии. Необходимо разработать модель классификации для предсказания класса целевой переменной по вектору признаков.
Порядок действий:
1. Загрузить данные. Если данные разбиты на файлы, необходимо объединить их в одну общую базу.
2. Осуществить предобработку данных.
a. Удаление лишних неинформативных признаков
b. Удаление (либо заполнение пропущенных значений). Обоснуйте ваш метод.
c. Обработка категориальных данных, нормализация количественных признаков.
d. Создание обучающей и тестовой выборки.
3. Разработайте модель методом KNN, подберите оптимальное значение k такое, чтобы точность модели была максимальная при отсутствующем переобучении. Выведите метрики полученной модели. Постройте графики зависимости точности классификатора от числа k.
код можно написать в Google Colaboratory
данные датасета загружены в вложении