Всем доброго времени суток!
Помогите, пожалуйста, написать код для расчета на pyspark
Нужно рассчитать, в какой категории лучше всего продаются дорогие товары, у которых цена до скидки была больше 1000 рублей включительно.
В расчет нужно брать только продажи в 2019 году. Нужно ввести 2 числа через запятую — номер категории и количество проданных дорогих товаров, например «6,96467».
Колонки в анализируемом файле называются:
Product_id — идентификатор товара;
Price — цена товара (с учетом скидки);
Datetime — дата и время покупки;
Category — идентификатор категории товара;
Discount — скидка, которая была применена.
Помогите, пожалуйста, написать код для расчета на pyspark
Нужно рассчитать, в какой категории лучше всего продаются дорогие товары, у которых цена до скидки была больше 1000 рублей включительно.
В расчет нужно брать только продажи в 2019 году. Нужно ввести 2 числа через запятую — номер категории и количество проданных дорогих товаров, например «6,96467».
Колонки в анализируемом файле называются:
Product_id — идентификатор товара;
Price — цена товара (с учетом скидки);
Datetime — дата и время покупки;
Category — идентификатор категории товара;
Discount — скидка, которая была применена.