расчет на pyspark

Луговая

Новичок
Пользователь
Апр 25, 2020
1
0
1
Всем доброго времени суток!

Помогите, пожалуйста, написать код для расчета на pyspark

Нужно рассчитать, в какой категории лучше всего продаются дорогие товары, у которых цена до скидки была больше 1000 рублей включительно.
В расчет нужно брать только продажи в 2019 году. Нужно ввести 2 числа через запятую — номер категории и количество проданных дорогих товаров, например «6,96467».

Колонки в анализируемом файле называются:

Product_id — идентификатор товара;
Price — цена товара (с учетом скидки);
Datetime — дата и время покупки;
Category — идентификатор категории товара;
Discount — скидка, которая была применена.
 

Форум IT Специалистов