Работа с библиотекой Pandas

Александр124

Новичок
Пользователь
Июл 19, 2021
2
0
1
Добрый день!
У меня возникли проблемы с решением следующей задачи:
У меня есть файл под названием milk_promo_sales.csv. В нем три столбца:
store_id - идентификатор магазина
period_id - период (неделя) наблюдения
sales_volume - объем продаж
Мне нужно найти:

1. Общее количество промопериодов (во всех магазинах)
2. Медиану продолжительности промопериода (количество недель)
3. Объем продаж по каждому промопериоду
4. Медиану количества промопериодов на один магазин
Я пробовал разные варианты, но ничего лучше придумать не удалось чем это:
  1. import pandas as pd
    import numpy as np
    pd.read_csv(‘milk_promo_sales.csv’)
    df1 = df.groupby(‘period_id’).sum()
  2. import pandas as pd
    import numpy as np
    pd.read_csv(‘milk_promo_sales.csv’)
    df2 = df.groupby(‘period_id’).median()
  3. import pandas as pd
    import numpy as np
    pd.read_csv(‘milk_promo_sales.csv’)
    df3 = df.groupby(‘period_id’, ‘store_id’, ‘sales_volume’).sort_values()
  4. import pandas as pd
    import numpy as np
    pd.read_csv(‘milk_promo_sales.csv’)
    df4 = df.groupby(‘period_id’).sum()
    df5 = df.groupby(‘store_id’).sum()
    df6 = (df4/df5).median()
 

regnor

Модератор
Команда форума
Модератор
Июл 7, 2020
2 670
477
83
так а проблема то в чем? задачи не выполнены?
 

Александр124

Новичок
Пользователь
Июл 19, 2021
2
0
1
так а проблема то в чем? задачи не выполнены?
Я просто хочу понять, в правильном ли я направлении думаю, так как есть ощущение, что решение неполное или вовсе неправильное. Поэтому прошу совета.
 

regnor

Модератор
Команда форума
Модератор
Июл 7, 2020
2 670
477
83
если работает так, как вы ожидали, и задачи выполнены, значит направление верное...
 

Форум IT Специалистов