мне нужно написать код для диаграммы с картинки
есть датасет, содержащий InvoiceNo, StockCode, Quantity, UnitPrice, CustomerID
на диаграмме - количество товаров в одном чеке по оси х, частота по оси у, и std, mean и N в легенде
я нашла, как посчитать std и mean
нашла, как построить обычную диаграмму частотности (но не нашла, как изменить ось х, чтобы там были значения)
другой вариант (но оси нужно поменять местами)
но это все не то, что нужно
собственно вопрос: есть ли какой-нибудь специальный код/инструкция для такой гистограммы?
есть датасет, содержащий InvoiceNo, StockCode, Quantity, UnitPrice, CustomerID
на диаграмме - количество товаров в одном чеке по оси х, частота по оси у, и std, mean и N в легенде
я нашла, как посчитать std и mean
нашла, как построить обычную диаграмму частотности (но не нашла, как изменить ось х, чтобы там были значения)
Python:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.read_excel('OnlineRetail.xlsx')
def F(_h):
data = df[_h]
sns.distplot(data, hist=True, kde=False)
plt.title(_h)
plt. show()
F('InvoiceNo')
другой вариант (но оси нужно поменять местами)
Python:
#группируем товары по чекам в отдельный массив
a = df.groupby('InvoiceNo').size()
print (a)
#делаем из него датафрейм
df1 = pd.DataFrame(a)
#переименовываем колонку чтобы к ней потом обратиться
df1.columns = ['r']
#строим график обращаясь к столбцу
sns.distplot(df1['r'], norm_hist=False, kde=False, hist_kws={"alpha": 1}).set()
но это все не то, что нужно
собственно вопрос: есть ли какой-нибудь специальный код/инструкция для такой гистограммы?