Всем привет!
Есть у меня 109 csv-файлов с 10 столбцами каждый. Мне нужно из этих файлов создать 1 DataFrame с одним столбцом('open') для каждого, то есть всего должно получиться 109 столбцов. Вроде бы всё просто, но я уже 2 вечера потратил с нулевым результатом. У меня получается DataFrame со значениями NaN.
Вот один из множества вариантов, которые я перепробовал.
Тут изображение того, что выводит приведенный выше код. Нижний вывод - это то, как выглядит один из 109 файлов.

У меня не большой опыт использования python+pandas, возможно я что-то делаю неправильно. Помогите пожалуйста разобраться в причинах неработоспособности моего кода.
Есть у меня 109 csv-файлов с 10 столбцами каждый. Мне нужно из этих файлов создать 1 DataFrame с одним столбцом('open') для каждого, то есть всего должно получиться 109 столбцов. Вроде бы всё просто, но я уже 2 вечера потратил с нулевым результатом. У меня получается DataFrame со значениями NaN.
Вот один из множества вариантов, которые я перепробовал.
Код:
columns_pd = []
for dirname, _, filenames in os.walk('/home/sat/binance_historic_data/new_data/'):
for filename in filenames:
df_temp = pd.read_csv(dirname + filename)
if '2019-01-01' <= df_temp['open_time'][0]:
columns_pd.append(str(filename))
#num_cols = num_cols + 1
#print(columns)
df = pd.DataFrame(index=df_for_index.index, columns=columns_pd)
for dirname, _, filenames in os.walk('/home/sat/binance_historic_data/new_data/'):
for filename in filenames:
df_temp = pd.read_csv(dirname + filename)
if '2019-01-01' <= df_temp['open_time'][0]:
df_temp2 = df_temp.loc['2019-01-01' <= df_temp['open_time']]
#df_temp2.head()
df[filename] = df_temp2['open']
df
Тут изображение того, что выводит приведенный выше код. Нижний вывод - это то, как выглядит один из 109 файлов.

У меня не большой опыт использования python+pandas, возможно я что-то делаю неправильно. Помогите пожалуйста разобраться в причинах неработоспособности моего кода.
Последнее редактирование: