Есть таблица CSV формата с большим количеством строк и столбцов, каждая строка имеет уникальный id-шник.
Необходимо сравнить строки между собой по всем столбцам и посчитать количество различий по столбцам и записать результат в новый csv .
Пример таблицы на выходе:
Я пытался читать файл библиотекой pandas но дальше подсчета значений по одному из столбцов не смог продвинуться.
Подскажите решение, пожалуйста.
Необходимо сравнить строки между собой по всем столбцам и посчитать количество различий по столбцам и записать результат в новый csv .
Пример таблицы на выходе:
id1 | id2 | differences_count |
12658 | 12765 | 0 |
12659 | 12347 | 1 |
Я пытался читать файл библиотекой pandas но дальше подсчета значений по одному из столбцов не смог продвинуться.
Подскажите решение, пожалуйста.