Добрый всем день.
Нужна помощь в обработке текстовых файлов. Проблема заключается в следующем:
необходимо удалять строки, в файле, в которых есть два совпадения, например:
a101010 и a101010; a101010 и a101210; a101210 и a101010; a101210 и a101210
Примерный текст файла:
a101010 xxxxx a101010 xxxxx - удалить
a101110 xxxxx a101010 xxxxx - не удалять
a101010 xxxxx a101110 xxxxx - не удалять
a101010 xxxxx a101210 xxxxx - удалить
a101210 xxxxx a101010 xxxxx - удалить
a101110 xxxxx a101110 xxxxx - не удалять
a101210 xxxxx a101210 xxxxx - удалить
a101310 xxxxx a101010 xxxxx - не удалять
a101010 xxxxx a101310 xxxxx - не удалять
a101410 xxxxx a101010 xxxxx - не удалять
a101010 xxxxx a101510 xxxxx - не удалять
a101110 xxxxx a101510 xxxxx - не удалять
Используя скрипт, удаляются все строки где встречается "a101010", что не нужно!! Можно ли его усовершенствовать?
Вот еще вопрос, можно ли заместо "a101010" вставить файл в котором записаны слова для фильтрации?
Нужна помощь в обработке текстовых файлов. Проблема заключается в следующем:
необходимо удалять строки, в файле, в которых есть два совпадения, например:
a101010 и a101010; a101010 и a101210; a101210 и a101010; a101210 и a101210
Примерный текст файла:
a101010 xxxxx a101010 xxxxx - удалить
a101110 xxxxx a101010 xxxxx - не удалять
a101010 xxxxx a101110 xxxxx - не удалять
a101010 xxxxx a101210 xxxxx - удалить
a101210 xxxxx a101010 xxxxx - удалить
a101110 xxxxx a101110 xxxxx - не удалять
a101210 xxxxx a101210 xxxxx - удалить
a101310 xxxxx a101010 xxxxx - не удалять
a101010 xxxxx a101310 xxxxx - не удалять
a101410 xxxxx a101010 xxxxx - не удалять
a101010 xxxxx a101510 xxxxx - не удалять
a101110 xxxxx a101510 xxxxx - не удалять
Используя скрипт, удаляются все строки где встречается "a101010", что не нужно!! Можно ли его усовершенствовать?
Python:
with open("orig.txt", "r") as f:
data = f.readlines()
data = filter(lambda line: "a101010" not in line, data)
with open("filter.txt", "w") as f:
f.write("".join(data))
Вот еще вопрос, можно ли заместо "a101010" вставить файл в котором записаны слова для фильтрации?