Как корректно поставить кодировку utf-8 чтобы текст распознавался.

КрысаКрысьева

Новичок
Пользователь
Июн 9, 2022
2
0
1
Здравствуйте! ОС Windows, Python 3.10.4. В приложенном коде я сортирую список текстовых документов. Мои тексты содержат одно слово на латинице и одно слово на кириллице, но интерпретатор понимает только латиницу, кириллицу читает некорректно, я поставила кодировку: encoding ='utf-8', т.е. строка в коде выглядела так:
url_list = ['Крыса3.txt', 'Крыса1.txt', 'Крыса5.txt','Крыса2.txt', encoding ='utf-8'], но возникает ошибка. Файлы по умолчанию имеют кодировку utf-8. Помогите пожалуйста разобраться, как сделать так, чтобы интерпретатор распознавал кириллицу в данном случае. Файлы прилагаю. Заранее спасибо за ответ!
 

Вложения

  • Снимок.JPG
    Снимок.JPG
    55,8 КБ · Просмотры: 3
  • Снимок1.JPG
    Снимок1.JPG
    31,7 КБ · Просмотры: 3
  • Снимок2.JPG
    Снимок2.JPG
    73,2 КБ · Просмотры: 3

regnor

Модератор
Команда форума
Модератор
Июл 7, 2020
2 587
459
83
ну во первых - https://itfy.org/threads/kak-ne-nado-zadavat-voprosy.3450/#post-13566

во вторых - кодировку указывают при открытии файла, то есть open("file_name", "r", encoding="utf-8"), так же можете попробовать другие кодировки, например utf-16

в третьих - я не вижу, где вы закрываете файл, это ошибка, после работы с файлом его нужно закрывать, или использовать контекстный менеджер with, который гарантирует, что файл будет закрыт
 
Последнее редактирование:

Ципихович Эндрю

Активный пользователь
Пользователь
Мар 27, 2021
490
25
28
Файлы прилагаю. Заранее спасибо за ответ!
а приложили картинки, лечение:
открыть Блокнотом++ и менять кодировку во вкладке Кодировка на utf-8
 

КрысаКрысьева

Новичок
Пользователь
Июн 9, 2022
2
0
1
Большое спасибо за помощь, все получилось.
 

Форум IT Специалистов