Предобработка датасета с Яндекс Толока.

Ilya

Новичок
Пользователь
Июн 21, 2020
1
0
1
Подскажите, пожалуйста как привести файл диалогов Toloka Persona Chat Rus (https://toloka.ai/ru/datasets)
к виду :
- - А стульев у вас не бывает?
- Сейчас дам, извините.
- - Что папа?
- Ругаться он будет.
- - Ругаться он будет.
- А-а.
Мне посоветовали BeautifulSoup, однако в в питоне пока мало опыта.
 

stud_55

Модератор
Команда форума
Модератор
Апр 3, 2020
1 522
672
113
Нужно распарсить файл с диалогами и записать в другой файл в нужном виде. Для этого можно использовать BeuatifulSoup. Вот тут можете почитать про BeuatifulSoup и посмотреть примеры: ссылка.
 

Форум IT Специалистов