Сложный вопрос, сформулировать его ещё сложнее(а мб я глупенький)
Есть html файлов из которых нужно достать одну и ту же информацию.
самое первое это - определить в ссылке то, чью информацию нужно вытащить из файлов. Объясню :
Вот 2 отрывка из одного файла :
Почти в всех файлах есть код
Из всех файлов мне нужно узнать имя персонажа что находиться выше , в тэге td в значении title "В данном случае Vayne"
Причём максимально важно что бы в классе battle-details-white-icon было значение src именно "https://cdn.wildstats.gg/images/icons/role-3.png"
Причём нужно получить только имя персонажа т.к. Position Played мне не нужно(дальше объясню почему)
Узнать нужно на 1 файл 2 таких "имени"
Используя эти данные нужно получить много разной информации из файлов.
К примеру :
Зная имя нужно узнать значение его уровня "Тут уровень 12"
И вот таких вот шаблонов в html файлах достаточно много(20-30 штук). Поэтому Position Played и не нужен. Меняется только то что написано после ":" и число что находится ниже.
"Имени" в одном файле 2 (под src "https://cdn.wildstats.gg/images/icons/role-3.png")
Имена естественно от файла к файлу меняются но их всегда 2.
Есть html файлов из которых нужно достать одну и ту же информацию.
самое первое это - определить в ссылке то, чью информацию нужно вытащить из файлов. Объясню :
Вот 2 отрывка из одного файла :
HTML:
<td class="text-center
"
data-toggle="tooltip"
data-placement="top"
title=" Teemo : Position Played
">
<img class="battle-details-white-icon"
src="https://cdn.wildstats.gg/images/icons/role-2.png">
</td>
<td class="text-center
"
data-toggle="tooltip"
data-placement="top"
title=" Vayne : Position Played
">
<img class="battle-details-white-icon"
src="https://cdn.wildstats.gg/images/icons/role-3.png">
</td>
HTML:
<img class="battle-details-white-icon"
src="https://cdn.wildstats.gg/images/icons/role-3.png">
Из всех файлов мне нужно узнать имя персонажа что находиться выше , в тэге td в значении title "В данном случае Vayne"
Причём максимально важно что бы в классе battle-details-white-icon было значение src именно "https://cdn.wildstats.gg/images/icons/role-3.png"
Причём нужно получить только имя персонажа т.к. Position Played мне не нужно(дальше объясню почему)
Узнать нужно на 1 файл 2 таких "имени"
Используя эти данные нужно получить много разной информации из файлов.
К примеру :
HTML:
td class="text-center
"
data-toggle="tooltip"
data-placement="top"
title=" Teemo : Champion Level
">
12
</td>
<td class="text-center
"
data-toggle="tooltip"
data-placement="top"
title=" Vayne : Champion Level
">
12
</td>
И вот таких вот шаблонов в html файлах достаточно много(20-30 штук). Поэтому Position Played и не нужен. Меняется только то что написано после ":" и число что находится ниже.
"Имени" в одном файле 2 (под src "https://cdn.wildstats.gg/images/icons/role-3.png")
Имена естественно от файла к файлу меняются но их всегда 2.