здравствуйте!я в пайтоне новичок ,а в веб тем более, решил попробовать сделать парсер для извлечение курса доллара ,получаю это :
и все валюты упакованы в <tr> ,н у всех одно название соответственно открывается самый первый.
вопрос в следующем - как мне отфильтровать tr по значению одного из td , ну или еще как-то , использую BeautifulSoup
имел уже опыт с одним форумом, поэтому прошу не орать "иди учитай книги на 500 страниц" , а скинуть хотя бы ссылку на статью об этом.
спасибо!
HTML:
<tbody>
<tr>
<th>Цифр. код</th>
<th>Букв. код</th>
<th>Единиц</th>
<th>Валюта</th>
<th>Курс</th>
</tr>
<tr>
<td>036</td>
<td>AUD</td>
<td>1</td>
<td>Австралийский доллар</td>
<td>52,3397</td>
</tr>
<tr>
<td>944</td>
<td>AZN</td>
<td>1</td>
<td>Азербайджанский манат</td>
<td>42,9474</td>
</tr>
<tr>
<td>051</td>
<td>AMD</td>
<td>100</td>
<td>Армянских драмов</td>
<td>15,0449</td>
</tr>
<tr>
<td>933</td>
<td>BYN</td>
<td>1</td>
<td>Белорусский рубль</td>
<td>29,6701</td>
</tr>
<tr>
<td>975</td>
<td>BGN</td>
<td>1</td>
<td>Болгарский лев</td>
<td>44,1479</td>
</tr>
<tr>
<td>986</td>
<td>BRL</td>
<td>1</td>
<td>Бразильский реал</td>
<td>13,4584</td>
</tr>
<tr>
<td>348</td>
<td>HUF</td>
<td>100</td>
<td>Венгерских форинтов</td>
<td>24,8460</td>
</tr>
<tr>
<td>410</td>
<td>KRW</td>
<td>1000</td>
<td>Вон Республики Корея</td>
<td>61,5078</td>
</tr>
<tr>
<td>344</td>
<td>HKD</td>
<td>10</td>
<td>Гонконгских долларов</td>
<td>94,1457</td>
</tr>
<tr>
<td>208</td>
<td>DKK</td>
<td>1</td>
<td>Датская крона</td>
<td>11,5949</td>
</tr>
<tr>
<td>840</td>
<td>USD</td>
<td>1</td>
<td>Доллар США</td>
<td>72,9676</td>
</tr>
<tr>
<td>978</td>
<td>EUR</td>
<td>1</td>
<td>Евро</td>
<td>86,4666</td>
</tr>
<tr>
<td>356</td>
<td>INR</td>
<td>100</td>
<td>Индийских рупий</td>
<td>97,4330</td>
</tr>
<tr>
<td>398</td>
<td>KZT</td>
<td>100</td>
<td>Казахстанских тенге</td>
<td>17,4447</td>
</tr>
<tr>
<td>124</td>
<td>CAD</td>
<td>1</td>
<td>Канадский доллар</td>
<td>55,1032</td>
</tr>
<tr>
<td>417</td>
<td>KGS</td>
<td>100</td>
<td>Киргизских сомов</td>
<td>93,3391</td>
</tr>
<tr>
<td>156</td>
<td>CNY</td>
<td>1</td>
<td>Китайский юань</td>
<td>10,5110</td>
</tr>
<tr>
<td>498</td>
<td>MDL</td>
<td>10</td>
<td>Молдавских леев</td>
<td>43,8112</td>
</tr>
<tr>
<td>934</td>
<td>TMT</td>
<td>1</td>
<td>Новый туркменский манат</td>
<td>20,8777</td>
</tr>
<tr>
<td>578</td>
<td>NOK</td>
<td>10</td>
<td>Норвежских крон</td>
<td>82,1596</td>
</tr>
<tr>
<td>985</td>
<td>PLN</td>
<td>1</td>
<td>Польский злотый</td>
<td>19,6678</td>
</tr>
<tr>
<td>946</td>
<td>RON</td>
<td>1</td>
<td>Румынский лей</td>
<td>17,8649</td>
</tr>
<tr>
<td>960</td>
<td>XDR</td>
<td>1</td>
<td>СДР (специальные права заимствования)</td>
<td>102,8610</td>
</tr>
<tr>
<td>702</td>
<td>SGD</td>
<td>1</td>
<td>Сингапурский доллар</td>
<td>53,2571</td>
</tr>
<tr>
<td>972</td>
<td>TJS</td>
<td>10</td>
<td>Таджикских сомони</td>
<td>70,7222</td>
</tr>
<tr>
<td>949</td>
<td>TRY</td>
<td>10</td>
<td>Турецких лир</td>
<td>98,6889</td>
</tr>
<tr>
<td>860</td>
<td>UZS</td>
<td>10000</td>
<td>Узбекских сумов</td>
<td>71,1393</td>
</tr>
<tr>
<td>980</td>
<td>UAH</td>
<td>10</td>
<td>Украинских гривен</td>
<td>26,7351</td>
</tr>
<tr>
<td>826</td>
<td>GBP</td>
<td>1</td>
<td>Фунт стерлингов Соединенного королевства</td>
<td>95,4635</td>
</tr>
<tr>
<td>203</td>
<td>CZK</td>
<td>10</td>
<td>Чешских крон</td>
<td>33,0656</td>
</tr>
<tr>
<td>752</td>
<td>SEK</td>
<td>10</td>
<td>Шведских крон</td>
<td>83,9094</td>
</tr>
<tr>
<td>756</td>
<td>CHF</td>
<td>1</td>
<td>Швейцарский франк</td>
<td>80,3431</td>
</tr>
<tr>
<td>710</td>
<td>ZAR</td>
<td>10</td>
<td>Южноафриканских рэндов</td>
<td>41,8957</td>
</tr>
<tr>
<td>392</td>
<td>JPY</td>
<td>100</td>
<td>Японских иен</td>
<td>68,5431</td>
</tr>
</tbody>
вопрос в следующем - как мне отфильтровать tr по значению одного из td , ну или еще как-то , использую BeautifulSoup
Python:
from bs4 import BeautifulSoup
site= "https://cbr.ru/currency_base/daily/"
import requests
def get_html(site):
r = requests.get(site)
return r.text
ct = get_html(site)
soup = BeautifulSoup( ct,'lxml')
print(soup.body.tbody)
спасибо!