Python 06d scrap

 0    6 kartičky    swiatangielskiego
stáhnout mp3 Vytisknout hrát zkontrolovat se
 
otázka odpověď
instalacja webscraping
začněte se učit
pip install beautifulsoup4
import webscraping oraz urllib oraz lxml
začněte se učit
import bs4 as bs import urllib. request import lxml
pobranie html z url
začněte se učit
url_content = urllib. request. urlopen('url'). read()
ekstrakcja linków do stron filmów
začněte se učit
find_url = bs. BeautifulSoup(url_content, 'lxml')
wyodrębnić wszystkie wystąpienia określonego tagu
začněte se učit
find_url_tds = find_url. findAll('td', {'class': 'titleColumn'})
jeśli wielokrotnie wyodrębniasz linki, możesz użyć poniższej funkcji:
začněte se učit
base_url + find_url_td. find('a'). attrs['href']

Chcete-li přidat komentář, musíte se přihlásit.