Czołgam tabelę z łączem internetowym i chciałby odbudować tablicę, usuwając wszystkie znaczniki skryptów. Oto kody źródłowe.Jak mogę usunąć wszystkie znaczniki skryptów w różnych BeautifulSoup?
response = requests.get(url)
soup = BeautifulSoup(response.text)
table = soup.find('table')
for row in table.find_all('tr') :
for col in row.find_all('td'):
#remove all different script tags
#col.replace_with('')
#col.decompose()
#col.extract()
col = col.contents
Jak mogę usunąć wszystkie inne tagi skryptu? Weź komórkę follow jako exampple, który zawiera znacznik a
, br
i td
.
<td><a href="http://www.irit.fr/SC">Signal et Communication</a>
<br/><a href="http://www.irit.fr/IRT">Ingénierie Réseaux et Télécommunications</a>
</td>
Moja Oczekiwany wynik to:
Signal et Communication
Ingénierie Réseaux et Télécommunications
spojrzeć na to: http://stackoverflow.com/questions/31462360/beautifulsoup-get-text-is-not-specific- wystarczająco-for-my-html-parsowania – dm295