Python Beautifulsoup извлекает шестнадцатеричные значения

Arjun Thakur спросил: 11 июня 2018 в 11:08 в: python

Я создаю скребок, где я хочу извлечь данные из некоторых тегов, так как это без какого-либо преобразования. Но Beautifulsoup меняет некоторые шестнадцатеричные значения на ASCII. Например, этот код преобразуется в ASCII

html = """\
<title>&#x42;&#x69;&#x6C;&#x6C;&#x69;&#x6E;&#x67;&#x20;&#x61;&#x64;&#x64;&#x72;&#x65;&#x73;&#x73; - &#x50;&#x61;&#x79;&#x50;&#x61;&#x6C;</title>
<title>Billing address - PayPal</title>"""

Вот небольшой пример кода

from bs4 import BeautifulSoup
soup = BeautifulSoup(html, "lxml")
for element in soup.findAll(['title', 'form', 'a']):
    print(str(element))

Но я хочу извлечь данные в той же форме. Я считаю, что BeautifulSoup 4 автоматически конвертирует объекты HTML, и это то, чего я не хочу. Любая помощь будет действительно оценена.

BTW Я использую Python 3.5 и Beautifulsoup 4

0 ответов