У меня есть куча заказов на покупку в форматах .html, которые мне нужны для извлечения данных и ввода одного простого листа excel. Хотя я мог бы использовать beutifulsoup для этого, я предпочел бы просто использовать excel в встроенном конвертере, который уже делает намного лучшую работу. Затем просто работайте с файлами excel напрямую. Есть ли способ использовать python для открытия html-документов, а затем сохранить его снова в .xlsx. Я попытался использовать openpyxl, но он не принимает файлы html.
Вы можете использовать Python для автоматизации экземпляра приложения Excel, открытия каждого файла и сохранения в виде
.xlsx
: