Python для открытия html-файлов в Excel

user2770624 спросил: 12 мая 2018 в 03:53 в: python

У меня есть куча заказов на покупку в форматах .html, которые мне нужны для извлечения данных и ввода одного простого листа excel. Хотя я мог бы использовать beutifulsoup для этого, я предпочел бы просто использовать excel в встроенном конвертере, который уже делает намного лучшую работу. Затем просто работайте с файлами excel напрямую. Есть ли способ использовать python для открытия html-документов, а затем сохранить его снова в .xlsx. Я попытался использовать openpyxl, но он не принимает файлы html.


1 ответ

Есть решение
Zev Spitz ответил: 12 мая 2018 в 10:06

Вы можете использовать Python для автоматизации экземпляра приложения Excel, открытия каждого файла и сохранения в виде .xlsx:

import win32com.client
excelApp = win32com.client.Dispatch('Excel.Application')
book = excelApp.Open(path_to_html_file)
book.SaveAs(path_to_html_file + '.xlsx', 51)