У меня есть такой HTML-файл, который можно открыть с помощью Libreoffice и затем экспортировать в Excel

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">

<html>
<head>

    <meta http-equiv="content-type" content="text/html; charset=utf-8">
    <title>Tables</title>
    <meta name="generator" content="LibreOffice 4.2.8.2 (Linux)">
    <meta name="created" content="20170328;3115845446710">
    <meta name="changed" content="20170328;3152295681061">

    <style type="text/css"><!-- 
        body,div,table,thead,tbody,tfoot,tr,th,td,p { font-family:"Liberation Sans"; font-size:x-small }
         -->
    </style>

Но я хочу знать, существует ли метод для этого через командную строку

1 ответ1

0

Если файл можно нормально открыть в LibreOffice, вы можете использовать это

libreoffice --convert-to xls myfile.html

или же

libreoffice --convert-to xlsx myfile.html

в зависимости от того, какой формат вы хотите

Если вы используете старую версию LibreOffice (<4.5), вам также нужна опция --headless

libreoffice --headless --convert-to xlsx myfile.html

Вы также можете использовать unoconv

unoconv -f xlsx myfile.html

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .