Я пытаюсь запустить сценарий PERL в первый раз.

Вот это: http://search.cpan.org/dist/HTML-ExtractMain/lib/HTML/ExtractMain.pm

Я никогда не использовал и не работал с PERL раньше, и нахожу документацию, которая приводится, действительно запутанной / трудной для понимания (она довольно мала). Я построил его в Windows 7 и запустил

./Build test

Команда, которая предлагается в файле README. Он говорит, что он пройден и все зависимости установлены.

Моя проблема, однако, проста, как мне использовать этот скрипт ?! :) Я подозреваю, что это может иметь больше смысла для людей, которые использовали PERL раньше. Для меня документация - это все бред.

Кто-нибудь сможет опубликовать пример того, как я буду использовать этот скрипт, пожалуйста?

Допустим, у меня есть HTML-страница index.html и я хочу извлечь из нее основные элементы.

Что я делаю?

1 ответ1

1

По сути, это не скрипт, а скорее модуль. Источник модуля связан в верхней части страницы (ссылка на источник). Вам нужно сохранить модуль в вашей системе, чтобы использовать его.

После этого вы пишете свой собственный скрипт, который импортирует этот модуль, а затем вы можете использовать функции из модуля в вашем скрипте.

На странице есть пример скрипта, который использует модуль. Я включил его ниже с комментариями о том, что он делает:

#import the module, make it available to use further down the script
use HTML::ExtractMain qw( extract_main_html );

#define some HTML data, save in the $html variable
my $html = <<'END';
<div id="header">Header</div>
<div id="nav"><a href="/">Home</a></div>
<div id="body">
    <p>Foo</p>
    <p>Baz</p>
</div>
<div id="footer">Footer</div>
END

#call the extract_main_html function that is defined in the module
my $main_html = extract_main_html($html, output_type => 'xhtml');

#if you get results from the function call, do something with the results
if (defined $main_html) {
    # do something with $main_html here
    # $main_html is '<div id="body"><p>Foo</p><p>Baz</p></div>'
}

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .