1
  1. Я использую wget для сохранения веб-страницы в файл annie.html.
% wget -qO-  http://www.swagbucks.com/watch/video/523803/annie > annie.html
  1. Внутри этого файла эта строка:
<div id="sbPlaylistVideoContainer" class="fullSize"></div>
  1. Вопрос: как мне получить фактический код для этого элемента <div> ? Если для этого щелкнуть правой кнопкой мыши видео в Chrome и нажать "Проверить элемент", я увижу фактический код.

Похоже на это.

<video id="example_video_1_html5_api" class="vjs-tech" preload="none" src="blob:http%3A//www.swagbucks.com/096df37a-81fe-4c65-b082-0fe059254d6e" style=""><source src="http://progressive.totaleclips.com.edgesuite.net/137/e137013_257.mp4?eclipid=e137013&amp;bitrateid=457&amp;vendorid=1839&amp;type=.mp4" type="video/mp4"></video>

Откуда Chrome это взял? Он не существует на веб-странице. Я хотел бы получить правильный синтаксис команды 'wget', который сохранит этот код в файл.

2 ответа2

2

Без фактического анализа веб-страницы невозможно сказать наверняка, однако, скорее всего, веб-сайт использует JavaScript для добавления видеопроигрывателя на страницу. Функция Chrome "Inspect element" показывает текущее состояние DOM, а не обязательно является истинным источником для страницы.

Существует несколько причин, по которым веб-сайт может это сделать, включая определение возможностей вашего браузера для отображения соответствующего проигрывателя (например, HTML-видео или Flash-проигрывателя) или для возможности динамического изменения видео.

0

Веб-страница генерируется динамически. Поскольку вы просматриваете веб-страницу с Chrome, который поддерживает HTML5, сервер предоставляет вам тег, который является тегом html5. wget не идентифицирует себя как chrome, поэтому сервер по умолчанию имеет обратную совместимость

Обе команды действительны, хотя.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .