2

Я использую Ubuntu и пытаюсь найти способ связать URL-адрес веб-сайта, на котором файл был загружен в этот файл. Согласно тому, что я исследовал до сих пор, URL-адрес может быть сохранен с использованием расширенных атрибутов, но моя проблема заключается в том, как узнать / перехватить этот URL-адрес сайта, на который был загружен файл.

Я также нашел следующую ссылку - http://www.freedesktop.org/wiki/CommonExtendedAttributes/ - но я не понимаю, находится ли она в разработке или ее можно загрузить и установить.

1 ответ1

0

Если вы используете прокси-сервер, такой как squid , данные будут доступны в журнале доступа. Журнал доступа вращается и удаляется в конце концов. Данные могут быть легко сопоставлены с загруженным файлом, если доступен журнал доступа, а имя файла, использованного для его сохранения, соответствует URL-адресу. Если файл кэшируется, заголовок кэша будет содержать источник файла.

html файлы могут содержать метаданные, которые могут указывать хост, с которого была загружена страница.

Было бы намного проще, если бы загружающая программа записывала расширенный атрибут во время загрузки. Я не знаю ни одного, что делает.

Такие инструменты, как wget могут хранить файлы в структуре каталогов, названной по имени домена из URL. Это может быть использовано для заполнения расширенного атрибута.

Какой вариант использования для сбора этих данных?

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .