Программа Wget может иметь вводной файл, в котором печислены URL, которые следует скопировать на локальную машину в данном сеансе выполнения.
Если вы указали параметр -force-html, вводной документ будет рассматриваться как HTML страница. В этом случае возможны проблемы с относительными линками, которые вы сможете разрешить добавив в документ строку <base href="URL"> или определив параметр -base=URL в командной строке.
Заметим, что вам не обязательно определять этот параметр, если вы хотите продолжить копирование файла после обрыва связи - Wget делает это по умолчанию. Этот параметр нужен в случаях, когда Wget был абортирован или когда начало файла было скопировано другой программой, например, ncftp.
Без параметра -c, команда из предыдущего примера начн©т копировать удал©нный файл и даст ему локальное имя ls-lR.Z.1. Параметр -c приложим и к HTTP серверам, которые поддерживают заголовок Range.
По умолчанию, стиль default, каждая точка соответствует 1K байтов, 10 точек объединены в кластер, а в строке имеется 50 точек. Стиль binary имеет 8K байтов на точку, 16 точек в кластере и 48 точек в строке (384K на строку). Стиль mega подходит для очень больших пересылок - каждая точка соответствует 64K, восемь точек на кластер и 48 точек в строке, итого, 3MБ на строку. Стиль micro хорош для маленьких файлов: 128 байтов на точку, 8 точек на кластер и 48 точек на строку (6K на строку).
Пожалуйста не выключайте проверку на timeout, если вы не понимаете отчетливо, что вы делаете.
Использование больших значений полезно, если сеть или сервер вышел из строя. Таким образом, Wget может ждать такое время, за которое сеть или сервер будут приведены в рабочее состояние.
Заметим, что квота никогда не действует на одиночный файл. Так что, если
вы определили
wget -Q10k ftp://wuarchive.wustl.edu/ls-lR.gz
весь файл ls-lR.gz будет передан и записан на диск, даже если его
объ©м оказался намного больше 10КБ. То же самое
будет, если несколько URL определены в командной строке. Однако,
квота
будет принята во внимание, когда имеет место рекурсивный поиск и передача
файлов или, если URL прочитаны из вводного файла. Так, вы можете
предусмотрительно записать
wget -Q2m -i sites
передача и запись файлов будет завершена, если квота 2MБ будет превышена.
Установив значение квоты в 0 или inf вы отключите проверку на квоту.
ppppppнет управления->
ftp.xemacs.org/pub/xemacs/
-nH->
pub/xemacs/
-nH -cut-dirs=1->
xemacs/
-nH -cut-dirs=2->
.
-cut-dirs=1->
ftp.xemacs.org/xemacs/
...
Если желаете только прочесть каталожную структуру, то это подобно комбинации -nd и -P. Однако, в противоположность nd, параметр -cut-dirs не пропускает подкаталоги. Например, с использованием комбинации -nH -cut-dirs=1, подкаталог beta/ будет помещен, как можно ожидать, в xemacs/beta.
Другим способом определения имени пользователя и пароля является определение этих аргументов в самом URL.
По умолчанию -cache=on.
С данным параметром Wget будет игнорировать заголовок Content-Length как будто его нет.
Вы можете определить более, чем один заголовок с использованием параметра
-header более, чем один раз.
wget --header='Accept-Charset: iso-8859-2' \ --header='Accept-Language: hr' \ http://fly.cc.fer.hr/Определение пустой строки в качестве заголовка очистит все предыдущие заголовки, определ©нные пользователем.
Протокол HTTP разрешает клиенту идентифицировать себя с использованием поля заголовка User-Agent. Это позволяет распознавать какое использовалось программное обеспечение, для статистических целей или для целей отладки. Wget идентифицирует себя как Wget/version, где version есть текущий номер версии программы Wget.
Однако, как известно некоторые серверы выдают информацию в зависимости от значения поля User-Agent. Концептуально в этом ничего нет плохого, тем не менее печально, если сервер не выда©т никакой информации клиентам, которые не идентифицируют себя, например, как Internet Explorer или Mozilla. Этот параметр позволяет вам сменить поле User-Agent, которое выда©т Wget. Использование такой возможности трудно приветствовать, но вы знаете что делаете.
Заметим попутно, что компания Netscape Communications Corp. настояла на том, что использование значения поля User-Agent равное Mozilla является знаком авторских прав и его несанкционированное использование может преследоваться по закону. Не используйте в параметре User-Agent программы Wget значение Mozilla.
[
и ]
(открывающая и
закрывающая квадратные скобки), чтобы расширить число файлов
переписываемых с удал©нного сервера. Например,
Возможно вы должны будете заключить ваши URL в кавычки, чтобы защитить их от автоматического расширения в вашей оболочке UNIX. Когда возможность расширения им©н включена, Wget просматривает оглавление каталога, который зависит от типа операционной системы. Это определяет, что данная возможность успешно работает с FTP серверами под управлением диалектов UNIX.
~
popular/page/
Заметим, что лишь в конце работы Wget сможет узнать какие линки были реально загружены. Следовательно, лишь в конце работы Wget будет выполняться окончательное преобразование.