我正在尝试使用 wget
下载项目的文件,因为该项目的 SVN 服务器不再运行,我只能通过浏览器访问这些文件。所有文件的基本 URL 都相同
http://abc.tamu.edu/projects/tzivi/repository/revisions/2/raw/tzivi/*
如何使用 wget
(或任何其他类似工具)下载此存储库中的所有文件,其中“tzivi”文件夹是根文件夹,并且在下面有多个文件和子文件夹(最多 2 或 3 级)它?
您可以在 shell 中使用它:
wget -r --no-parent http://abc.tamu.edu/projects/tzivi/repository/revisions/2/raw/tzivi/
参数是:
-r //recursive Download
和
--no-parent // Don´t download something from the parent directory
如果您不想下载全部内容,可以使用:
-l1 just download the directory (tzivi in your case)
-l2 download the directory and all level 1 subfolders ('tzivi/something' but not 'tivizi/somthing/foo')
等等。如果您不插入 -l
选项,wget
将自动使用 -l 5
。
如果您插入 -l 0
,您将下载整个 Internet,因为 wget
将跟随它找到的每个链接。
您可以在外壳中使用它:
wget -r -nH --cut-dirs=7 --reject="index.html*" \
http://abc.tamu.edu/projects/tzivi/repository/revisions/2/raw/tzivi/
参数是:
-r recursively download
-nH (--no-host-directories) cuts out hostname
--cut-dirs=X (cuts out X directories)
This link 刚刚给了我最好的答案:
$ wget --no-clobber --convert-links --random-wait -r -p --level 1 -E -e robots=off -U mozilla http://base.site/dir/
像魅力一样工作。
wget -r --no-parent URL --user=username --password=password
如果您有下载的用户名和密码,则最后两个选项是可选的,否则不需要使用它们。
您还可以在链接 https://www.howtogeek.com/281663/how-to-use-wget-the-ultimate-command-line-downloading-tool/ 中查看更多选项
使用命令
wget -m www.ilanni.com/nexus/content/
你也可以使用这个命令:
wget --mirror -pc --convert-links -P ./your-local-dir/ http://www.your-website.com
以便您获得要下载的网站的确切镜像
试试这个工作代码(30-08-2021):
!wget --no-clobber --convert-links --random-wait -r -p --level 1 -E -e robots=off --adjust-extension -U mozilla "yourweb directory with in quotations"
这有效:
wget -m -np -c --no-check-certificate -R "index.html*" "https://the-eye.eu/public/AudioBooks/Edgar%20Allan%20Poe%20-%2"
这将有助于
wget -m -np -c --level 0 --no-check-certificate -R"index.html*"http://www.your-websitepage.com/dir
wget -r -l1 --no-parent http://www.stanford.edu/~boyd/cvxbook/cvxbook_additional_exercises/
是我的答案。谢谢你的回答。http://websitename.com/wp-content/uploads/2009/05
获取所有文件,但我得到的只是一个没有任何内容的index.html
文件。我想不出我错过了什么。-e robots=off
开关。 ;)