要从服务器下载 SOFA 统计信息,我使用 wget 命令:
wget -c http://sourceforge.net/projects/sofastatistics/files/latest/download?source=dlp
在这种情况下,下载文件的文件名是 download?source=files
。如果我在命令中添加 --output-document
选项,将输出文件重命名为 sofastatistics-latest.deb
,dpkg 包无法识别下载文件的格式。
dpkg-deb: error: `sofastatistics-latest.deb' is not a debian format archive
如何使用 wget 正确重命名下载的文件?
更新 - 2015 年 1 月 8 日
通过提供的链接,下载的文件始终是 *.tar.gz 文件。要使用真实姓名,只需添加 --content-disposition
选项(感谢@6EQUJ5!):
wget --content-disposition http://sourceforge.net/projects/sofastatistics/files/latest/download?source=dlp
但是我需要一个 *.deb 文件,所以这里是 @creaktive,我必须搜索 *.deb 文件链接。
感谢大家的回答!
file
说什么?
将标准输出重定向到任意文件名总是有效的。正如 man wget 所说,你正在正确地使用 -O
wget http://www.kernel.org/pub/linux/kernel/README -O foo
--2013-01-13 18:59:44-- http://www.kernel.org/pub/linux/kernel/README
Resolving www.kernel.org... 149.20.4.69, 149.20.20.133
Connecting to www.kernel.org|149.20.4.69|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: 12056 (12K) [text/plain]
Saving to: `foo'
100%[======================================================================================================================================>] 12,056 --.-K/s in 0.003s
2013-01-13 18:59:45 (4.39 MB/s) - `foo' saved [12056/12056]
实际上,您必须在文件中获取 HTML(通常可以使用 man 文件检查)。
[编辑]
在您的情况下,客户端收到 302 Found(您可以使用 curl -v URL 检查它)。
以下 curl 通过尊重 3xx 来解决问题:
$ curl -L http://sourceforge.net/projects/sofastatistics/files/latest/download?source=files -o foo.deb
% Total % Received % Xferd Average Speed Time Time Time Current
Dload Upload Total Spent Left Speed
0 463 0 0 0 0 0 0 --:--:-- 0:00:01 --:--:-- 0
0 0 0 0 0 0 0 0 --:--:-- 0:00:02 --:--:-- 0
100 2035k 100 2035k 0 0 390k 0 0:00:05 0:00:05 --:--:-- 1541k
$ file foo.deb
foo.deb: gzip compressed data, was "sofastats-1.3.1.tar", last modified: Thu Jan 10 00:30:44 2013, max compression
wget 应该有类似的选项来容忍 HTTP 重定向。
如果您要从 Web 浏览器进行相同的下载,并且您注意到浏览器实际上正确命名了文件,则可以使用 --content-disposition
选项为 wget 提供相同的行为:
wget --content-disposition http://sourceforge.net/projects/sofastatistics/files/latest/download?source=dlp
我的 Debian 手册页将此报告为“实验性”功能,但我不记得它对我不起作用:
--content-disposition
If this is set to on, experimental (not fully-functional) support for "Content-Disposition" headers is enabled. This can currently result in extra round-trips to the server
for a "HEAD" request, and is known to suffer from a few bugs, which is why it is not currently enabled by default.
This option is useful for some file-downloading CGI programs that use "Content-Disposition" headers to describe what the name of a downloaded file should be.
该链接指向重定向器,而不是最终目的地!因此,您正在下载 HTML 并将其重命名为 .deb
。杂乱的页面顶部有这个:
您的下载将在 0 秒后开始... 下载有问题?请使用此直接链接,或尝试其他镜像。
现在,this 是一个有效的链接(注意 download
前缀):http://downloads.sourceforge.net/project/sofastatistics/sofastatistics/1.3.1/sofastats-1.3.1-1_all.deb?r=http%3A%2F%2Fsourceforge.net%2Fprojects%2Fsofastatistics%2Ffiles%2Fsofastatistics%2F1.3.1%2F&ts=1358119361&use_mirror=ufpr
将此 URL 传递给 wget
。另外,请注意,SourceForge 试图超越您,通过 User-Agent 字符串来访问操作系统。 “wget”的最佳猜测似乎是 .tar.gz 包。所以,你应该更具体,请求 deb 文件!
这对我有用
在 macOS 上,我通过 Homebrew 安装了 wget,所以使用这个 brew install wget
然后我执行这个 wget -O ~/Downloads/file.txt https://www.gnu.org
或者这是相同的 wget --output-document ~/Downloads/fil.txt https://www.gnu.org