ChatGPT解决这个技术问题 Extra ChatGPT

如何在 Python 中检查文件大小?

如何在 Python 中获取文件的大小?

Path('./doc.txt').stat().st_size
感谢@Boris 提供现代 Python (v3.4+) 答案:)
还请熟悉一个稀疏文件的现象

M
Mateen Ulhaq

使用 os.path.getsize

>>> import os
>>> os.path.getsize("/path/to/file.mp3")
2071611

输出以字节为单位。


注意:os.path.getsize 的实现只是 return os.stat(filename).st_size
那么使用 os.path.getsize 而不是 os.stat(file).st_size 会不会有一点性能损失?
@wordsforthewise 测量它!在我的电脑中约为 150 ns。
@wordsforthewise 如果您还想获取有关文件的其他信息(例如修改时间、文件类型),这将是一个更大的问题——那么您不妨通过 os.stat 从单个系统调用中获取所有信息。然后差异可能会达到相当多的微秒:-)
然后除以 1e+6 得到文件大小(以 MB 为单位),例如:output/1e+6
B
Boris Verkhovskiy

您需要 the object returned by os.statst_size 属性。您可以使用 pathlib (Python 3.4+) 获得它:

>>> from pathlib import Path
>>> Path('somefile.txt').stat()
os.stat_result(st_mode=33188, st_ino=6419862, st_dev=16777220, st_nlink=1, st_uid=501, st_gid=20, st_size=1564, st_atime=1584299303, st_mtime=1584299400, st_ctime=1584299400)
>>> Path('somefile.txt').stat().st_size
1564

或使用 os.stat

>>> import os
>>> os.stat('somefile.txt')
os.stat_result(st_mode=33188, st_ino=6419862, st_dev=16777220, st_nlink=1, st_uid=501, st_gid=20, st_size=1564, st_atime=1584299303, st_mtime=1584299400, st_ctime=1584299400)
>>> os.stat('somefile.txt').st_size
1564

输出以字节为单位。


如果有的话,该值可以作为文件系统块大小的倍数(例如 4096 字节)传递。很高兴,它改为以字节形式给出。
@josch - 是的,这很好,对于“磁盘大小”,您可以将 stat_result.st_blocks 乘以块大小,但我仍在寻找如何以编程方式和跨平台获取它(而不是通过 tune2fs 等)。 )
t
trss

其他答案适用于真实文件,但如果您需要适用于“类文件对象”的东西,请尝试以下操作:

# f is a file-like object. 
f.seek(0, os.SEEK_END)
size = f.tell()

在我有限的测试中,它适用于真实文件和 StringIO。 (Python 2.7.3。)当然,“类文件对象”API 并不是真正严格的接口,但 API documentation 建议类文件对象应该支持 seek()tell()

编辑

这与 os.stat() 之间的另一个区别是,即使您没有读取文件的权限,您也可以 stat() 文件。显然,除非您有阅读权限,否则 seek/tell 方法将不起作用。

编辑 2

在 Jonathon 的建议下,这是一个偏执的版本。 (上面的版本将文件指针留在文件末尾,所以如果你试图从文件中读取,你会得到零字节!)

# f is a file-like object. 
old_file_position = f.tell()
f.seek(0, os.SEEK_END)
size = f.tell()
f.seek(old_file_position, os.SEEK_SET)

您不需要导入 os,而是写入 f.seek(0, 2) 以从末尾开始寻找 0 个字节。
对于最后一行,如果不使用 osf.seek(old_file_position, 0)
如果您使用整数文字而不是命名变量,那么您就是在折磨任何必须维护您的代码的人。没有令人信服的理由不导入 os
感谢您的解决方案,我已经实施并且工作正常。只是为了确认,size 输出以字节为单位?
显然,这至少有点冒险,具体取决于 Python 如何实现 #seek()wiki.sei.cmu.edu/confluence/display/c/…
R
Rajiv Sharma
import os


def convert_bytes(num):
    """
    this function will convert bytes to MB.... GB... etc
    """
    for x in ['bytes', 'KB', 'MB', 'GB', 'TB']:
        if num < 1024.0:
            return "%3.1f %s" % (num, x)
        num /= 1024.0


def file_size(file_path):
    """
    this function will return the file size
    """
    if os.path.isfile(file_path):
        file_info = os.stat(file_path)
        return convert_bytes(file_info.st_size)


# Lets check the file size of MS Paint exe 
# or you can use any file path
file_path = r"C:\Windows\System32\mspaint.exe"
print file_size(file_path)

结果:

6.1 MB

this function will convert bytes to MB.... GB... etc 错了。此函数会将字节转换为 MiB、GiB 等。请参阅 this post
在 Python >= 3.5 中,第 10 行可以更改为 return f'{num:.1f} {x}'
谢谢 Matt M.,稍作更新,第 10 行可以在 Python >= 3.5 中更改为 return f'{num}{unit}' if unit == 'bytes' else f'{num:.1f}{unit}'
A
Asclepius

使用 pathlibadded in Python 3.4PyPI 上可用的反向端口):

from pathlib import Path
file = Path() / 'doc.txt'  # or Path('./doc.txt')
size = file.stat().st_size

这实际上只是一个围绕 os.stat 的界面,但使用 pathlib 提供了一种访问其他文件相关操作的简单方法。


P
Peter Mortensen

如果我想从 bytes 转换为任何其他单位,我会使用 bitshift 技巧。如果您通过 10 进行右移,您基本上将它移动一个订单(多个)。

示例:5GB 为 5368709120 字节

print (5368709120 >> 10)  # 5242880 kilobytes (kB)
print (5368709120 >> 20 ) # 5120 megabytes (MB)
print (5368709120 >> 30 ) # 5 gigabytes (GB)

这不能回答问题。问题在于查找文件的大小,而不是格式化结果以供人类使用。
这些数字是错误的,因此令人困惑。 5GB 是 5e9 字节。这应该是某种人类可读的近似值吗?你甚至会在哪里使用这样的东西?
1位=>2 ... 2位=>4 ... 3位=>8 ... 4位=>16 ... 5位=>32 ... 6位=> 64 ... 7-bits=>128 ... 8-bits=>256 ... 9-bits=>512 ... 10-bits=>1024 ... 1024 字节为 1kB ... => 20 -bits => 1024 * 1024 = 1,048,576bytes,也就是1024kB,还有1MB……=> 30-bits => 1024 * 1024 * 1024 = 1,073,741,824 bytes,也就是1,048,576 kB,还有1024MB,还有1GB……你搞混了科学记数法和小数位数与计算中使用的二进制/base-2 表示。 5x9 = 5 x 10^9 = 5,000,000,000
伙计们,他没有混淆任何东西......他只是给出了一个近似值,当他说“基本上”时很明显。 2^10 约为。 10^3。事实上,这种近似值非常普遍,以至于 it has a nameMebiGibiTebi 分别是 Mega、Giga 和 Tera。关于不回答问题,@WillManley,你有一个公平的观点! ;-p
@WillManley 它没有回答这个问题,但它给了 OP 更多的知识,可能回答这个问题的人可以编辑这个问题和这个技巧。谢谢你..我需要这个
P
Peter Mortensen

严格坚持这个问题,Python代码(+伪代码)将是:

import os
file_path = r"<path to your file>"
if os.stat(file_path).st_size > 0:
    <send an email to somebody>
else:
    <continue to other things>

g
gunarevuri

我们有两个选项都包括导入 os 模块

1)

import os
os.stat("/path/to/file").st_size

as os.stat() 函数返回一个对象,该对象包含许多标题,包括文件创建时间和上次修改时间等。其中 st_size 给出了文件的确切大小。文件路径可以是绝对的或相对的。

2)在此,我们必须提供确切的文件路径,文件路径可以是相对的,也可以是绝对的。

import os
os.path.getsize("path of file")

os.path.getsize 使用相对路径
k
krishnakeshan

您可以使用 os 模块中的 stat() 方法。您可以为它提供字符串、字节甚至 PathLike 对象形式的路径。它也适用于文件描述符。

import os

res = os.stat(filename)

res.st_size # this variable contains the size of the file in bytes

C
Chikku Jacob
#Get file size , print it , process it...
#Os.stat will provide the file size in (.st_size) property. 
#The file size will be shown in bytes.

import os

fsize=os.stat('filepath')
print('size:' + fsize.st_size.__str__())

#check if the file size is less than 10 MB

if fsize.st_size < 10000000:
    process it ....