ChatGPT解决这个技术问题 Extra ChatGPT

在 ipython 笔记本中测量单元执行时间的简单方法

除了单元格的原始输出之外,我还想获得在单元格执行上花费的时间。

为此,我尝试了 %%timeit -r1 -n1 但它没有公开单元格中定义的变量。

%%time 适用于仅包含 1 条语句的单元格。

In[1]: %%time
       1
CPU times: user 4 µs, sys: 0 ns, total: 4 µs
Wall time: 5.96 µs
Out[1]: 1

In[2]: %%time
       # Notice there is no out result in this case.
       x = 1
       x
CPU times: user 3 µs, sys: 0 ns, total: 3 µs
Wall time: 5.96 µs

最好的方法是什么?

更新

我使用 Execute Time in Nbextension 已经有一段时间了。太好了。

更新 2021-03

截至目前,this 是正确答案。本质上,%%time%%timeit 现在都按预期工作。

你真的需要计时值的显示吗?为什么不把 x 显示行放在下一个单元格中?
为什么不接受答案?

V
Vasilis Lemonidis

我发现解决这个问题的唯一方法是使用 print 执行最后一条语句。

Do not forget that 单元格魔法以 %% 开头,线条魔法以 % 开头。

%%time
clf = tree.DecisionTreeRegressor().fit(X_train, y_train)
res = clf.predict(X_test)
print(res)

https://i.stack.imgur.com/xmrnj.png


现在 %%time 即使没有打印最后一条语句也可以工作,正如@rhaps0dy 上面指出的那样。
display(res) 也可以工作,并且是尝试显示 pandas 数据框或其他需要程式化输出的东西时的首选解决方案。
@dshefman 是的,这是正确的,并且也可以轻松移植到 databricks/spark 笔记本上。
当我们实现第一个单元 %%timea=1 但第二个单元不知道 a 是什么时,这不是问题吗?
供参考。我发现测试单元格中的变量现在被考虑到下一个单元格中。 (20/02/2020) - 费
v
vForce

更简单的方法是使用 jupyter_contrib_nbextensions 包中的 ExecuteTime 插件。

pip install jupyter_contrib_nbextensions
jupyter contrib nbextension install --user
jupyter nbextension enable execute_time/ExecuteTime

这是最被低估的答案!
对于那些潜入答案海洋的人:这是一个,只需安装它,然后您就会以一种不错的格式看到每个单元格的执行时间
工作完美!还包括执行单元格时的时间戳
如果 pip 不起作用,github 上会提到 conda 或直接安装选项github.com/ipython-contrib/jupyter_contrib_nbextensions
O
Owen

%time%timeit 现在是 ipython 内置 magic commands 的一部分


P
Philipp Schwarz

使用 cell magic 和 Phillip Cloud 在 github 上的这个项目:

通过将其放在笔记本顶部来加载它,或者如果您始终希望默认加载它,则将其放入配置文件中:

%install_ext https://raw.github.com/cpcloud/ipython-autotime/master/autotime.py
%load_ext autotime

如果加载,后续单元执行的每个输出都将包括执行它所花费的时间(以分钟和秒为单位)。


这不再有效,因为 %install_ext 已被弃用。有替代方案吗?
有一个拉取请求解决了这个问题(github.com/cpcloud/ipython-autotime/pull/5)然后您可以尝试 pip install ipython-autotime
现在即使最后一个语句不是 print%%time 也可以工作。
总结一下:1)pip install ipython-autotime 2)在 jupyter 的第一个单元格中输入:%load_ext autotime
m
mina
import time
start = time.time()
"the code you want to test stays here"
end = time.time()
print(end - start)

完美的。从 %%timeit 保存对象并在下一个单元格中使用太麻烦了
a
andrewdotn

这只是旧版本中的一个问题。

您现在需要做的就是将 %%time 放在单元格的顶部。

https://i.stack.imgur.com/XjFY3.png

%%time 衡量某项运行所需的时间。报告长时间运行的操作比进行低级优化更好。

%%timeit 是一种基准测试工具,它反复运行语句以提供某些语句的平均运行时间以及标准偏差。由于语句重复执行的方式,在 %%timeit 单元格中创建的变量在其他单元格中不可用。

https://i.stack.imgur.com/otAsS.png

%%timeit 使用 python timeit 模块。那个文档说,

它避免了一些用于测量执行时间的常见陷阱。另请参阅 Tim Peters 对 O'Reilly 出版的 Python Cookbook 中“算法”一章的介绍。

希望该模块仍然相关,因为 the reference it refers to 描述了以下问题,例如 (1) Windows 98 的解决方法仅更新 time.time() 每秒 18.2 次,以及 (2) 将所有语句卡在一行以避免增加行号计数器的字节码开销。

currently top-rated answer 以及其他一些过时的(应该删除,因为它们现在高度误导确实有有用的评论表明这些答案不是正确的:

即使没有打印最后一条语句,%%time 也有效

现在将测试单元格中的变量考虑到下一个单元格中


这个答案甚至没有排在首位,而答案按“趋势”排序。它应该比其他人获得更多最近的选票。
M
Mostafa Gazar

您可以为此使用 timeit 魔术函数。

%timeit CODE_LINE

或者在细胞上

%%timeit 

SOME_CELL_CODE

https://nbviewer.jupyter.org/github/ipython/ipython/blob/1.x/examples/notebooks/Cell%20Magics.ipynb 查看更多 IPython 魔术函数


H
Hari_pb

我只是在单元格的开头添加了 %%time 并获得了时间。您可以在 Jupyter Spark 集群/使用相同的虚拟环境中使用相同的。只需在单元格顶部添加 %%time 即可获得输出。在使用 Jupyter 的 spark 集群上,我添加到单元格的顶部,得到如下输出:-

[1]  %%time
     import pandas as pd
     from pyspark.ml import Pipeline
     from pyspark.ml.classification import LogisticRegression
     import numpy as np
     .... code ....

Output :-

CPU times: user 59.8 s, sys: 4.97 s, total: 1min 4s
Wall time: 1min 18s

这是否执行单元格代码默认否。次然后取平均值?那么作为“设置代码”的第一条语句呢?
它执行一次代码
e
eafit

这不是很漂亮,但没有额外的软件

class timeit():
    from datetime import datetime
    def __enter__(self):
        self.tic = self.datetime.now()
    def __exit__(self, *args, **kwargs):
        print('runtime: {}'.format(self.datetime.now() - self.tic))

然后你可以像这样运行它:

with timeit():
    # your code, e.g., 
    print(sum(range(int(1e7))))

% 49999995000000
% runtime: 0:00:00.338492

n
nemish zalavadiya neel

如果要打印墙单元执行时间,这是一个技巧,请使用

%%time
<--code goes here-->

但这里要确保 %%time 是一个神奇的函数,所以把它放在代码的第一行。

如果你把它放在你的代码的某行之后,它会给你使用错误并且不会工作。


D
Dhananjai Kumar Pandey

在 ipython notebook 中测量单元执行时间的最简单方法是使用 ipython-autotime 包。

在 notebook 开头安装包

pip install ipython-autotime

然后通过在下面运行来加载扩展

%load_ext autotime

加载后,任何在此之后运行的单元格都会为您提供单元格的执行时间。

如果你想关闭它,不用担心,只需在下面运行即可卸载扩展程序

%unload_ext autotime

无论何时需要,它都非常简单易用。

如果您想了解更多,可以参考ipython-autime documentation或其github source


b
blehman

有时使用 print(res) 时单元格中的格式会有所不同,但 jupyter/ipython 带有 display。请参阅下面使用 pandas 的格式差异示例。

%%time
import pandas as pd 
from IPython.display import display

df = pd.DataFrame({"col0":{"a":0,"b":0}
              ,"col1":{"a":1,"b":1}
              ,"col2":{"a":2,"b":2}
             })

#compare the following
print(df)
display(df)

https://i.stack.imgur.com/q3pXf.png


这是否执行单元格代码默认否。次然后取平均值?那么作为“设置代码”的第一条语句呢?
m
markroxor

您可能还想查看 python 的分析魔法命令%prun,它提供了类似 -

def sum_of_lists(N):
    total = 0
    for i in range(5):
        L = [j ^ (j >> i) for j in range(N)]
        total += sum(L)
    return total

然后

%prun sum_of_lists(1000000)

将返回

14 function calls in 0.714 seconds  

Ordered by: internal time      

ncalls  tottime  percall  cumtime  percall filename:lineno(function)
    5    0.599    0.120    0.599    0.120 <ipython-input-19>:4(<listcomp>)
    5    0.064    0.013    0.064    0.013 {built-in method sum}
    1    0.036    0.036    0.699    0.699 <ipython-input-19>:1(sum_of_lists)
    1    0.014    0.014    0.714    0.714 <string>:1(<module>)
    1    0.000    0.000    0.714    0.714 {built-in method exec}

我发现它在处理大量代码时很有用。


p
prosti

遇到麻烦时意味着什么:

?%timeit??timeit

要获取详细信息:

Usage, in line mode:
  %timeit [-n<N> -r<R> [-t|-c] -q -p<P> -o] statement
or in cell mode:
  %%timeit [-n<N> -r<R> [-t|-c] -q -p<P> -o] setup_code
  code
  code...

Time execution of a Python statement or expression using the timeit
module.  This function can be used both as a line and cell magic:

- In line mode you can time a single-line statement (though multiple
  ones can be chained with using semicolons).

- In cell mode, the statement in the first line is used as setup code
  (executed but not timed) and the body of the cell is timed.  The cell
  body has access to any variables created in the setup code.