Python进程使用的总内存?

rwa*_*ace 229 python memory-management

有没有办法让Python程序确定它当前使用了多少内存?我已经看过有关单个对象的内存使用情况的讨论,但我需要的是进程的总内存使用量,以便我可以确定何时需要开始丢弃缓存数据.

Bas*_*asj 265

是一个适用于各种操作系统的有用解决方案,包括Linux,Windows 7等:

import os
import psutil
process = psutil.Process(os.getpid())
print(process.memory_info().rss)  # in bytes 
Run Code Online (Sandbox Code Playgroud)

在我目前的Python 2.7安装中,最后一行应该是

print(process.memory_info()[0])
Run Code Online (Sandbox Code Playgroud)

相反(API有变化).

注意:pip install psutil如果尚未安装,请执行操作.

  • 请注意,psutil不在标准库中 (31认同)
  • 对于最新版本的psutil,psutil.Process()等效于psutil.Process(os.getpid())。这是您需要记住的少一件事。 (6认同)
  • 这个[答案](/sf/answers/1473481621/)很好地解释了“驻留集大小”和“虚拟内存大小”之间的区别。 (5认同)
  • 为什么这个数字与流程浏览器中的数字不匹配?来自 psutil 的数字似乎总是大 10% 左右。 (4认同)
  • `psutil`是跨平台的,可以返回与`ps`命令行工具相同的值:http://pythonhosted.org/psutil/#psutil.Process.memory_info (3认同)
  • 你为什么使用RSS?在 psutil 文档中: rss | 驻留集大小,vms | 程序总大小。所以我认为最后一行应该是 `print(process.memory_info().vms)` (3认同)
  • 完全同意@HalilIbrahimOymacı:RSS 是物理内存。在超过 90% 的情况下,这是错误的衡量标准。很多效果是无法观察到的。并且:较高的 RSS 是好的,因为您实际上利用了 RAM。这比使用硬盘更好,因为它更快。 (2认同)
  • 使用“ humanize”包以人类可读的形式打印内存使用情况:“ humanize.naturalsize(psutil.Process(os.getpid()).memory_info().rss)”。示例“2.9 GB” (2认同)

Nat*_*ike 193

对于基于Unix的系统(Linux,Mac OS X,Solaris),您可以使用getrusage()标准库模块中的功能resource.生成的对象具有属性ru_maxrss,该属性为调用进程提供峰值内存使用情况:

>>> resource.getrusage(resource.RUSAGE_SELF).ru_maxrss
2656  # peak memory usage (kilobytes on Linux, bytes on OS X)
Run Code Online (Sandbox Code Playgroud)

Python文档不记单位.请参阅特定系统的man getrusage.2页面以检查设备的值.在Ubuntu 18.04上,该单位以千字节为单位.在Mac OS X上,它是字节.

getrusage()函数还可以resource.RUSAGE_CHILDREN用于获取子进程的使用,并且(在某些系统上)resource.RUSAGE_BOTH用于总(自身和子进程)进程使用.

如果你只关心Linux的,则可以选择阅读/proc/self/status/proc/self/statm在其他的答案对这个问题,并描述文件一个了.

  • 单位不是千字节.它取决于平台,因此您必须使用resource.getpagesize()来查找.给定的Python文档(https://docs.python.org/2/library/resource.html#resource-usage)实际上非常清楚.在我的盒子里是4096. (11认同)
  • Mac OS绝对以字节为单位返回RSS,Linux以千字节为单位返回. (6认同)
  • @BenLin那些Python文档显然是错误的,或者Mac版本中存在错误.getrusage使用的单位和getpagesize返回的值肯定是不同的. (5认同)
  • 这个问题要求**当前使用**.请注意,这是**最大**使用率.(仍然是一个有用的答案,只是警告那些错误地复制粘贴它的人.) (5认同)
  • 好的,会的。我不确定 SO 是否有合并问题的流程或什么。重复的帖子部分是为了向人们展示关于这两个问题的标准库解决方案......部分是为了代表。;) 我应该删除这个答案吗? (2认同)

cod*_*ape 64

在Windows上,您可以使用WMI(主页,cheeseshop):


def memory():
    import os
    from wmi import WMI
    w = WMI('.')
    result = w.query("SELECT WorkingSet FROM Win32_PerfRawData_PerfProc_Process WHERE IDProcess=%d" % os.getpid())
    return int(result[0].WorkingSet)
Run Code Online (Sandbox Code Playgroud)

在Linux上(来自python cookbook http://code.activestate.com/recipes/286222/:

import os
_proc_status = '/proc/%d/status' % os.getpid()

_scale = {'kB': 1024.0, 'mB': 1024.0*1024.0,
          'KB': 1024.0, 'MB': 1024.0*1024.0}

def _VmB(VmKey):
    '''Private.
    '''
    global _proc_status, _scale
     # get pseudo file  /proc/<pid>/status
    try:
        t = open(_proc_status)
        v = t.read()
        t.close()
    except:
        return 0.0  # non-Linux?
     # get VmKey line e.g. 'VmRSS:  9999  kB\n ...'
    i = v.index(VmKey)
    v = v[i:].split(None, 3)  # whitespace
    if len(v) < 3:
        return 0.0  # invalid format?
     # convert Vm value to bytes
    return float(v[1]) * _scale[v[2]]


def memory(since=0.0):
    '''Return memory usage in bytes.
    '''
    return _VmB('VmSize:') - since


def resident(since=0.0):
    '''Return resident memory usage in bytes.
    '''
    return _VmB('VmRSS:') - since


def stacksize(since=0.0):
    '''Return stack size in bytes.
    '''
    return _VmB('VmStk:') - since
Run Code Online (Sandbox Code Playgroud)

  • Windows代码对我不起作用.这个改变确实:`return int(result [0] .WorkingSet)` (14认同)

bay*_*yer 30

在unix上,您可以使用该ps工具对其进行监控:

$ ps u -p 1347 | awk '{sum=sum+$6}; END {print sum/1024}'
Run Code Online (Sandbox Code Playgroud)

其中1347是某个进程ID.此外,结果是以MB为单位.


Luc*_*Luc 15

当前进程在 Linux 上的当前内存使用情况,用于 Python 2、 Python 3pypy,没有任何导入:

def getCurrentMemoryUsage():
    ''' Memory usage in kB '''

    with open('/proc/self/status') as f:
        memusage = f.read().split('VmRSS:')[1].split('\n')[0][:-3]

    return int(memusage.strip())
Run Code Online (Sandbox Code Playgroud)

它读取当前进程的状态文件,取 之后的所有内容VmRSS:,然后取第一个换行符之前的所有内容(隔离 VmRSS 的值),最后切掉最后 3 个字节,即空格和单位 (kB)。
要返回,它会去除任何空格并将其作为数字返回。

在 Linux 4.4 和 4.9 上进行了测试,但即使是早期的 Linux 版本也应该可以工作:查看man proc并搜索/proc/$PID/status文件上的信息,它提到了某些领域的最低版本(如 Linux 2.6.10 的“VmPTE”),但“VmRSS " 字段(我在这里使用)没有这样的提及。因此,我认为它自早期版本以来一直存在。


Chu*_*Lai 7

我喜欢,谢谢@bayer。我现在得到了一个特定的进程计数工具。

# Megabyte.
$ ps aux | grep python | awk '{sum=sum+$6}; END {print sum/1024 " MB"}'
87.9492 MB

# Byte.
$ ps aux | grep python | awk '{sum=sum+$6}; END {print sum " KB"}'
90064 KB
Run Code Online (Sandbox Code Playgroud)

附上我的进程列表。

$ ps aux  | grep python
root       943  0.0  0.1  53252  9524 ?        Ss   Aug19  52:01 /usr/bin/python /usr/local/bin/beaver -c /etc/beaver/beaver.conf -l /var/log/beaver.log -P /var/run/beaver.pid
root       950  0.6  0.4 299680 34220 ?        Sl   Aug19 568:52 /usr/bin/python /usr/local/bin/beaver -c /etc/beaver/beaver.conf -l /var/log/beaver.log -P /var/run/beaver.pid
root      3803  0.2  0.4 315692 36576 ?        S    12:43   0:54 /usr/bin/python /usr/local/bin/beaver -c /etc/beaver/beaver.conf -l /var/log/beaver.log -P /var/run/beaver.pid
jonny    23325  0.0  0.1  47460  9076 pts/0    S+   17:40   0:00 python
jonny    24651  0.0  0.0  13076   924 pts/4    S+   18:06   0:00 grep python
Run Code Online (Sandbox Code Playgroud)

参考


Iho*_* B. 7

下面是我的函数装饰器,它允许跟踪这个进程在函数调用之前消耗了多少内存,在函数调用之后它使用了多少内存,以及函数执行了多长时间。

import time
import os
import psutil


def elapsed_since(start):
    return time.strftime("%H:%M:%S", time.gmtime(time.time() - start))


def get_process_memory():
    process = psutil.Process(os.getpid())
    return process.memory_info().rss


def track(func):
    def wrapper(*args, **kwargs):
        mem_before = get_process_memory()
        start = time.time()
        result = func(*args, **kwargs)
        elapsed_time = elapsed_since(start)
        mem_after = get_process_memory()
        print("{}: memory before: {:,}, after: {:,}, consumed: {:,}; exec time: {}".format(
            func.__name__,
            mem_before, mem_after, mem_after - mem_before,
            elapsed_time))
        return result
    return wrapper
Run Code Online (Sandbox Code Playgroud)

所以,当你有一些用它装饰的函数时

from utils import track

@track
def list_create(n):
    print("inside list create")
    return [1] * n
Run Code Online (Sandbox Code Playgroud)

您将能够看到此输出:

inside list create
list_create: memory before: 45,928,448, after: 46,211,072, consumed: 282,624; exec time: 00:00:00
Run Code Online (Sandbox Code Playgroud)


A.A*_*tov 7

对于 Python 3.6 和 psutil 5.4.5,使用此处memory_percent()列出的函数更容易。

import os
import psutil
process = psutil.Process(os.getpid())
print(process.memory_percent())
Run Code Online (Sandbox Code Playgroud)


Ped*_*eis 5

import os, win32api, win32con, win32process
han = win32api.OpenProcess(win32con.PROCESS_QUERY_INFORMATION|win32con.PROCESS_VM_READ, 0, os.getpid())
process_memory = int(win32process.GetProcessMemoryInfo(han)['WorkingSetSize'])
Run Code Online (Sandbox Code Playgroud)

  • 这可以通过对其作用和工作原理的一些解释来改进。 (9认同)
  • 根据返回的大量数字(8 位数字)以及我没有做太多事情,我猜这必须是字节?因此,对于相当空闲的交互式实例来说,其大小约为 28.5 MB。(哇……我什至没有意识到上面的评论是我 4 年前的……这很奇怪。) (3认同)

Don*_*kby 5

/proc/self/status:更容易使用/proc/self/statm。这只是几个统计信息的空格分隔列表。我无法判断这两个文件是否始终存在。

/proc/[pid]/statm

提供有关内存使用情况的信息,以页为单位。列是:

  • size (1) 程序总大小(与 /proc/[pid]/status 中的 VmSize 相同)
  • resident (2) 常驻集大小(与/proc/[pid]/status中的VmRSS相同)
  • shared (3) 常驻共享页面的数量(即由文件支持)(与 /proc/[pid]/status 中的 RssFile+RssShmem 相同)
  • 文字(4)文字(代码)
  • lib (5) 库(自 Linux 2.6 起未使用;始终为 0)
  • 数据(6)数据+堆栈
  • dt (7) 脏页(自 Linux 2.6 起未使用;始终为 0)

这是一个简单的例子:

from pathlib import Path
from resource import getpagesize

PAGESIZE = getpagesize()
PATH = Path('/proc/self/statm')


def get_resident_set_size() -> int:
    """Return the current resident set size in bytes."""
    # statm columns are: size resident shared text lib data dt
    statm = PATH.read_text()
    fields = statm.split()
    return int(fields[1]) * PAGESIZE


data = []
start_memory = get_resident_set_size()
for _ in range(10):
    data.append('X' * 100000)
    print(get_resident_set_size() - start_memory)
Run Code Online (Sandbox Code Playgroud)

这会产生一个看起来像这样的列表:

0
0
368640
368640
368640
638976
638976
909312
909312
909312
Run Code Online (Sandbox Code Playgroud)

您可以看到,在大约 3 次 100,000 字节的分配后,它跳跃了大约 300,000 字节。