6

Я хотел бы записать верхний предел памяти RAM процесса Linux (ядро 3.2.0-36) к моменту завершения процесса. Я вызываю процесс внутри скрипта Perl. Что-то вроде:

my $cmd = "logmemory -o mem.log mycmd options 1>cmd.out 2>cmd.err";
unless(system("$cmd") == 0) { die $!; }

Есть идеи?

3 ответа3

13

Посмотрите на /proc/[pid]/status , особенно этот параметр.

  • VmHWM: Пиковый размер резидентного набора ("отметка максимальной воды").

Кроме того, вы можете использовать команду /usr/bin/time -v . Вот пример его выхода:

Command exited with non-zero status 1
    Command being timed: "xz -9ek access_log.3 access_log.xz"
    User time (seconds): 6.96
    System time (seconds): 0.34
    Percent of CPU this job got: 99%
    Elapsed (wall clock) time (h:mm:ss or m:ss): 0:07.34
    Average shared text size (kbytes): 0
    Average unshared data size (kbytes): 0
    Average stack size (kbytes): 0
    Average total size (kbytes): 0
  **Maximum resident set size (kbytes): 383456**
    Average resident set size (kbytes): 0
    Major (requiring I/O) page faults: 0
    Minor (reclaiming a frame) page faults: 24000
    Voluntary context switches: 3
    Involuntary context switches: 225
    Swaps: 0
    File system inputs: 0
    File system outputs: 0
    Socket messages sent: 0
    Socket messages received: 0
    Signals delivered: 0
    Page size (bytes): 4096
    Exit status: 1
5

Информация о верхней отметке ОЗУ для процесса уже собрана ядром (из man proc):

/proc/[pid]/status
Provides much of the information in /proc/[pid]/stat and /proc/[pid]/statm in a format that's easier for humans to parse.
(...)
* VmHWM: Peak resident set size ("high water mark").
(...)

Сложность в том, что это значение следует прочитать за мгновение до завершения процесса.

Я пробовал разные подходы (подробнее об этом в конце ответа), и тот, который работал для меня, был реализацией в C:

  • logmemory вызывает fork() для создания дочернего процесса.

  • Дочерний процесс вызывает ptrace() так что родительский процесс (который является logmemory) уведомляется каждый раз, когда дочерний процесс выполняет системный вызов.

  • Дочерний процесс использует execvp() для запуска mycmd .

  • logmemory терпеливо ждет уведомления. В этом случае он проверяет, вызвал ли mycmd exit_group . Если это так, он читает /proc/<pid>/status , копирует значения в mem.log и отсоединяет от дочернего. В противном случае logmemory позволяет mycmd продолжить работу и ожидает следующего уведомления.

Недостатком является то, что ptrace() замедляет отслеживаемую программу, ниже я приведу некоторые сравнения.

Эта версия logmemory не только регистрирует VmHWM но также:

  • VmPeak (пиковый размер виртуальной памяти, который включает в себя весь код, данные и общие библиотеки, а также страницы, которые были выгружены, и страницы, которые были отображены, но не использовались)

  • отметка времени

  • имя команды и аргументы

Это код, который, безусловно, можно улучшить - я не обладаю достаточными знаниями в C. Он работает, как и предполагалось (протестировано на 32-битной Ubuntu 12.04 и 64-битной SuSE Linux Enterprise Server 10 SP4):

// logmemory.c
#include <stdio.h>
#include <sys/ptrace.h>
#include <unistd.h>
#include <syscall.h>
#include <sys/reg.h>
#include <stdlib.h>
#include <string.h>
#include <time.h>

#define STRINGLENGTH 2048

int main(int argc, char **argv)
{   
    pid_t child_pid;
    long syscall;
    int status, index;
    FILE *statusfile, *logfile;
    char opt, statusfile_path[STRINGLENGTH], line[STRINGLENGTH], command[STRINGLENGTH], logfile_path[STRINGLENGTH] = "";
    time_t now;
    extern char *optarg;
    extern int optind;

    // Error checking
    if (argc == 1) {
        printf("Error: program to execute is missing. Exiting...\n");
        return 0;
    }
    // Get options
    while ((opt = getopt (argc, argv, "+o:")) != -1)
        switch (opt) {
            case 'o':
                strncpy(logfile_path, optarg, 2048);
                break;
            case ':':
                fprintf (stderr, "Aborting: argument for option -o is missing\n");
                return 1;
            case '?':
                fprintf (stderr, "Aborting: only valid option is -o\n");
                return 1;
    }
    // More error checking
    if (!strcmp(logfile_path, "")) {
        fprintf(stderr, "Error: log filename can't be empty\n");
        return 1;
    }
    child_pid = fork();
    // The child process executes this:
    if (child_pid == 0) {
        // Trace child process:
        ptrace(PTRACE_TRACEME, 0, NULL, NULL);
        // Execute command using $PATH
        execvp(argv[optind], (char * const *)(argv+optind));

    // The parent process executes this:
    } else {
        // Loop until child process terminates
        do {
            // Set ptrace to stop when syscall is executed
            ptrace(PTRACE_SYSCALL, child_pid, NULL, NULL);
            wait(&status);
            // Get syscall number
            syscall = ptrace(PTRACE_PEEKUSER, child_pid,
#ifdef __i386__
                          4 * ORIG_EAX,
#else
                          8 * ORIG_RAX,
#endif
                          NULL);
        } while (syscall != SYS_exit_group);

        // Construct path to status file and check whether status and log file can be opened
        snprintf(statusfile_path, STRINGLENGTH, "/proc/%d/status", child_pid);
        if ( !(logfile = fopen(logfile_path, "a+")) || !(statusfile = fopen(statusfile_path, "r")) ) {
            ptrace(PTRACE_DETACH, child_pid, NULL, NULL);
            return 1;
        }

        // Copy timestamp and command to logfile
        now = time(NULL);
        fprintf(logfile, "Date: %sCmd: ", asctime(localtime(&now)));
        for (index = optind; index < argc; index++)
           fprintf(logfile, " %s", argv[index]);
        fprintf(logfile, "\n");

        // Read status file line by line and copy lines containing VmPeak and VmHWM to logfile
        while (fgets(line, STRINGLENGTH, statusfile)) {
            if (strstr(line,"VmPeak") || strstr(line,"VmHWM"))
                fprintf(logfile, "%s", line);
        }
        fprintf(logfile, "\n");

        // Close files
        fclose(statusfile);
        fclose(logfile);

        // Detach from child process
        ptrace(PTRACE_DETACH, child_pid, NULL, NULL);
    }
    return 0;
}

Сохраните его как logmemory.c и скомпилируйте так:

$ gcc logmemory.c -o logmemory

Запустите это так:

$ ./logmemory 
Error: program to execute is missing. Exiting...
$ ./logmemory -o mem.log ls -l
(...)
$ ./logmemory -o mem.log free
             total       used       free     shared    buffers     cached
Mem:       1025144     760660     264484          0       6644     143980
-/+ buffers/cache:     610036     415108
Swap:      1046524     544228     502296
$ ./logmemory -o mem.log find /tmp -name \*txt
(...)
$ cat mem.log
Date: Mon Feb 11 21:17:55 2013
Cmd:  ls -l
VmPeak:     5004 kB
VmHWM:      1284 kB

Date: Mon Feb 11 21:18:01 2013
Cmd:  free
VmPeak:     2288 kB
VmHWM:       448 kB

Date: Mon Feb 11 21:18:26 2013
Cmd:  find /tmp -name *txt
VmPeak:     4700 kB
VmHWM:       908 kB

Я написал эту программу на C для проверки logmemory :

// bigmalloc.c
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#define ITERATIONS 200
int main(int argc, char **argv)
{
    int i=0;
    for (i=0; i<ITERATIONS; i++) {
        void *m = malloc(1024*1024);
        memset(m,0,1024*1024);
    }
    return 0;
}

Скомпилируйте как обычно и запустите его внутри logmemory:

$ gcc bigmalloc.c -o bigmalloc
$ ./logmemory -o mem.log ./bigmalloc
$ tail mem.log

Date: Mon Feb 11 21:26:01 2013
Cmd:  ./bigmalloc
VmPeak:   207604 kB
VmHWM:    205932 kB

который правильно сообщает о 200 МБ.

Как примечание: time (по крайней мере, в Ubuntu 12.04) неожиданно выдает значение, которое сильно отличается от того, что сообщает ядро:

$ /usr/bin/time --format %M ./bigmalloc
823872

где M (от man time):

M   Maximum resident set size of the process during its lifetime, in Kilobytes.

Как упомянуто выше, это приводит к цене, потому что logmemory замедляет выполнение отслеживаемой программы, например:

$ time ./logmemory -o mem.log ./bigmalloc
real    0m0.288s
user    0m0.000s
sys     0m0.004s
$ time ./bigmalloc
real    0m0.104s
user    0m0.008s
sys     0m0.092s

$ time find /var -name \*log
(...)
real    0m0.036s
user    0m0.000s
sys     0m0.032s
$ time ./logmemory -o mem.log find /var -name \*log
(...)
real    0m0.124s
user    0m0.000s
sys     0m0.052s

Другие подходы, которые я (безуспешно) попробовал, были:

  • Сценарий оболочки, который создает фоновый процесс для чтения /proc/<pid>/status во время работы mycmd .

  • Программа AC, которая разветвляет и mycmd но делает паузу, пока ребенок не станет зомби, поэтому избегает ptrace и накладных расходов, которые он создает. Хорошая идея, подумал я, к сожалению, VmHWM и VmPeak больше не доступны из /proc/<pid>/status для зомби.

2

Несмотря на то, что тема довольно старая, я хочу поделиться другим проектом, появившимся в ядре Linux cgroups.

https://github.com/gsauthof/cgmemtime:

cgmemtime измеряет интенсивное использование памяти RSS+CACHE для процесса и его дочерних процессов.

Чтобы иметь возможность сделать это, он помещает процесс в свою собственную группу.

Например, процесс A выделяет 10 МБ и разветвляет дочерний элемент B, который выделяет 20 МБ, и разветвляет дочерний элемент C, который выделяет 30 МБ. Все три процесса совместно используют временное окно, в котором их выделения приводят к соответствующему использованию памяти RSS (резидентного набора).

Теперь возникает вопрос: сколько памяти фактически используется в результате запуска A?

Ответ: 60 МиБ

cgmemtime - это инструмент для ответа на такие вопросы.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .