Re: Blocage système

Top Page

Reply to this message
Author: Moebius
Date:  
To: guilde
Subject: Re: Blocage système
Re,

Voilà ce que donne top :

top - 15:49:10 up 11 min,  1 user,  load average: 0,54, 0,50, 0,37
Tasks: 206 total,   2 running, 204 sleeping,   0 stopped,   0 zombie
%Cpu(s):  1,6 us,  0,6 sy,  0,0 ni, 97,7 id,  0,1 wa,  0,0 hi, 0,0 si, 
0,0 st
MiB Mem :   3939,7 total,   2245,0 free,    782,2 used,    912,4 buff/cache
MiB Swap:   4788,0 total,   4788,0 free,      0,0 used.   2876,9 avail Mem

    PID USER      PR  NI    VIRT    RES    SHR S  %CPU  %MEM TIME+ COMMAND
   1206 root      20   0  363772  93764  73344 S   4,0   2,3 0:53.01 Xorg
   1594 moebius   20   0  179288  72468  36992 S   3,3   1,8 0:30.61 compiz
   1990 moebius   20   0  502884  53432  41860 S   2,3   1,3 0:08.66
mate-te+
    880 root     -51   0       0      0      0 S   0,7   0,0 0:04.16
irq/33-+
    159 root      20   0       0      0      0 I   0,3   0,0 0:00.81
kworker+
   1999 moebius   20   0    9152   3744   3048 R   0,3   0,1 0:01.75 top
      1 root      20   0  167100  11392   8040 S   0,0   0,3 0:02.17
systemd

Un autre juste après :

top - 16:02:52 up 24 min,  1 user,  load average: 0,16, 0,26, 0,33
Tasks: 211 total,   1 running, 210 sleeping,   0 stopped,   0 zombie
%Cpu(s):  0,3 us,  0,3 sy,  0,0 ni, 94,9 id,  4,5 wa,  0,0 hi, 0,0 si, 
0,0 st
MiB Mem :   3939,7 total,    681,7 free,   1504,0 used,   1754,0 buff/cache
MiB Swap:   4788,0 total,   4788,0 free,      0,0 used.   2091,3 avail Mem


Le truc qui semble préoccupant est le 97,7 id dans la ligne cpu, non ?

La doc donne pour id :

id, idle    : time spent in the kernel idle handler

Mais je ne sais ce que cela veut dire...

Pour le journal, j'ai pris un peu avant de lancer la commande
[recharger] dans synaptic et un peu après, ça donne ça :

févr. 15 15:58:26 moebius-debian dbus-daemon[851]: [system] Successfully
activated service 'org.freedesktop.hostname1'
févr. 15 15:58:26 moebius-debian systemd[1]: Started Hostname Service.
févr. 15 15:58:56 moebius-debian systemd[1]: systemd-hostnamed.service:
Succeeded.
févr. 15 16:04:18 moebius-debian sudo[3348]: pam_unix(sudo:auth):
Couldn't open /etc/securetty: Aucun fichier ou dossier de ce type
févr. 15 16:04:20 moebius-debian sudo[3348]: pam_unix(sudo:auth):
Couldn't open /etc/securetty: Aucun fichier ou dossier de ce type
févr. 15 16:04:20 moebius-debian sudo[3348]:  moebius : TTY=pts/0 ;
PWD=/home/moebius ; USER=root ; COMMAND=/usr/bin/su
févr. 15 16:04:20 moebius-debian sudo[3348]: pam_unix(sudo:session):
session opened for user root by (uid=0)
févr. 15 16:04:20 moebius-debian su[3349]: (to root) moebius on pts/0
févr. 15 16:04:20 moebius-debian su[3349]: pam_unix(su:session): session
opened for user root by (uid=0)
févr. 15 16:05:02 moebius-debian dbus-daemon[851]: [system] Activating
via systemd: service name='org.freedesktop.PackageKit'
unit='packagekit.service' requested by ':1.186' (uid=0 pid=3540
comm="/usr/bin/gdbus call --system --dest org.freedeskto")
févr. 15 16:05:02 moebius-debian systemd[1]: Starting PackageKit Daemon...
févr. 15 16:05:02 moebius-debian PackageKit[3543]: daemon start
févr. 15 16:05:02 moebius-debian dbus-daemon[851]: [system] Successfully
activated service 'org.freedesktop.PackageKit'
févr. 15 16:05:02 moebius-debian systemd[1]: Started PackageKit Daemon.


voili voilou, merci pour tout


Le 15/02/2020 à 14:57, Olivier Allard-Jacquin a écrit :
>     Bonjour,

>
> Le 15/02/2020 à 13:16, Moebius a écrit :
>> Bonjour,
>>
>> Merci pour toutes ces informations.
>>
>> J'ai un peu essayé les commandes fournies mais je n'arrive pas à avoir
>> l'historique des processus...
>>
>> Pour gkrellm, si je prends comme exemple la chaîne à entrer pour le cpu
>> ( $T \r$s ), je la rentre dans le champ « chaîne de formatage des
>> étiquettes de graphique»  en cliquant sur [Intégrés]-> [CPU] ->
>> [Configuration] ; c'est bien ça ?
>     Tout à fait. Tu peux rentrer les autres paramètres que j'ai donné pour
> les autres capteurs. Celui sur le disque est, je pense, le plus
> important pour ton problème.

>
>> En tt cas, ça ne donne pas grand chose dans l'affichage de gkrellm qui a
>> d'ailleurs planté quand j'ai essayé de cliquer dans la fenêtre sur CPU !
>> :-)
>     Bizarre, je ne l'ai jamais vu planter, et pourtant il est tout le temps
> lancé sur mes machines !

>
>> Par ailleurs, top done des infos utiles mais comme il freeze aussi,
>> lorsqu'il se remet en route, il n'indique plus rien d'intéressant...
>     Ca c'est intéressant comme information. Un "top" qui freeze, c'est
> inhabituel. La piste d'un problème sur les IO se précisent.

>
>     Si tu as un smartphone, prend une photo du "top" lorsque le problème
> intervient, et envoie-le moi en message perso (la ML guilde empêche les
> attachements).

>
>     Extrait du "top" chez moi à l'heure actuelle, où mon CPU est en train
> de faire des calculs mathématiques (peu d'accès disques & réseaux):

>
>
>
> top - 14:21:02 up 1:11, 11 users, load average: 7,53, 7,69, 7,71
>
>     Le "load average" (ie: "charge moyenne"):
> - il indique le nombre de processus qui sont en attente devant le/les CPU(s)
> - un valeur inférieur à 1 veut dire le CPU est sous-chargé, et que
> lorsqu'un processus à besoin de temps de calcul, celui-ci lui est
> immédiatement donné. C'est typiquement le cas lorsque tu tapes un mail

>
> - une valeur supérieur à 1 indique veut qu'il y a plusieurs processus
> qui attentent que le CPU traitent leur demande (imagine une file
> d'attente à la boulangerie). Une charge trop importante, disons 2 à 3
> fois ton nombre de coeurs, va rendre inutilisable ta machine.
>
> - les 3 valeurs sont: valeur instantanée, moyenne sur 10s, moyenne sur
> 60s. Si la valeur moyenne sur 60s est importante, cela indique que ta
> machine est bien sollicitée sur le long terme.
>
> - dans mon cas, ma machine à 4 coeurs réels, donc elle supporte bien une
> charge de 4.
>
>
>
> Tasks: 230 total, 1 running, 229 sleeping, 0 stopped, 0 zombie
>
>     Ici, on voit qu'il n'y a qu'un seul processus qui tourne (en-dehors de
> "top". Les 229 autres sont en sommeil (pour quelques milli-secondes, ou
> plus longtemps).

>
>
>
> %Cpu(s): 47,3 us, 2,7 sy, 45,7 ni, 4,0 id, 0,0 wa, 0,0 hi, 0,2 si,
> 0,0 st
>
>     Là, c'est intéressant:
> - 47,3 us. Le "us", c'est pour "user". C'est le % CPU que prend les
> processus "normaux"

>
> - 2.7 sys: C'est le % CPU utilisé par le kernel lui-même, comme par
> exemple les drivers/modules (réseau, son, vidéo, etc ...), le
> scheduleur, etc ... Un valeur élevée (disons > 10%) est inhabituelle, et
> peut indiquer qu'un driver/module a planté, ce qui peut être assez
> grave. Et si c'est vraiment trop haut, alors la machine peut semblé
> "freezée"
>
> - 45,7 ni. C'est le % CPU utilisé par les processus qui sont en "nice"
> (ie: gentils). Ce sont des processus qui s'exécutent en basse priorité.
> Dans la file d'attente du kernel, ils se laissent passer devant.
> Dans mon cas, la motié du temps CPU est consommée par ce type de
> processus (des calculs mathématiques), ce qui fait que la machine reste
> fluide à utiliser. En effet, mon logiciel de mail est prioritaire par
> rapport à ces processus-là, donc le CPU traite immédiatement ses demandes.
>
> - 0,0 wa. "wait". C'est le % CPU perdu à attendre que les I/O répondent
> (le disque dur, le réseau, ...) . Lorsque la valeur est élevée, on s'en
> rend compte immédiatement, parce que la machine semble "lourde", c'est à
> dire que la souris bouge très lentement, les touches tapées mettent du
> temps à s'afficher, etc ... Je pense que chez toi, tu dois avoir un fort
> % de "wait"
>
>
> MiB Mem :   3939,1 total,    115,5 free,   2144,7 used,   1678,9 buff/cache

>
> MiB Swap:      0,0 total,      0,0 free,      0,0 used.   1400,2 avail Mem

>
>
>> Pour journalctl, j'ai du mal à interpréter les informations délivrées...
>     Après un ralentissement de thunderbird, fait un
> journalctl|gzip -9 > /tmp/journalctl.gz

>
> et envoie-moi le /tmp/journalctl.gz en message perso, en m'indiquant
> l'heure du problème.
>
>     Cordialement,
>                         Olivier