Re: Blocage système

Top Page

Reply to this message
Author: Olivier Allard-Jacquin
Date:  
To: guilde
Subject: Re: Blocage système
    Bonjour,

Le 15/02/2020 à 13:16, Moebius a écrit :
> Bonjour,
>
> Merci pour toutes ces informations.
>
> J'ai un peu essayé les commandes fournies mais je n'arrive pas à avoir
> l'historique des processus...
>
> Pour gkrellm, si je prends comme exemple la chaîne à entrer pour le cpu
> ( $T \r$s ), je la rentre dans le champ « chaîne de formatage des
> étiquettes de graphique»  en cliquant sur [Intégrés]-> [CPU] ->
> [Configuration] ; c'est bien ça ?


    Tout à fait. Tu peux rentrer les autres paramètres que j'ai donné pour
les autres capteurs. Celui sur le disque est, je pense, le plus
important pour ton problème.


> En tt cas, ça ne donne pas grand chose dans l'affichage de gkrellm qui a
> d'ailleurs planté quand j'ai essayé de cliquer dans la fenêtre sur CPU !
> :-)


    Bizarre, je ne l'ai jamais vu planter, et pourtant il est tout le temps
lancé sur mes machines !


> Par ailleurs, top done des infos utiles mais comme il freeze aussi,
> lorsqu'il se remet en route, il n'indique plus rien d'intéressant...


    Ca c'est intéressant comme information. Un "top" qui freeze, c'est
inhabituel. La piste d'un problème sur les IO se précisent.


    Si tu as un smartphone, prend une photo du "top" lorsque le problème
intervient, et envoie-le moi en message perso (la ML guilde empêche les
attachements).


    Extrait du "top" chez moi à l'heure actuelle, où mon CPU est en train
de faire des calculs mathématiques (peu d'accès disques & réseaux):




top - 14:21:02 up 1:11, 11 users, load average: 7,53, 7,69, 7,71

    Le "load average" (ie: "charge moyenne"):
- il indique le nombre de processus qui sont en attente devant le/les CPU(s)
- un valeur inférieur à 1 veut dire le CPU est sous-chargé, et que
lorsqu'un processus à besoin de temps de calcul, celui-ci lui est
immédiatement donné. C'est typiquement le cas lorsque tu tapes un mail


- une valeur supérieur à 1 indique veut qu'il y a plusieurs processus
qui attentent que le CPU traitent leur demande (imagine une file
d'attente à la boulangerie). Une charge trop importante, disons 2 à 3
fois ton nombre de coeurs, va rendre inutilisable ta machine.

- les 3 valeurs sont: valeur instantanée, moyenne sur 10s, moyenne sur
60s. Si la valeur moyenne sur 60s est importante, cela indique que ta
machine est bien sollicitée sur le long terme.

- dans mon cas, ma machine à 4 coeurs réels, donc elle supporte bien une
charge de 4.



Tasks: 230 total, 1 running, 229 sleeping, 0 stopped, 0 zombie

    Ici, on voit qu'il n'y a qu'un seul processus qui tourne (en-dehors de
"top". Les 229 autres sont en sommeil (pour quelques milli-secondes, ou
plus longtemps).




%Cpu(s): 47,3 us, 2,7 sy, 45,7 ni, 4,0 id, 0,0 wa, 0,0 hi, 0,2 si,
0,0 st

    Là, c'est intéressant:
- 47,3 us. Le "us", c'est pour "user". C'est le % CPU que prend les
processus "normaux"


- 2.7 sys: C'est le % CPU utilisé par le kernel lui-même, comme par
exemple les drivers/modules (réseau, son, vidéo, etc ...), le
scheduleur, etc ... Un valeur élevée (disons > 10%) est inhabituelle, et
peut indiquer qu'un driver/module a planté, ce qui peut être assez
grave. Et si c'est vraiment trop haut, alors la machine peut semblé
"freezée"

- 45,7 ni. C'est le % CPU utilisé par les processus qui sont en "nice"
(ie: gentils). Ce sont des processus qui s'exécutent en basse priorité.
Dans la file d'attente du kernel, ils se laissent passer devant.
Dans mon cas, la motié du temps CPU est consommée par ce type de
processus (des calculs mathématiques), ce qui fait que la machine reste
fluide à utiliser. En effet, mon logiciel de mail est prioritaire par
rapport à ces processus-là, donc le CPU traite immédiatement ses demandes.

- 0,0 wa. "wait". C'est le % CPU perdu à attendre que les I/O répondent
(le disque dur, le réseau, ...) . Lorsque la valeur est élevée, on s'en
rend compte immédiatement, parce que la machine semble "lourde", c'est à
dire que la souris bouge très lentement, les touches tapées mettent du
temps à s'afficher, etc ... Je pense que chez toi, tu dois avoir un fort
% de "wait"


MiB Mem :   3939,1 total,    115,5 free,   2144,7 used,   1678,9 buff/cache


MiB Swap:      0,0 total,      0,0 free,      0,0 used.   1400,2 avail Mem



> Pour journalctl, j'ai du mal à interpréter les informations délivrées...


    Après un ralentissement de thunderbird, fait un
journalctl|gzip -9 > /tmp/journalctl.gz


et envoie-moi le /tmp/journalctl.gz en message perso, en m'indiquant
l'heure du problème.

    Cordialement,
                        Olivier
-- 
~~~~~~~  _____/\_____  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Phoenix /   _ \/ _   \    Olivier Allard-Jacquin
       /   / \  / \   \   Web:  http://olivieraj.free.fr/
      /___/  /  \  \___\  Mail: olivieraj@???
~~~~ /////  ///\\\  \\\\\ ~~~~~~~~~~~~~~~~~~~~~~~ Linux Powered !!