Re: Problème load average Debian

Page principale

Répondre à ce message
Auteur: piti
Date:  
À: guilde
Sujet: Re: Problème load average Debian
Bonjour,
On Fri, Jul 26, 2019 at 10:59:27AM +0200, Hugues Levasseur wrote:
> J'ai un mystère ... bien mystérieux* sur un serveur Debian.
>
> Si quelqu'un à une idée pour m'aider à comprendre le problème : je
> suis preneur.
> ---8<----
> Jul 25 03:02:09 b smartd[516]: Device: /dev/sdb [SAT], SMART Usage
> Attribute: 190 Airflow_Temperature_Cel changed from 62 to 63


Premier truc qui me fait réagir: le disque est vraiment passé à 63°c ?
C'est
vraiment baucoup pour un disque (rotatif), et une piste.

> Jul 25 03:02:39 b kernel: [39630.364987] apache2         D    0  2479
> 1 0x00000004


Ça dit que apache est en "uninterruptable sleep", si c'est pas
systématique, c'est souvent lié à un disque qui répond plus (pas assez
vite) Les calltrace qui suivent disent la même chose

> Jul 25 03:02:39 b kernel: [39630.364994]  ffff8f1034866800
> ffff8f1034866800 ffff8f1055698080 ffff8f105f218980
> Jul 25 03:02:39 b kernel: [39630.365002]  ffff8f1034b96000
> ffffacfcc3acfd58 ffffffffa8615aa9 0000000000018980
> Jul 25 03:02:39 b kernel: [39630.365008]  00000001c0730155
> ffff8f105f218980 ffff8f10558650d0 ffff8f1055698080
> Jul 25 03:02:39 b kernel: [39630.365015] Call Trace:
> Jul 25 03:02:39 b kernel: [39630.365031]  [<ffffffffa8615aa9>] ?
> __schedule+0x239/0x6f0
> Jul 25 03:02:39 b kernel: [39630.365038]  [<ffffffffa8615f92>] ?
> schedule+0x32/0x80
> Jul 25 03:02:39 b kernel: [39630.365053]  [<ffffffffc07307ea>] ?
> request_wait_answer+0xba/0x1f0 [fuse]
> Jul 25 03:02:39 b kernel: [39630.365061]  [<ffffffffa80bd740>] ?
> prepare_to_wait_event+0xf0/0xf0
> Jul 25 03:02:39 b kernel: [39630.365069]  [<ffffffffc0730998>] ?
> __fuse_request_send+0x78/0x80 [fuse]
> Jul 25 03:02:39 b kernel: [39630.365078]  [<ffffffffc0733d2d>] ?
> fuse_simple_request+0xbd/0x190 [fuse]
> Jul 25 03:02:39 b kernel: [39630.365087]  [<ffffffffc0739ed7>] ?
> fuse_setlk+0x177/0x190 [fuse]
> Jul 25 03:02:39 b kernel: [39630.365097]  [<ffffffffa826434a>] ?
> SyS_flock+0x11a/0x1a0
> Jul 25 03:02:39 b kernel: [39630.365104]  [<ffffffffa8003b7d>] ?
> do_syscall_64+0x8d/0x100
> Jul 25 03:02:39 b kernel: [39630.365111]  [<ffffffffa861a88e>] ?
> entry_SYSCALL_64_after_swapgs+0x58/0xc6
> Jul 25 03:02:39 b kernel: [39630.365116] INFO: task apache2:2504
> blocked for more than 120 seconds.
> Jul 25 03:02:39 b kernel: [39630.365178]       Not tainted
> 4.9.0-9-amd64 #1 Debian 4.9.168-1+deb9u2
> Jul 25 03:02:39 b kernel: [39630.365237] "echo 0 >
> /proc/sys/kernel/hung_task_timeout_secs" disables this message.


J'irais voir du coté des disques, et si c'ets bien ça je demanderai un
remplacement.

PS. vu la vague de chaleur, on peut s'imaginer que refroidir tous ces
fours est un peu compliqué...

--
piti