Author: Bruno Cudini Date: To: guilde Subject: Problème de mémoire
Salut la liste,
J'ai un problème avec un serveur qui kernel panic aléatoirement ou
presque. Il semblerait que ça arrive lorsque l'on accède à une certaine
zone mémoire, d'après les indications du /var/log/messages :
> [root@routeur ~]# grep 'addr:[0-9a-f]* vm_flags:[0-9a-f]* .* mapping:[0-9a-f]* index:[0-9a-f]*' /var/log/messages*
> Mar 22 13:14:49 routeur kernel: addr:00007f8411025000 vm_flags:08000070 anon_vma:(null) mapping:ffff880802ef71e0 index:68
> Mar 22 13:14:49 routeur kernel: addr:00007f8411095000 vm_flags:08000070 anon_vma:(null) mapping:ffff880802ef71e0 index:d8
> Mar 22 13:14:49 routeur kernel: addr:00007f84110e5000 vm_flags:08000070 anon_vma:(null) mapping:ffff880802ef71e0 index:128
> Mar 22 13:14:49 routeur kernel: addr:00007f8411195000 vm_flags:08000070 anon_vma:(null) mapping:ffff880802ef71e0 index:1d8
> Mar 22 13:15:54 routeur kernel: addr:00007f9a17565000 vm_flags:08000075 anon_vma:(null) mapping:ffff880802cacde0 index:ca
> Mar 23 03:14:45 routeur kernel: addr:00007fe97a705000 vm_flags:08000070 anon_vma:(null) mapping:ffff88080c7f09e0 index:101
J'ai d'abord pensé à une zone de RAM défectueuse, que je pensais
blacklister avec le paramètre de Grub GRUB_BADRAM. Comme je n'ai jamais
testé et que la machine est à Paris, je me demande s'il y a un moyen de
vérifier autrement avant de faire ce genre de tests. Et éventuellement,
s'il existe un moyen de faire le lien entre une adresse mémoire et la
barrette qui lui correspond (4 x 8 Go ici).
Après en regardant d'un peu plus près, je vois qu'il est question de
swap :
> Mar 22 13:14:49 routeur kernel: swap_free: Bad swap offset entry 2000000000000
> Mar 22 13:14:49 routeur kernel: BUG: Bad page map in process smbd pte:400000000000000 pmd:12d6e2067
> Mar 22 13:14:49 routeur kernel: addr:00007f8411025000 vm_flags:08000070 anon_vma:(null) mapping:ffff880802ef71e0 index:68
> Mar 22 13:14:49 routeur kernel: vma->vm_ops->fault: filemap_fault+0x0/0x500
> Mar 22 13:14:49 routeur kernel: vma->vm_file->f_op->mmap: ext4_file_mmap+0x0/0x60 [ext4]
> Mar 22 13:14:49 routeur kernel: Pid: 25804, comm: smbd Not tainted 2.6.32-279.14.1.el6.x86_64 #1
Est-ce que du coup, ce serait pas plutôt ma partition de swap qui
déconne ?