Re: instabilite de linux SMP ?

Top Page

Reply to this message
Author: guilde
Date:  
To: guilde
Subject: Re: instabilite de linux SMP ?

>     La question que je me pose: es ce un probleme de linux ou ou
> probleme materiel ? J'ai passe a 2.2.11 sans grand resultat (le
> dernier plantage survient apres 5 jours, un petit progres mais ce peut
> venir du hasard). Je tourne maintenant sous 2.0.38 et si le probleme
> persite, je serai enclin a blamer mon revendeur. Mais il faut des
> preuve que le nouveau processeur et/ou la memmoire sont en cause. Avez  
> vous des conseils a me donner ? Avez vous de l'experience du PC bi-proc


> sous linux ? serait-il aussi stable qu'en mono-proc ?). Et si le
> probleme est d'origin materiel, comment le verifier (et prouver) ?
>


Si tu penses que cela peut venir de ton nouveau processeur, c'est facile
à prouver: il suffit de n'utiliser que celui-là et de relancer ton calcul
sur ton (nouveau) monoprocesseur....

Personnellement, je ferai:

* test des barettes: en monoprocesseur (ou sur une autre bécane), je
testerai chaque barette (une compile de noyau est super pour le test mais
bien vérifier que cela utilise toute la mémoire; ne pas hésiter à
multiplier les compilations simultanées de façon à bien remplir la
mémoire.) Et surtout itérer l'opération de façon à que cela fonctionne au
moins 10 fois de suite... avec un 450 Mhz, ce n'est rien du tout.
Personnellement, je l'ai fait 100 fois avec un pentium 100 pour le tester
;-)

* test de chaque proc en monoproc: test de charge et d'endurance.

* test de chaque proc sur la carte bipro à tous les endroits (si
possibilité d'inverser les procs en monopro).

* enfin, test du biproc en allégeant les contraintes bios (notamment pour
les caches) puis en configuration normal. J'ai déjà vu un processeur
planté sous linux avec un cache mal configuré. C'est idiot mais pas
forcément évident à trouver.

J'avais fait un petit programme pour itérer la compil du noyau linux un
certain nombre de fois et rechercher si un petit signal 11 ne s'tait pas
glissé dedans. Si cela t'intéresse, je te l'envoie...

Bon courage.

Linuxement

PK

PS1: bien s'assurer que des trucs idiots fonctionnent, comme les
ventilateurs des cpu sinon c'est la panne assurée dans un temps
variable...

PS2: as-tu essayé le SMP en 2.0.x ? Cela donne-t-il la même chose ?