Re: instabilite de linux SMP ?

Top Page

Reply to this message
Author: guilde
Date:  
To: guilde
Subject: Re: instabilite de linux SMP ?

> * enfin, test du biproc en allégeant les contraintes bios (notamment pour
> les caches) puis en configuration normal. J'ai déjà vu un processeur
> planté sous linux avec un cache mal configuré. C'est idiot mais pas
> forcément évident à trouver.
>
> J'avais fait un petit programme pour itérer la compil du noyau linux un
> certain nombre de fois et rechercher si un petit signal 11 ne s'tait pas
> glissé dedans. Si cela t'intéresse, je te l'envoie...


> PS1: bien s'assurer que des trucs idiots fonctionnent, comme les
> ventilateurs des cpu sinon c'est la panne assurée dans un temps
> variable...
>
> PS2: as-tu essayé le SMP en 2.0.x ? Cela donne-t-il la même chose ?


Merci pour les sugestions. Mais ces choses la demandent beaucoup de
temps. Ce programme de calcul esst deja tres lourdes et la machine a
tenu le coup pendant quelaue jours. Mais peut etre parce que je n'ai
pas encore utiliser tous la memoire (top indique que toute la ram est
utilise mais j'imagine qu'une grande partie est pour les caches). Je
vais maintenant lancer plusieurs programmes en meme temps.

A propos du signal, j'ai effectivement vu une fois le message "check
signal" apres que j'ai tente de le demarer avec le bouton reset (ou
alimentation). Mais comment savoir si c'est le signal 11: la panne
survient quand je suis absent et l'ecran s'eteint au bout d'un
moment. J'ai donc un ecran noir avec une machine qui ne repond a rien !

Le ventillateur fonctionne au moment de panne. Mais curieusement, il
m'arrive que la machine ne redemare pas tout de suite (avec le message
check signal). Il finit par demarer apres un certain temps, comme
s'il a besoin de refroidir.

J'ai essaye 2.0.38 mais je dois l'abandonner car il cause de gros
probleme avec notre serveur NSF su Sun (et ce n'est pas lie au SMP).
Mais il est possible queles noyaux 2.2.x ont de problemes (et pour
cette raison que j'ai envoye ce message pour savoir d'autre personne
ont eu le meme problemes). J'ai entendu parler de "massive kernel
memory leak in certain networking situations" pour le 2.2.11 et
egalement "an unpleasant kernel memory leak bug" dans 2.2.12".
J'allais essaye de compiler 2.2.10.

-- 
PHAM Dinh Tuan                         | e-mail: Dinh-Tuan.Pham@???
Laboratoire de Modelisation et Calcul  | Tel: +33 4 76 51 44 23
BP 53, 38041 Grenoble cedex (France)   | Fax: +33 4 76 63 12 63
-----------------------------------------------------------------------