Bonjour,
J'ai un problème hardware sur une machine assez récente (~2020-2021):
https://www.supermicro.com/manuals/motherboard/EPYC7000/MNL-2314.pdf
La machine a tres bien fonctionnée pendant 2 avant que je complete la memoire de la machine, passant de 64 à 128G.
Il y a quelques temps, deux ports USB3 sont morts (fumée bleue) sans explications ... je ne sais pas si c'est relié au reste.
Plus récemment la machine reboote en sans prévenir. Ce matin je n'arrivais plus à me logguer tellement elle reboote souvent.
J'ai débranché tous les perif USB non utilisés sans succes.
J'ai débranché les GPU non utilisés sans succes (alim trop faible ?)
J'ai fait passé un teste memoire et entre 124 et 128G il y a des octets defectueux, et ce bien que la RAM soit ECC.
Actuellement, le PC fonctionne avec 120G de RAM, visiblement ca aide puisque j'arrive a vous écrire.
Possible que la nouvelle RAM soit en tord.
Par contre comment reconnaitre la barrette qui est fautive ?
Toutes les barrettes sont de la même marque et de la même reference. 4 d'entre elles ont été fabriquées en 2020 et 4 autres en 2022.
Je soupçonne la fautive d'être dans les plus recentes, probablement celles dont le numero de serie commence en 43DF... mais laquelle ?
Avec vous une idée ? Merci de vos lumières.
Jérôme
Voici un extrait de lshw:
description: Mémoire Système
identifiant matériel: 28
emplacement: Carte mère
taille: 128GiB
capacité: 2TiB
fonctionnalités: ecc
configuration: errordetection=multi-bit-ecc
*-bank:0
description: DIMM DDR4 Synchrone Registered (Buffered) 3200 MHz (0,3 ns)
produit: M393A2K40DB3-CWE
fabriquant: Samsung
identifiant matériel: 0
numéro de série: 43DFA2A2
emplacement: DIMMA1
taille: 16GiB
bits: 64 bits
horloge: 3200MHz (0.3ns)
*-bank:1
description: DIMM DDR4 Synchrone Registered (Buffered) 3200 MHz (0,3 ns)
produit: M393A2K40DB3-CWE
fabriquant: Samsung
identifiant matériel: 1
numéro de série: 43DFAD40
emplacement: DIMMB1
taille: 16GiB
bits: 64 bits
horloge: 3200MHz (0.3ns)
*-bank:2
description: DIMM DDR4 Synchrone Registered (Buffered) 3200 MHz (0,3 ns)
produit: M393A2K40DB3-CWE
fabriquant: Samsung
identifiant matériel: 2
numéro de série: 16558B87
emplacement: DIMMC1
taille: 16GiB
bits: 64 bits
horloge: 3200MHz (0.3ns)
*-bank:3
description: DIMM DDR4 Synchrone Registered (Buffered) 3200 MHz (0,3 ns)
produit: M393A2K40DB3-CWE
fabriquant: Samsung
identifiant matériel: 3
numéro de série: 16558D8C
emplacement: DIMMD1
taille: 16GiB
bits: 64 bits
horloge: 3200MHz (0.3ns)
*-bank:4
description: DIMM DDR4 Synchrone Registered (Buffered) 3200 MHz (0,3 ns)
produit: M393A2K40DB3-CWE
fabriquant: Samsung
identifiant matériel: 4
numéro de série: 43DFAD3B
emplacement: DIMME1
taille: 16GiB
bits: 64 bits
horloge: 3200MHz (0.3ns)
*-bank:5
description: DIMM DDR4 Synchrone Registered (Buffered) 3200 MHz (0,3 ns)
produit: M393A2K40DB3-CWE
fabriquant: Samsung
identifiant matériel: 5
numéro de série: 43DFA081
emplacement: DIMMF1
taille: 16GiB
bits: 64 bits
horloge: 3200MHz (0.3ns)
*-bank:6
description: DIMM DDR4 Synchrone Registered (Buffered) 3200 MHz (0,3 ns)
produit: M393A2K40DB3-CWE
fabriquant: Samsung
identifiant matériel: 6
numéro de série: 16558D8A
emplacement: DIMMG1
taille: 16GiB
bits: 64 bits
horloge: 3200MHz (0.3ns)
*-bank:7
description: DIMM DDR4 Synchrone Registered (Buffered) 3200 MHz (0,3 ns)
produit: M393A2K40DB3-CWE
fabriquant: Samsung
identifiant matériel: 7
numéro de série: 165585DF
emplacement: DIMMH1
taille: 16GiB
bits: 64 bits
horloge: 3200MHz (0.3ns)