Author: Fernando Date: To: guilde Subject: Re: Mystère sur connexion SSH interactive muette
Bonjour,
Le 27/02/2012 09:18, Olivier Desportes a écrit : > Bonjour la Guilde
>
> Mon problème :
>
> Soit serveur Debian 6.0.3 sur lequel je veux me connecter en SSH
> interactif.
> …
> et sitôt le prompt de mon utilisateur obtenu sur le
> serveur, plus aucune interaction avec le shell ne devient possible.
> Plus exactement, dans le meilleur des cas, j'ai le temps de taper un
> ou deux caractères si je suis très rapide, avant que l'interactivité
> ne cesse.
> En SFTP, pas de problème, je copie tout ce que je veux dans les deux sens.
> En SSH, en envoi de commande direct du type "user@???
> commande_shell" ça marche également.
> …
J'ai eu un problème similaire sur une Dedibox DC : "sftp" et "ssh commande" fonctionnent, mais impossible d'avoir un shell interactif, "ssh tout court".
Il y avait des infos en lançant la commande dmesg sur le serveur. Dont les infos indiquaient un plantage d'un lvcreate puis, plus tard, un plantage de ssh qui me semble lié aux tty (et qui n'étaient pas dans /var/log/dmesg*).
> Je rechecke les processus SSH : rien n'a changé ! notez le 30707 et
> 30760 qui perdurent même après un restart du service, ou un reboot de
> la machine...
> … C'est la première fois que j'entends un PID qui reste inchangé suite à un reboot, on en apprend tous les jours.
> Bref Je n'y comprend rien, help :s
Je n'ai pas compris non plus.
Je n'ai pas sauvegardé la sortie dmesg, mais je retrouve "l'erreur ssh qui me semble liée aux tty" dans /var/log/kern.log.1:
Feb 21 00:31:58 marilyn kernel: [11459786.047879] ------------[ cut here ]------------
Feb 21 00:31:58 marilyn kernel: [11459786.047891] WARNING: at /build/buildd-linux-2.6_2.6.32-38-amd64-bk66e4/linux-2.6-2.6.32/debian/build/source_amd64_none/drivers/char/tty_ldisc.c:738 tty_ldisc_reinit+0x46/0x7b()
Feb 21 00:31:58 marilyn kernel: [11459786.047897] Hardware name: PowerEdge R210
Feb 21 00:31:58 marilyn kernel: [11459786.047899] Modules linked in: tun ip6table_filter ip6_tables ebtable_nat ebtables kvm_intel kvm xt_tcpudp nf_conntrack_ipv4 nf_defrag_ipv4 xt_state nf_conntrack iptable_filter ip_tables x_tables bridge stp snd_pcm snd_timer snd soundcore snd_page_alloc joydev pcspkr evdev dcdbas power_meter button processor ext4 mbcache jbd2 crc16 dm_mod raid10 raid456 async_raid6_recov async_pq raid6_pq async_xor xor async_memcpy async_tx raid1 raid0 multipath linear md_mod sd_mod crc_t10dif usbhid hid ahci mpt2sas libata ehci_hcd scsi_transport_sas bnx2 usbcore scsi_mod nls_base thermal thermal_sys [last unloaded: scsi_wait_scan]
Feb 21 00:31:58 marilyn kernel: [11459786.047951] Pid: 19302, comm: sshd Not tainted 2.6.32-5-amd64 #1
Feb 21 00:31:58 marilyn kernel: [11459786.047953] Call Trace:
Feb 21 00:31:58 marilyn kernel: [11459786.047956] [<ffffffff811ff00e>] ? tty_ldisc_reinit+0x46/0x7b
Feb 21 00:31:58 marilyn kernel: [11459786.047959] [<ffffffff811ff00e>] ? tty_ldisc_reinit+0x46/0x7b
Feb 21 00:31:58 marilyn kernel: [11459786.047962] [<ffffffff8104df9c>] ? warn_slowpath_common+0x77/0xa3
Feb 21 00:31:58 marilyn kernel: [11459786.047965] [<ffffffff811ff00e>] ? tty_ldisc_reinit+0x46/0x7b
Feb 21 00:31:58 marilyn kernel: [11459786.047967] [<ffffffff811ff157>] ? tty_ldisc_hangup+0x114/0x1a7
Feb 21 00:31:58 marilyn kernel: [11459786.047969] [<ffffffff811f8d12>] ? do_tty_hangup+0xfb/0x326
Feb 21 00:31:58 marilyn kernel: [11459786.047972] [<ffffffff811fa726>] ? tty_release_dev+0x1b5/0x4b9
Feb 21 00:31:58 marilyn kernel: [11459786.047975] [<ffffffff812470bc>] ? skb_dequeue+0x50/0x58
Feb 21 00:31:58 marilyn kernel: [11459786.047977] [<ffffffff811faa3b>] ? tty_release+0x11/0x1a
Feb 21 00:31:58 marilyn kernel: [11459786.047980] [<ffffffff810efe1d>] ? __fput+0x100/0x1af
Feb 21 00:31:58 marilyn kernel: [11459786.047983] [<ffffffff810ed282>] ? filp_close+0x5b/0x62
Feb 21 00:31:58 marilyn kernel: [11459786.047986] [<ffffffff8104faa0>] ? put_files_struct+0x64/0xc1
Feb 21 00:31:58 marilyn kernel: [11459786.047988] [<ffffffff81051365>] ? do_exit+0x236/0x6c6
Feb 21 00:31:58 marilyn kernel: [11459786.047990] [<ffffffff810edc6a>] ? sys_fchmodat+0xa8/0xb6
Feb 21 00:31:58 marilyn kernel: [11459786.047992] [<ffffffff8105186b>] ? do_group_exit+0x76/0x9d
Feb 21 00:31:58 marilyn kernel: [11459786.047995] [<ffffffff810518a4>] ? sys_exit_group+0x12/0x16
Feb 21 00:31:58 marilyn kernel: [11459786.047997] [<ffffffff81010b42>] ? system_call_fastpath+0x16/0x1b
Feb 21 00:31:58 marilyn kernel: [11459786.047999] ---[ end trace 820a5ee5280527a8 ]---
J'en avais déduis que le noyau était dans les choux et qu'il fallait donc rebooter la machine.
Comme il y avait eu le même genre de messages pour le lvcreate, j'ai utilisé l'interface de gestion pour arrêter la machine et lancer des tests de vérification matérielle. Les tests n'ont rien donné, mais ils étaient assez lent sur la RAM (censée faire 8Go) et super rapides sur le disque (censé faire 1To). O_o
Là, la machine a un uptime de 4 jours (ce que je viens de vérifier par un ssh interactif: donc "jusqu'ici, tout va bien")…
>
> Merci de votre aide !
> Est-ce que tu as le même type d'erreurs en lançant la commande dmesg ?
Est-ce que quelqu'un comprends cette erreur ?
J'ai cherché une bonne demi-journée sur le net, j'ai vu des rapport de boggues et des corrections noyaux, mais trop d'infos sur ce qu'il se passe ni s'il est possible de s'en sortir *sans* reboot.