[RESOLU] Sme8 ne redémarre plus après systemrescueCD

Forum dédié à la distribution du même nom et que vous pourrez télécharger sur http://www.contribs.org. La nouvelle version de cette distribution se nomme SME Server. Une description est donnée sur le portail phénIXUS : http://www.ixus.net/sme-server/.

[RESOLU] Sme8 ne redémarre plus après systemrescueCD

Message par arnaud056 » 21 Mars 2012 18:34

Bonsoir,
Voulant apprendre à me servir de systemrescueCD pour intervenir sur mes 2 sme8, j’ai réussi à faire en sorte que les 2 ne puissent redémarrer ! 8-)
Etant persuadé de ne rien faire de mal, j’ai répété la manip’ effectuée d’abord sur la sme backup, également sur la sme de prod avant de m’apercevoir du problème…

Le contexte :
Sme de prod = « sme1 », sme8, raid1 logiciel en fonctionnement jusqu’à la manip’, dd#1 sata et dd#2 sata

Sme de backup = « sme2 », sme8, un seul dd_sata, raid0 ou raid1 dégradé ??, un dd_IDE, totalement ignoré par sme, dont je me sers pour le dualboot avec ubuntu.

La manip’ effectuée :

1)boot avec le systemrescueCD sur clé usb
2)gparted pour regarder – sortie sans rien avoir modifié
3)fdisk –l pour regarder et noter les partitions trouvées
4)montage / essai de montage des partions les unes après les autres, pour « voir » :
/dev/md126 se laisse monter --> petite visite --> c’est /boot
/dev/mapper/main-root se laisse monter --> petite visite --> c’est / complet, sauf /boot (normal !)
les autres sont non-montables (tout du m,oins directement)
5)aucune modification sur ou dans les partitions montées, simplement un coup d’oeil.
6)Démontages des 2 partitions pré-citées
7)Reboot

Voulant voir la différence entre ma sme2 et ma sme1 en raid 1 actif, j’ai donc fait la même chose sur cette dernière.

L’état actuel des choses :

- sme2 boote mais apparemment n’arrive pas à trouver les fichiers
Code : Tout sélectionner
apres
waiting for drivers initialization

blabla


setuproot: error mounting /proc: No such file or directory
setuproot: error mounting /sys: No such file or directory
Switching to new root and running init.
umounting old /dev
unmounting old /proc
unmounting old /sys
switchroot. mount failed: No such file or diectory
Kernel panic - no syncing: Attempted to kill init!


- sme1 ne boote pas : reste bloquée sur
Code : Tout sélectionner
GRUB Loading stage2..

Quand dans le boot-manager du bios je la fais booter sur l’autre dd, j’arrive à la même étape que sur la sme2

Et maintenant ?
étant donné que je n’ai fait que regarder, je n’arrive pas à cerner la raison de mon problème. Cependant, je ne pense pas avoir cassé grand-chose.
D’après ce que j’ai lu depuis : je pense / crois que le LVM est en cause.

J’ai fais quelques recherches google « sme no reboot after systemrescueCD » et ai imprimé un peu de doc sur le raid, le LVM et entre autre « recovering SME Server with lvm drives » du wiki ainsi qu’un coup d’œil sur le « newbie-kit SME 7.0 » qui était présent sur Ixus. Là, je suis également tombé sur un excellent topic http://forums.ixus.net/viewtopic.php?f=19&t=38045&start=15
ainsi que sur ce topic : http://forums.ixus.net/viewtopic.php?f=19&t=44376&start=15

Cependant, je n’ai plus touché les sme de crainte de m’enfoncer encore plus dans les problèmes --> c’est donc avec votre validation que je compte lancer les commandes.

Ne pouvant redémarrer, je suppose très fortement que ce problème ne pourra être résolu qu’à partir de systemrescueCD.
D’après ce que j’ai lu, le cd d’installation de sme pourrait également aider. Malheureusement c’est matériellement assez embêtant pour moi de connecter un lecteur sata sur les sme, mais faisable.

Afin de limiter la casse, j’aimerais « apprendre » à récupérer sme2 et ensuite une fois que le problème et sa solution seront connus, on pourra s’attaquer à sme1.

Ensuite viendrons mes questions sur le pourquoi…..

J’insiste sur l’objectif souhaité : remettre les sme en route et non accéder seulement aux données pour les recopier ailleurs. Pourquoi ? Parce que j’aimerais ne pas refaire les réglages et config’s, ne pas réinstaller affa et les diverses contribs qui sont dessus, ne pas perdre mon agenda de Horde etc…..
Ce n’est tout de même pas le prix à payer pour avoir fait un « mount » ?? :lol:

Pour info, en plus de ma sme_backup plantée, j’ai une sauvegarde affa aevc le paramètre « server sme : YES » sur le dd d’un de mes clients (sous ubuntu et….qui tourne, lui !) ;)

Merci de me guider sur ce par quoi je dois commencer.

@+
Arnaud
Dernière édition par arnaud056 le 22 Déc 2012 16:57, édité 2 fois.
Mieux vaut faire envie que pitié...
it's me
arnaud056
 
Message(s) : 98
Inscription : 04 Nov 2011 20:52
Localisation : Allemagne

Re: Sme8 ne redémarre plus après usage de systemrescueCD

Message par jdh » 21 Mars 2012 19:43

(Cf le film Fantasia, scène de l'apprenti-sorcier, musique de Paul Dukas ... C'est comme ça qu'on apprend ... )

Je présume que Grub est mort ... qu'il n'arrive pas à trouver le noyau, l'initrd (qui se trouve dans un volume LVM)

Le site de SystemRescueCD donne des pistes de réparation de grub. Cf http://www.sysresccd.org/Sysresccd-Part ... maged-Grub

La meilleure méthode AMHA est d'utiliser chroot :
- créer un point de montage,
- monter l'arborescence comme elle "devrait" (avec les mount -o bind qu'il faut),
- chroot dans le point de montage,
- (re)installer à partir de là le grub d'"origine"
L'intelligence artificielle n'est rien à côté de la stupidité naturelle.
jdh
 
Message(s) : 731
Inscription : 02 Nov 2011 00:36
Localisation : Nantes - Angers

Re: Sme8 ne redémarre plus après usage de systemrescueCD

Message par arnaud056 » 21 Mars 2012 21:43

merci bien grand sorcier de venir à ma rescousse! ;)
Suite à ton indication, j'ai effectué une recherche correspondante et suis tombé sur cet article Réparer ou installer Grub sur Sme qui reprend la démarche tu as donnée.
Je t'avoue qu'il va falloir que je regarde cela de plus près car j'ai assez vite décroché en ce qui concerne la compréhension de la méthode.
J'ai cependant remarqué "/proc" et "/dev"qui sont présents dans la procédure de démarrage juste avant l'arrivée du kernel panic.

Je viens de l'essayé sur ma sme_backup (1 seul dd), mais malheureusement sans succès: ça plante au même endroit. Pris par le temps, je ne peux recommencer ce soir... :o

@ suivre...
Arnaud
Mieux vaut faire envie que pitié...
it's me
arnaud056
 
Message(s) : 98
Inscription : 04 Nov 2011 20:52
Localisation : Allemagne

Re: Sme8 ne redémarre plus après usage de systemrescueCD

Message par jdh » 21 Mars 2012 22:23

(La musique de Dukas utilisée pour l'apprenti sorcier de Disney est superbe : jetez un oeil à Youtube ...)

Ce lien me parait assez intéressant mais il n'est peut-être pas (parfaitement) adapté selon la version.
Grub a évolué en Grub2 qui est, je suppose, par SME8.

Bon courage ...
L'intelligence artificielle n'est rien à côté de la stupidité naturelle.
jdh
 
Message(s) : 731
Inscription : 02 Nov 2011 00:36
Localisation : Nantes - Angers

Re: Sme8 ne redémarre plus après usage de systemrescueCD

Message par Franck78 » 22 Mars 2012 01:42

Hello,

si SME boote effectivement jusqu'au switchroot, grub(2) n'est pas en cause. Il a trouvé tout ce qu'il cherchait, y compris le initrd.

Seul problème, la ligne de commande du kernel contient un argument root=/dev/mdX ou root=/dev/hda4 ou n'importe ET ce device n'existe plus sous ce nom.


Pour changer ce nom, rien de plus simple, après le bios, quand tu as le choix entre les différents linux/memtest/windows enregistrés, 'e' pour editer la ligne de commande de l'OS que tu veux lancer.

Quoi mettre dedans ?
la je n'ai pas la réponse. Avec RescueCD je retournerais voir comment est nommé le RAID.

=>tes investiguations ici!

switchroot
========

grosso merdo, il est impossible de démarrer linux avec le véritable '/' du système. Il faut les bons pilotes, déchiffrer, faire du RAID, décompresser des images j'en passe et des meilleures.
Comme il faut néanmoins un '/' à linux, et bien il s'invente le sien !
Alors il continue la préparation, charge le initRD qui contient forcément les quelques pilotes nécessaires au montage du vrai '/'. Pilotes disque scsi/ide/sata et les filesystems ext4/raid/.... et un joyeux script qui lance tout ça.

Quand le vrai '/' est déclaré monté et prèt et tout et tout, et bien il n'y a plus qu'a faire un "switchroot" !
Ensuite c'est 'init' qui prend la suite.
Franck78
 
Message(s) : 525
Inscription : 11 Sep 2011 16:04
Localisation : France

Re: Sme8 ne redémarre plus après usage de systemrescueCD

Message par jdh » 22 Mars 2012 02:00

Avec Debian et LVM, on utilise la syntaxe root=/dev/mapper/(vg)-(lv)
ou vg est le volume group (voir le résultat de pvs) et lv est le logical volume (voir le résultat de lvs)
L'intelligence artificielle n'est rien à côté de la stupidité naturelle.
jdh
 
Message(s) : 731
Inscription : 02 Nov 2011 00:36
Localisation : Nantes - Angers

Re: Sme8 ne redémarre plus après usage de systemrescueCD

Message par arnaud056 » 22 Mars 2012 22:31

Bonsoir,
même si ça ne fait pas encore redémarrer les machines, je pense voir un peu plus clair.

Première partie du post:

J'ai donc hier soir appliqué la méthode de mon post précédent.
En voici les commentaires:

[b]Cat /proc/mdstat[/b] donne :
Code : Tout sélectionner
root@sysresccd /root % cat /proc/mdstat
Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10]
md126 : active raid1 sda1[0]
      104320 blocks [2/1] [U_]
     
md127 : active raid1 sda2[0]
      976655488 blocks [2/1] [U_]
     
unused devices: <none>
root@sysresccd /root %


[i]mkdir /mnt/sysimage
mount /dev/main/root /mnt/sysimage[/i]

très clair : on monte comme si c’était un dd usb

mount -o bind /dev /mnt/sysimage/dev
mount -o bind /proc /mnt/sysimage/proc

assez clair: on relie /dev et /proc du rescue_cd vers le répertoire où « sme » cad /dev/main/root (qu’est-ce en fait ? un volume logique ?) est monté. Donc si j’ai bien compris /dev/main/root/dev pointe sur le /dev du rescue_cd

pourquoi « seulement » pointer et non copier/écraser ?

dans la solution2 donnée par systemrescueCD (cf lien donné par jdh précédemment), il y a aussi un
mount –o bind /sys /point _de_montage/sys

Pourquoi pas ici ? Oubli ?

chroot /mnt/sysimage /bin/bash
la racine de la commande /bin/bash est /mnt/sysimage. En d’autres termes : on ouvre un terminal dont la racine est /mnt/sysimage cad /dev/main/root, cad la racine du sme

cat /proc/mdstat
résultat reste inchangé cf plus haut.

Question que j'aurais pu poser plus haut: pourquoi md126 et md127 alors que sous sme (avant le crash) cette commande renvoyait md1 et md2 ?

mount /dev/md126 /boot

on a donc monté (quoi en fait ? un volume raid ? ou un volume logique ?) ce que j’appellerai à tord la partition /boot de sme sur le point de montage /boot de la racine de la sme.
Je suis (du verbe suivre!) toujours mais suis néanmoins toujours en panne.. :lol:



Deuxième partie du post:


L'intervention de Franck78 a suscité beaucoup d'espoir en moi et de la réflexion.
Même si pour le moment elle n'a encore rien changé, elle m'a fait remarquer de nouvelles choses:

quand je modifie l'argument en "root=bla_bla" ma machine plante exactement de la même manière qu'avec l'argument d'origine: "root=/dev/main/root --> effectivement la machine semble ne pas trouver le répertoire root.
J'ai également vu que c'est "/dev/main/root" qui est indiqué par la méthode de réparation du grub (voir ~10ème ligne de ce post).

/dev/main/root n'est pas trouvé par sfdisk (sdb et sdc sont 2 clés usb --> aucun effet sur le problème) :
Code : Tout sélectionner
root@sysresccd /root % sfdisk -l

Disk /dev/sda: 121601 cylinders, 255 heads, 63 sectors/track
Units = cylinders of 8225280 bytes, blocks of 1024 bytes, counting from 0

   Device Boot Start     End   #cyls    #blocks   Id  System
/dev/sda1   *      0+     12      13-    104391   fd  Linux raid autodetect
/dev/sda2         13  121600  121588  976655610   fd  Linux raid autodetect
/dev/sda3          0       -       0          0    0  Empty
/dev/sda4          0       -       0          0    0  Empty

Disk /dev/sdb: 1012 cylinders, 33 heads, 61 sectors/track
Units = cylinders of 1030656 bytes, blocks of 1024 bytes, counting from 0

   Device Boot Start     End   #cyls    #blocks   Id  System
/dev/sdb1   *      0+   1011    1012-   1018547+   c  W95 FAT32 (LBA)
/dev/sdb2          0       -       0          0    0  Empty
/dev/sdb3          0       -       0          0    0  Empty
/dev/sdb4          0       -       0          0    0  Empty

Disk /dev/sdc: 1012 cylinders, 31 heads, 62 sectors/track
Units = cylinders of 984064 bytes, blocks of 1024 bytes, counting from 0

   Device Boot Start     End   #cyls    #blocks   Id  System
/dev/sdc1   *      0+   1011    1012-    972501    c  W95 FAT32 (LBA)
/dev/sdc2          0       -       0          0    0  Empty
/dev/sdc3          0       -       0          0    0  Empty
/dev/sdc4          0       -       0          0    0  Empty

Disk /dev/md127: 244163872 cylinders, 2 heads, 4 sectors/track

sfdisk: ERROR: sector 0 does not have an msdos signature
 /dev/md127: unrecognized partition table type
No partitions found

Disk /dev/md126: 26080 cylinders, 2 heads, 4 sectors/track

sfdisk: ERROR: sector 0 does not have an msdos signature
 /dev/md126: unrecognized partition table type
No partitions found

Disk /dev/mapper/main-root: 121073 cylinders, 255 heads, 63 sectors/track

sfdisk: ERROR: sector 0 does not have an msdos signature
 /dev/mapper/main-root: unrecognized partition table type
No partitions found

Disk /dev/mapper/main-swap: 514 cylinders, 255 heads, 63 sectors/track

sfdisk: ERROR: sector 0 does not have an msdos signature
 /dev/mapper/main-swap: unrecognized partition table type
No partitions found
root@sysresccd /root %


Par contre, /dev/main/root est montable et ..... c'est la partition root de la sme! La même que /dev/mapper/main-root !! le répertoire /boot y est vide (normal car ce n'est qu'un point de montage)

Voilá donc pourquoi "root=/dev/mapper/main-root" au boot n'a rien changé par rapport à l'origine, d'après moi.

pour info:
Code : Tout sélectionner
root@sysresccd /root % pvs
  PV         VG   Fmt  Attr PSize   PFree
  /dev/md127 main lvm2 a--  931.41g    0
root@sysresccd /root % vgs
  VG   #PV #LV #SN Attr   VSize   VFree
  main   1   2   0 wz--n- 931.41g    0
root@sysresccd /root % lvs
  LV   VG   Attr   LSize   Origin Snap%  Move Log Copy%  Convert
  root main -wi-a- 927.47g                                     
  swap main -wi-a-   3.94g             


Maintenant, cela devient intéressant: j'ai regardé encore d'un peu plus près les messages encore visibles avant que la machine plante: apparemment il y a un problème avec le VG "main"
Code : Tout sélectionner
md: ...autorun DONE
Scanning logical volumes
Reading all physical volumes. This may take a while...
No volume groups found
Activating logical volumes
Volume group "main" not found
Trying to resume from /dev/main/swap
Unable to access resume device (/dev/main/swap)
...
quelques lignes plus loin c#est le kernel panic.

s'il ne trouve pas /dev/main/swap, il parrait assez logique que /dev/main/root ne soit pas trouvé non plus. Est-ce que je me trompe?
Je pense de ce fait avoir trouvé ce qui cloche.


Au passager: est-il possible d'obtenir un listing des messages de boot quand le démarrage échoue? ca défile tellement vite á l'écran ... :evil:
ça permettrait de pouvoir tout regarder tranquillement et de ne rien omettre.

J'espère ne pas vous assommer avec tous mes commentaires, questions, retours de commandes etc.......

Merci pour votre soutien.
@+
Arnaud
Mieux vaut faire envie que pitié...
it's me
arnaud056
 
Message(s) : 98
Inscription : 04 Nov 2011 20:52
Localisation : Allemagne

Re: Sme8 ne redémarre plus après usage de systemrescueCD

Message par jibe » 22 Mars 2012 22:56

Salut,

Un peu épuisé ce soir, j'avoue n'avoir pas tout bien suivi :oops:

Je me contenterai donc de deux suggestions :
1 - Il y a été fait allusion : il faut faire attention aux versions de grup (non seulement grub legacy/grub2, mais même - tout au moins avec legacy) au numéro de version : j'ai eu - toujours avec legacy) des problèmes pour réinstaller grub, au point que je le fais maintenant systématiquement via un chroot et le grub du système à réparer, pas celui de SystemRescueCD. Attention aussi aux versions de noyau : on a parfois des incompatibilités en essayant de réparer un linux récent avec un vieux SystemRescueCD ou un vieux linux avec un SystemRescueCD récent.

2 - Je ne sais plus si ça existe encore : avant, on pouvait relancer l'installation de SME : si anaconda voyait que l'install avait déjà été faite, il passait en mode réparation et réinstallait tout mais en gardant toutes les données et configurations. Il me semble qu'il n'y a pas assez longtemps que je m'en suis servi la dernière fois pour que ce soit sur SME 6.x, et donc ça devrait encore exister au moins pour les premières versions 7.x... J'espère qu'ils ont gardé ça dans la 8 : ça m'a sorti facilement et rapidement de la m*** deux ou trois fois !
jibe. En vert ou en rouge-orangé : je modère - En noir ou autre couleur : je parle à titre personnel.

L'idée que quand on n'a pas quelque chose, on puisse se bouger pour l'avoir, c'est une démarche qui parait absolument normale pour les gens du Logiciel Libre et totalement surnaturelle pour tout le reste de la population. (Benjamin Bayart)
jibe
 
Message(s) : 943
Inscription : 09 Sep 2011 23:19
Localisation : Haute Savoie

Re: Sme8 ne redémarre plus après usage de systemrescueCD

Message par jdh » 22 Mars 2012 23:50

Question que j'aurais pu poser plus haut: pourquoi md126 et md127 alors que sous sme (avant le crash) cette commande renvoyait md1 et md2 ?

Cela m'a aussi sauté au yeux ! Je n'aime pas ce changement de nom de device mdadm ! Je sens cela mal comme ça.

Il n'y a pas d'info sur la config disque : il n'y a qu'un disque ?
Réponse : sda est un disque d'1 tera, que sont sdb et sdc ? => débrancher ces clés

NB : disposer rapidement d'un disque d'1T pour sauvegarder me parait une bonne idée ...


mount /dev/md126 /boot

Cela semble logique pourtant : /dev/md126 (devrait être /dev/md0) est une partition de faible taille, c'est vraisemblablement /boot.

il y a un problème avec le VG "main"

Contradiction : pvs et lvs voit très bien le volume group et les 2 volumes logiques !


Mon point de vue : SystemRescue a changé les noms de devices MDADM et cela pertube largement le redémarrage.
Ce type de situation m'est arrivé lors de la création d'une machine perso : j'ai réinstallé : j'avais très peu de données.

Il est peut-être possible de s'en sortir en utilisant un deuxième disque de type/capacité identique.
(D'ailleurs, en milieu pro, je recommande toujours 2 disques et un miroir soft pour une petite config.)

- install disque 2 en position sda et débranchement disque 1,
- install sme en mode defaut (donc sur disque 2),
- vérif en lançant Systemrescue CD que cela ne perturbe pas,
- branchement disque 1 en position sdb,
- lancement SystemRescue CD,
- création de 2 arbo /mnt/sda et /mnt/sdb + montage comme il faut : point délicat car il faut identifier !!
- copie des arborescence sdb -> sda (avec commande genre "cd (sdb); tar cf - ./* | tar xvf - -C (sda)" )

Mais c'est un peu la cata ...
L'intelligence artificielle n'est rien à côté de la stupidité naturelle.
jdh
 
Message(s) : 731
Inscription : 02 Nov 2011 00:36
Localisation : Nantes - Angers

Re: Sme8 ne redémarre plus après usage de systemrescueCD

Message par Franck78 » 23 Mars 2012 00:37

Sur une debian/ubuntu, il y a un parametre nommé BOOT_DEGRADED(=true/false)
dans "/etc/initramfs-tools/conf.d/mdadm"

Il est a faux par défaut, pour protéger d'un 'array' qui serait en panne.

Cette variable est utilisée dans le scriptouille du 'initram_fs' (ex initrd), dans les réglages de LVM.
Pas de MDx propre, pas de LVM !


Ca doit exister chez fedora/sme aussi.

sda1+sdb1 => md127 => lvm

Le changement de nom de md1 vers md126 à l'air assez courant. Ca doit aussi troubler lvm.
google:volume group metadata md126 md1

Fixe d'abord ton RAID !!
Franck78
 
Message(s) : 525
Inscription : 11 Sep 2011 16:04
Localisation : France

Suivant

Retour vers SME

Qui est en ligne ?

Utilisateur(s) parcourant ce forum : Aucun utilisateur inscrit et 1 invité

cron