PANNE : Kernel Panic - attempting to kill unit

Forum dédié à la distribution du même nom et que vous pourrez télécharger sur http://www.contribs.org. La nouvelle version de cette distribution se nomme SME Server. Une description est donnée sur le portail phénIXUS : http://www.ixus.net/sme-server/.

Re: PANNE : Kernel Panic - attempting to kill unit

Message par jibe » 25 Août 2012 22:55

Salut,

C'est vrai qu'il y a quelques précisions ajoutées que je n'avais pas vues (raison pour laquelle je demandais de bien spécifier les ajouts/corrections par exemple par une pseudo-balise [EDIT]). On est encore loin du compte cependant...

Ce que je souhaite savoir de plus ? Au moins ce que j'ai déjà demandé !

Désolé, mais j'ai déjà insisté sur le fait que la récupération de données demandait beaucoup de rigueur. Si mes questions sont ignorées, qu'en sera-t-il des manips à effectuer ? Une seule qui manque ou qui est mal exécutée, et on risque d’annihiler toute chance de récupérer quoi que ce soit !

Il est donc capital :
  1. Que ton neveu et toi compreniez bien l'enjeu et la manière de s'y prendre. On ne pleure pas, on ne prend pas de cachets, on prend simplement les moyens de comprendre les choses et d'agir avec rigueur et méthode, en ayant bien conscience qu'il y aura certainement pas mal d'investissement personnel pour tout bien comprendre. Il n'y a rien de très compliqué, mais aucun droit à l'erreur, donc en aucun cas le problème pourra se résoudre par des formules magiques appliquées sans comprendre (je crains que ça ait été le cas pour le double raid).
  2. Que je comprenne parfaitement
    1. Par qui, comment et pourquoi ont été montés les deux raids,
    2. L'organisation précise et claire des disques et partitions, arrays raid, volumes logiques etc. Hormis sdd, je vois que les disques ont tous des partitions dans les deux grappes raid ? :shock:
    3. Les différents points de montage, plus particulièrement en ce qui concerne les volumes de données (ça fait partie du point 2b, mais bon : pour ne pas oublier),
    4. Quels sont les disques affectés par des mauvais secteurs,
    5. Quelles sont précisément les essais de récupération qui ont été tentés. Pour ce qui est de l'intervention du prestataire de services, au moins savoir pourquoi ils n'ont rien fait, ou s'ils ont effectivement fait quelque chose, quoi.
    6. Comment (ou après quoi) est apparu le Kernel panic
    7. Pourquoi, si j'ai bien compris, les deux raids sont touchés et pourquoi ils n'ont pas pu être reconstruits
    8. Toute autre précision qui vous parait utile : mieux vaut en avoir trop que pas assez.

Pour le point 2b, il y a des commandes qui permettent d'obtenir toutes ces précisions. J'estime ne pas avoir à les donner ici : quand on s'embarque dans des manips de récupération de données, on doit au moins être assez dégourdi pour les trouver facilement et apprendre à les utiliser. Les résultats de ces commandes sont suffisantes, mais une synthèse (à condition qu'elle soit exacte !) me faciliterait le travail... et me rassurerait !

Encore une chose : j'ai l'impression qu'il y a eu plusieurs négligences et erreurs qui sont soit à l'origine du problème, soit qui ont provoqué son aggravation. Ce n'est certes pas toujours facile à avouer, mais ne cachez rien : on risquerait de passer à côté d'une info capitale ce qui pourrait avoir des conséquences fâcheuses.
jibe. En vert ou en rouge-orangé : je modère - En noir ou autre couleur : je parle à titre personnel.

L'idée que quand on n'a pas quelque chose, on puisse se bouger pour l'avoir, c'est une démarche qui parait absolument normale pour les gens du Logiciel Libre et totalement surnaturelle pour tout le reste de la population. (Benjamin Bayart)
jibe
 
Message(s) : 943
Inscription : 09 Sep 2011 23:19
Localisation : Haute Savoie

Re: PANNE : Kernel Panic - attempting to kill unit

Message par pkege » 26 Août 2012 16:19

Bonjour,

Pour ma part, je reste calme et serein. Le serveur a été installé par moi-même il y a quelques années en suivant un tuto trouvé sur internet. La panne est arrivée pendant la période chaude du début du mois de juillet et l'ordi était colmaté par la poussière. Surchauffe du processeur, arrêts automatiques et remises en route du serveur obstinée par JF. Voila pour les circonstances.
pkege
 
Message(s) : 48
Inscription : 17 Juil 2012 08:55

Re: PANNE : Kernel Panic - attempting to kill unit

Message par pkege » 26 Août 2012 20:14

bon:
J'ai besoin d'aide. dois-je redemarrer le serveur avec un live CD de Dedian ou d'une autre distrib. Je ne suis pas à l'aise avec les instruction pour trouver les arrays et la constitution du raid. Je sais être patient et bon élève.
pkege
 
Message(s) : 48
Inscription : 17 Juil 2012 08:55

Re: PANNE : Kernel Panic - attempting to kill unit

Message par unnilennium » 26 Août 2012 21:50

[EDIT de jibe] (désolé, JPP...) Lire les posts suivants avant toute intervention de ce type ! Risque d'aggraver la situation ! [/EDIT]
comme il s'agit d'un SME je commencerait avec le cd de ... SME .

il y a un mode rescue dessus.

As tu toujours un lien vers ce fameux tuto ?
Est ce celui ci : http://wiki.contribs.org/Raid#Convert_S ... 1_to_RAID5 ?

md2 active raid5 sda2(0) sdc2(2) sdb2(1)
488182784 blockks level5

md1 active raid1
sda1(0) sdd1(3) sdc1(2) sdb1(1)
10430


à priori , je comprend qu'il y a 4 disques physiques répartis sur deux grappes raid

à priori md1 devrait être la partition de boot en raid 1 simple et sans lvm.

à priori md2 devrait être la grappe raid 5 avec en couche lvm dessus la partition de données et la partition de swap.

sda1 ext3 cap 101.94 données 23.54 boot raid
sda2 lwm2 cap 232.78 raid

sdb1 ext3 cap 101.94 boot raid
sdb2 unknow cap 232. raid

sdc1 = sdb1
sdc2 = sdb2

sdd1 unknow cap 101.94 boot raid
sdd2 unknow cap 232.78 raid

par contre quand je lis que sda1 a un filesystem ext3 ..... il y a qq chose qui ne colle pas, car cela devrait être une partition avec flag Linux raid et pas ext3, de même pour la partition sda2 qui devrait être aussi linux raid et pas "lvm2"

je ne comprend pas non plus le "sdc1 = sdb1 " et " sdc2 = sdb2". Peux tu nous expliquer ces lignes ?


Donc je commencerais par booter sur le cd de sme en mode rescue et récolter ces informations :
Code : Tout sélectionner
fdisk -l

cat /proc/mdstat

mdadm --examine --scan /dev/sda2
mdadm --examine --scan /dev/sdc2
mdadm --examine --scan /dev/sdb2
mdadm --examine --scan /dev/sdd2


mdadm --examine --scan /dev/sda1
mdadm --examine --scan /dev/sdc1
mdadm --examine --scan /dev/sdb1
mdadm --examine --scan /dev/sdd1


le retour exact des commandes précédentes est important pour :
- être certain du formatage
- avoir plus d'info sur le raid

Code : Tout sélectionner
smartctl -a /dev/sdd -t short



ceci va te permettre de vérifier la santé de ton disque.


De ce que je comprends aussi la machine est capable de booter, donc le md1 est fonctionnel c'est qu moment d’accéder à md2 que le kernel panique.

Si le système de recue est capable de monter et rendre accessible le raid 5 et le lvm en dessous alors tu pourras faire un backup avant de continuer. Sinon on examinera le raid et le lvm ensuite.


Normalement un raid 5 est capable de fonctionner avec un disque perdu. Donc soit le problème est pas vraiment au niveau du raid soit il y a plus d'un disque défectueux.
De plus avec 4 disques le disque numéro 4 aurait du être un hotspare suivant la façon de procéder de sme ( 3 + 1 hotspare), cela veut donc dire qu'il faudrait que 3 disques soient défectueux pour que le raid 5 soit non remontante.
unnilennium
 
Message(s) : 218
Inscription : 28 Nov 2011 19:32
Localisation : Québec, QC, Canada

Re: PANNE : Kernel Panic - attempting to kill unit

Message par jibe » 26 Août 2012 21:56

Salut,

Désolé, unnilennium : Non, pas de CD rescue SME !!!

Les disques ont eu apparemment très chaud, il y a des bad sectors, il faut éviter toute remise en route sans savoir précisément que faire.

Je poste en vitesse pour éviter d'éventuelles catastrophes : j'étais en train de répondre, je donnerai plus de précisions dedans... après avoir lu complètement ton post, JPP. Désolé, mais je pense que tu comprendras mon intervention précipitée.
jibe. En vert ou en rouge-orangé : je modère - En noir ou autre couleur : je parle à titre personnel.

L'idée que quand on n'a pas quelque chose, on puisse se bouger pour l'avoir, c'est une démarche qui parait absolument normale pour les gens du Logiciel Libre et totalement surnaturelle pour tout le reste de la population. (Benjamin Bayart)
jibe
 
Message(s) : 943
Inscription : 09 Sep 2011 23:19
Localisation : Haute Savoie

Re: PANNE : Kernel Panic - attempting to kill unit

Message par jibe » 26 Août 2012 22:11

Bon, je viens de lire complètement le post d'unnilennium. Hormis les manips qu'il vaut mieux remettre à plus tard, je suis tout à fait d'accord avec son analyse.

Je vais finir la réponse que j'avais commencé à préparer quand j'ai vu son post. En gros : j'explique (avec force détails comme à mon habitude :P ) pourquoi ne pas se précipiter (apparemment, il y a des bizarreries, et toute remise en route des disques fait courir le risque de pertes supplémentaires). Mon objectif est d'abord de cloner les disques actuels (demande, dans mon post qui va suivre, des investissements supportables) avant de faire cette analyse. Clonage avec tentative progressive de récupération des bad sectors, pour mettre toutes les chances de notre côté.

Ensuite, on pourra selon les précisions dont on dispose, soit envisager la reconstruction du serveur tel quel, soit la récupération des données ou d'une partie des données pour ré-implantation sur un serveur neuf.

Vu le niveau de connaissances du raid/lvm des intéressés, j'y vais très prudemment : j'ai plusieurs fois fait des miracles en récupération de données, mais il faut bien comprendre ce qu'on fait et ne pas se louper à certaines étapes (dont et surtout le clonage). Et je n'ai jamais eu de cas si catastrophique, avec des disques ayant chauffé et remis plusieurs fois en route, avec arrêts brutaux si j'ai bien tout compris...
jibe. En vert ou en rouge-orangé : je modère - En noir ou autre couleur : je parle à titre personnel.

L'idée que quand on n'a pas quelque chose, on puisse se bouger pour l'avoir, c'est une démarche qui parait absolument normale pour les gens du Logiciel Libre et totalement surnaturelle pour tout le reste de la population. (Benjamin Bayart)
jibe
 
Message(s) : 943
Inscription : 09 Sep 2011 23:19
Localisation : Haute Savoie

Re: PANNE : Kernel Panic - attempting to kill unit

Message par jibe » 26 Août 2012 22:35

Je ne change rien à ce que j'avais déjà écrit lorsque j'ai vu le post de JPP aka unnilennium. Je complète simplement la conclusion qui manquait, en tenant compte d'un détail signalé par JPP sur l'organisation et la reconstruction des raids. Je la mettrai en bleu comme cet ajout.

Salut,

pkege a écrit :Je sais être patient et bon élève.

Ok, donc on va y arriver. J'ai promis mon aide, et j'ai pour ma part l'habitude de tenir mes promesses. Donc, c'est d'ores et déjà définitivement acquis - dans la mesure bien sûr des possibilités : j'ai promis l'aide, pas les miracles ;) - mais ce ne sera possible que lorsque j'aurai toutes les données du problème. On en est à la troisième page du fil, il serait temps que je sache de quoi on parle !!!

Désolé pour le bon élève, je suis personnellement un très mauvais prof. Je ne saurais pas, sauf éventuellement des questions précises sur un point particulier un peu trop succinctement expliqué, faire mieux que ce qu'on peut trouver dans les pages de man et sur le net. C'est d'ailleurs dit dans la charte : notre vocation n'est pas d'être un site de formation de base et on n'accepte d'aider que ceux (débutants ou non, ça nous est bien égal) qui savent s'investir suffisamment. J'ai pris la peine d'expliquer hier que c'est encore plus important dans le cas de récupération de données.

D'autre part, tu dis avoir installé ce serveur. Donc, tu as bien dû utiliser fdisk, mdadm et lvm ? Si tu l'as fait en copiant-collant les lignes de commande sans les comprendre, je crois qu'il vaut mieux arrêter tout de suite - à moins bien sûr que tu ne te décides à adopter une autre démarche : on court à la catastrophe, parce qu'il va falloir que tu sois capable de comprendre chaque commande que je te donnerai, et surtout d'en interpréter les résultats avant d'aller plus loin. Rien de bien sorcier à tout cela, je répète. L'informatique n'est pas réservée à une élite, ou alors c'est à l'élite de ceux qui ont la volonté de prendre le temps d'apprendre avant de vouloir obtenir un résultat. Si tu es bon élève, c'est donc plus que tout à fait à ta portée. Mais attention : un bon élève n'est pas celui qui est capable de réciter par cœur ce qu'a dit le prof, c'est celui qui est capable de lui poser des questions précises et pertinentes pour se faire préciser ce qu'il n'a pas compris.

Donc, il ne te reste plus qu'à éplucher le man des commandes et s'il y a des points obscurs j'essaierai de t'apporter mes lumières, bien que je connaisse très mal lvm (mais d'autres pourront le faire, me compléter ou me corriger). Si l'anglais te rebute, tu peux aller voir sur ce site où pas mal de pages de man sont traduites en français. Il y en a d'autres, dont le site officiel de traduction des pages de man, mais l'avantage de celui-ci est qu'il donne la page en anglais quand il ne trouve pas la page en français ce qui évite d'avoir à chercher ailleurs.

Tu peux aussi rechercher ici et surtout dans les archives d'Ixus les interventions de Gaston, notre grand spécialiste raid/lvm ;)

Je me doute bien que le serveur a été installé "en suivant un tuto trouvé sur internet" ! Ce qui m'intéresserait, c'est de le consulter pour comprendre très précisément comment le raid a été monté. Ce serait bien que tu essaies de retrouver ce tuto.

Concrètement pour l'instant, il serait nettement préférable de ne pas redémarrer le serveur afin de ne prendre aucun risque avec les disques (même si j'ai l'impression qu'on n'en est plus à quelques démarrages près...). Essaie dans un premier temps simplement soit de retrouver le tuto que tu as suivi, soit de te remémorer, à l'aide des pages de man, comment étaient organisés les raids et volumes logiques. Au passage, tu comprends peut-être mieux maintenant pourquoi bon nombre d'entre nous (dont moi !) se refusent à donner des "formules magiques" ou autres lignes de commande qu'on copie-colle sans comprendre : tôt ou tard, on paie cher d'avoir joué les apprentis-sorcier ! Au pire, si tu as effectivement joué à l'apprenti-sorcier en appliquant sans le comprendre un tuto pris au hasard, essaie de me donner tout ce que tu sais, on verra ce qu'on peut faire avec...

Dis-moi également quels sont les moyens qui peuvent être mis en œuvre. L'idéal serait d'avoir un jeu complet de disques vierges et fonctionnels ayant respectivement les mêmes capacités ou plus que ceux du serveur. Je sais que le prix des disques a pris un sale coup l'an dernier, mais je pense que l'investissement ne serait pas un luxe : de toutes manières, ceux du serveur ont manifestement eu un bon "coup de chaud", et même ceux qui semblent encore fonctionner correctement risquent bien d'avoir maintenant une durée de vie très limitée et il serait donc prudent (certains vont probablement me reprocher de ne pas dire "indispensable" !), préventivement, de les remplacer.

Si l'investissement est trop lourd, il va falloir envisager de remonter le serveur différemment, sans raid, avec seulement un voire deux disques. Mais il va falloir au minimum un disque fiable (neuf si possible) de capacité au moins égale au plus grand pour procéder à la récupération des données, plus un espace de stockage pour l'ensemble des données. Le mieux pour cela serait de prévoir la sauvegarde à mettre en place de toutes manières dès remise en route du serveur.

A titre indicatif, une société sérieuse de récupération de données ne fait pas de devis comportant moins de trois zéros avant la virgule. Et tu dois généralement fournir, pour chaque disque, un disque neuf de capacité au moins égale et dans certains cas un disque parfaitement identique (parce qu'ils prévoient si nécessaire de monter les plateaux du disque cassé dans celui fourni). On ne fera certes pas tout ce qu'ils peuvent faire, mais avec un peu de chance on n'aura pas besoin d'avoir recours à eux. Quoi que je me méfie de la chance vu les remises en route obstinées !

J'allais conclure par une brève description de la manière dont nous allons procéder lorsque j'ai vu le post d'unnilennium. Comme du coup j'ai fait cette description dans un précédent post, je vais juste apporter quelques précisions sur l'organisation/reconstruction du raid dont parle unnilennium.

Je partage à priori assez son avis sur ce point, mais :
- Il y a des bizarreries (ex : le ext3 sur sda1)
- J'avais cru comprendre qu'il y a du raid 1 pour le système et du raid 5 pour les données (j'ai alors pensé à une grappe raid5 montée sur /home ou une ibay...). Soit j'ai mal compris (pas impossible, surtout dans un tel contexte !), soit j'avais raison de dire que ce n'est pas une configuration habituelle pour SME...

D'où mon extrème prudence, que je ne crois pas qu'on puisse qualifier d'exagérée en pareil cas. Je souhaite avoir tort et qu'unnilennium ait raison : ce serait bien plus simple pour tous ! Mais comme il est impossible de le savoir sans prendre de risques, je conseille vivement de jouer la prudence en commençant par cloner les disques. S'il y a moyen de le faire en reconstituant le jeu complet sur des disques neufs ou dont la fiabilité n'est pas douteuse, on pourra analyser la situation de la manière préconisée par unnilennium ou une autre (si on a le tuto par exemple et qu'il n'est pas celui auquel il a tout naturellement pensé) puis procéder éventuellement à la reconstruction du raid et de l'ensemble tout en étant parfaitement serein : on ne prend absolument aucun risque d'aggraver la situation !
jibe. En vert ou en rouge-orangé : je modère - En noir ou autre couleur : je parle à titre personnel.

L'idée que quand on n'a pas quelque chose, on puisse se bouger pour l'avoir, c'est une démarche qui parait absolument normale pour les gens du Logiciel Libre et totalement surnaturelle pour tout le reste de la population. (Benjamin Bayart)
jibe
 
Message(s) : 943
Inscription : 09 Sep 2011 23:19
Localisation : Haute Savoie

Re: PANNE : Kernel Panic - attempting to kill unit

Message par jibe » 27 Août 2012 00:32

Allez, encore une petite tartine :P

Bon, je vais être plus bref, ce coup-ci : cette histoire de disques qui ont chauffé me tracassait, parce que je n'étais plus très sûr de ce que j'avais en tête au niveau des températures maxi acceptables (on lit de 45 à 55 ° assez couramment) et des effets. Je viens de trouver un document qui me semble assez juste et intéressant sur le sujet.
jibe. En vert ou en rouge-orangé : je modère - En noir ou autre couleur : je parle à titre personnel.

L'idée que quand on n'a pas quelque chose, on puisse se bouger pour l'avoir, c'est une démarche qui parait absolument normale pour les gens du Logiciel Libre et totalement surnaturelle pour tout le reste de la population. (Benjamin Bayart)
jibe
 
Message(s) : 943
Inscription : 09 Sep 2011 23:19
Localisation : Haute Savoie

Re: PANNE : Kernel Panic - attempting to kill unit

Message par pkege » 27 Août 2012 13:24

Voir aussi ds le formulaire l'organisation de chaque disque


smartctl 5.41 2011-06-09 r3365 [i686-linux-3.2.0-23-generic-pae] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Model Family: Seagate Barracuda 7200.10
Device Model: ST3250410AS
Serial Number: 6RYD5Z1W
Firmware Version: 3.AAF
User Capacity: 250 059 350 016 bytes [250 GB]
Sector Size: 512 bytes logical/physical
Device is: In smartctl database [for details use: -P show]
ATA Version is: 7
ATA Standard is: Exact ATA specification draft version not indicated
Local Time is: Mon Aug 27 14:23:31 2012 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 430) seconds.
Offline data collection
capabilities: (0x5b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 64) minutes.
SCT capabilities: (0x0001) SCT Status supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 100 253 006 Pre-fail Always - 0
3 Spin_Up_Time 0x0003 098 097 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 79
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 13
7 Seek_Error_Rate 0x000f 084 060 030 Pre-fail Always - 255312169
9 Power_On_Hours 0x0032 066 066 000 Old_age Always - 30030
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 79
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 066 050 045 Old_age Always - 34 (Min/Max 13/50)
194 Temperature_Celsius 0x0022 034 050 000 Old_age Always - 34 (0 13 0 0)
195 Hardware_ECC_Recovered 0x001a 067 054 000 Old_age Always - 62064394
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0
202 Data_Address_Mark_Errs 0x0032 100 253 000 Old_age Always - 0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 30030 -
# 2 Short offline Completed without error 00% 30030 -
# 3 Short offline Completed without error 00% 29953 -
# 4 Short offline Completed without error 00% 29953 -

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Execute SMART Short self-test routine immediately in off-line mode".
Drive command "Execute SMART Short self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 1 minutes for test to complete.
Test will complete after Mon Aug 27 14:24:32 2012

Use smartctl -X to abort test.
Dernière édition par pkege le 27 Août 2012 17:17, édité 1 fois.
pkege
 
Message(s) : 48
Inscription : 17 Juil 2012 08:55

Re: PANNE : Kernel Panic - attempting to kill unit

Message par unnilennium » 27 Août 2012 15:13

pkege a écrit :SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 30030 -
# 2 Short offline Completed without error 00% 30030 -
# 3 Short offline Completed without error 00% 29953 -
# 4 Short offline Completed without error 00% 29953 -


jusque là le disque a l'air sain, mais ce sont les anciens résultats,peut être avant les problèmes.

pkege a écrit :Drive command "Execute SMART Short self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 1 minutes for test to complete.
Test will complete after Mon Aug 27 14:24:32 2012

Use smartctl -X to abort test.


je pense que depuis le temps le test a terminé (1 minute) tu peux donc refaire
smartctl -a /dev/sdd pour avoir la réponse....

tant qu'a faire test chaque disque ainsi. L'idée du clone de Jibe est toujours bonne, il faut juste avoir le budget pour 4 disques plus un disque de backup.

pkege a écrit :Résultat du Fdisk -l
Disk /dev/sda: 250.1 GB, 250058268160 bytes
Identifiant de disque : 0xf3d7f3d7

Périphérique Amorce Début Fin Blocs Id Système
/dev/sda1 * 63 208844 104391 fd RAID Linux autodétecté
/dev/sda2 208845 488392064 244091610 fd RAID Linux autodétecté

Disk /dev/sdc: 250.1 GB, 250058268160 bytes
Identifiant de disque : 0x000d419e

Périphérique Amorce Début Fin Blocs Id Système
/dev/sdc1 * 63 208844 104391 fd RAID Linux autodétecté
/dev/sdc2 208845 488392064 244091610 fd RAID Linux autodétecté

Disk /dev/sdb: 250.1 GB, 250058268160 bytes
Identifiant de disque : 0x000dc60e

Périphérique Amorce Début Fin Blocs Id Système
/dev/sdb1 * 63 208844 104391 fd RAID Linux autodétecté
/dev/sdb2 208845 488392064 244091610 fd RAID Linux autodétecté

Disk /dev/sdd: 250.1 GB, 250059350016 bytes
Identifiant de disque : 0xf3d77447

Périphérique Amorce Début Fin Blocs Id Système
/dev/sdd1 * 63 208844 104391 fd RAID Linux autodétecté
/dev/sdd2 208845 488392064 244091610 fd RAID Linux autodétecté


cela confirme l'organisation de base : md0 pour boot/ et md1 pour /


pkege a écrit :patrice@patrice-GA-MA78G-DS3H:~$ sudo mdadm --examine --scan /dev/sda2
ARRAY /dev/md0 UUID=8ec055b0:d21348ca:a6823ec9:b439290e
patrice@patrice-GA-MA78G-DS3H:~$ sudo mdadm --examine --scan /dev/sdc2
ARRAY /dev/md0 UUID=8ec055b0:d21348ca:a6823ec9:b439290e
patrice@patrice-GA-MA78G-DS3H:~$ sudo mdadm --examine --scan /dev/sdb2
ARRAY /dev/md0 UUID=8ec055b0:d21348ca:a6823ec9:b439290e
patrice@patrice-GA-MA78G-DS3H:~$ sudo mdadm --examine --scan /dev/sdd2
ARRAY /dev/md0 UUID=8ec055b0:d21348ca:a6823ec9:b439290e
patrice@patrice-GA-MA78G-DS3H:~$ sudo mdadm --examine --scan /dev/sda1
ARRAY /dev/md1 UUID=c01728e5:fe28ef9d:07f0f832:5d57b3c5
patrice@patrice-GA-MA78G-DS3H:~$ sudo mdadm --examine --scan /dev/sda1
ARRAY /dev/md1 UUID=c01728e5:fe28ef9d:07f0f832:5d57b3c5
patrice@patrice-GA-MA78G-DS3H:~$ sudo mdadm --examine --scan /dev/sdc1
ARRAY /dev/md0 UUID=d0ee9027:f0bc9e82:012c3ef5:5d73a3ee
patrice@patrice-GA-MA78G-DS3H:~$ sudo mdadm --examine --scan /dev/sdb1
ARRAY /dev/md0 UUID=d0ee9027:f0bc9e82:012c3ef5:5d73a3ee
patrice@patrice-GA-MA78G-DS3H:~$ sudo mdadm --examine --scan /dev/sdd1
ARRAY /dev/md0 UUID=d0ee9027:f0bc9e82:012c3ef5:5d73a3ee[



bon là c'est plus bizarre, les disques /dev/sd*1 devraient tous retourner ARRAY /dev/md0 et les /dev/sd*2 devraient tous retourner /dev/md1

au passage on a deux fois sda1 et pas sdd1 peux tu nous faire celui la ?

et on se retrouve avec 3 uuid de raid au lieu de deux ... Il y a eu des tentatives de remontage de raid à la main
unnilennium
 
Message(s) : 218
Inscription : 28 Nov 2011 19:32
Localisation : Québec, QC, Canada

PrécédentSuivant

Retour vers SME

Qui est en ligne ?

Utilisateur(s) parcourant ce forum : Aucun utilisateur inscrit et 1 invité

cron