Allgemeine Hardwareprobleme
Supportdatenbank (kfr_58)
Bezieht sich auf
SuSE Linux: Alle Versionen
Symptom:
Sie treffen eines oder mehrere der folgenden Phänomene an:
- Timingprobleme beim Zugriff auf das CD-ROM-Laufwerk
(Stehenbleiben, langes Warten, Busfehler, Segmentation faults)
- Kernelgenerierung (oder andere Programme) bricht mit Signal 11 ab.
- Kernelgenerierung (oder andere Programme) bricht mit Signal 7 ab.
- Fehlerhafter Dateiinhalt
- Fehler beim Speicherzugriff
- Fehler bei der Grafikdarstellung
- crc-Fehler beim Zugriff auf das Diskettenlaufwerk
- Abstürze oder Stehenbleiben während des Bootens
- Fehler während des Anlegens der Dateisysteme (mke2fs meldet Fehler)
Ursache
Diese merkwürdigen Phänomene sind mit großer
Wahrscheinlichkeit auf fehlerhafte oder zu kritisch eingestellte
Hardware zurückzuführen.
Der Grund hierfür ist, daß manche Motherboards anscheinend
Timing-Probleme haben. Diese Timing-Probleme werden durch Fehler auf
dem Bus (CPU-Memory-PCI-ISA) auffällig.
Auch wenn die Hardware z.B. unter DOS oder Windows läuft, sagt das
nichts über die Stabilität der Hardware und deren
Konfiguration aus. Derartige Hardware komm zwar mit dem langsamen,
segmentierten Speicherzugriff einer in 16bit-Realmode betriebenen CPU
(unter DOS,Windows) zurecht, sobald der Speicher jedoch linear mit 32
Bit-Bursts angesprochen wird, kommt es zu Fehlern.
Eine weitere Ursache kann eine schlecht gekühlte CPU sein oder zu
langsame oder fehlerhafte (z.B. wärmeempfindliche) RAM-Module.
Auch Fehler im 2nd-Level-Cache (Inkonsistenz, Wärmeprobleme) erzeugen
o.g. Effekte.
Die Ursache liegt also eindeutig bei der Hardware und nicht an Linux,
das diese Probleme nur zu Tage fördert.
Linux verlangt mehr von der Hardware als andere Betriebssysteme. Zum
einen wird dadurch die Leistung gesteigert. Zum anderen führt es aber
z.B. zu o.g. Schwierigkeiten. Im Gegensatz zu anderen Betriebssystem
will Linux immer sichergestellt wissen, daß die Hardware-Basis stabil
läuft. Ist dies nicht der Fall verweigert Linux (zu Recht) den
Dienst.
Ein Betriebssystem, das mit fehlerhafter oder potentiell fehlerhafter
Hardware weiterläuft stellt ein erhebliches Sicherheitsrisiko dar.
Abhilfe
Es gibt eine Reihe von Parametern und Bedingungen, an denen man
"drehen" kann, um zumindest das fehlerhafte oder fehlerhaft arbeitende
Bauteil zu isolieren.
- Internen und/oder externen Cache ausschalten: durch BIOS-Setup (CMOS)
- Übertaktung jeglicher Art (Prozessor, Systembus, Grafikkarte) vermeiden
- Bustakt reduzieren (VLB maximal 40MHz ! PCI-Bus
laut Spezifikation maximal 66 MHz ext. Prozessortakt): durch
BIOS-Setup oder Jumper auf dem Board
- Anzahl der Waitstates beim Zugriff der CPU auf den Hauptspeicher
bzw. den Cache erhöhen: durch BIOS-Setup
- Prüfen, ob etwa eine Option
15-16M Memory Hole
im BIOS-Setup aktiv ist: ggf. deaktivieren! Linux ist auf
solche "Löcher" nicht gefaßt!
- Stellen Sie sicher, dass die BIOS-Option Support for PnP OS
auf 'No' gesetzt ist. Auf manchen Systemen kann diese Option auch
Installed OS und sollte auf den Wert 'Other' gesetzt sein.
Siehe auch "Probleme durch die BIOS-Einstellung "PnP OS" " (http://sdb.suse.de/de/sdb/html/intnull.html).
- Im (Advanced) Chipset Setup, falls vorhanden,
CAS before
RAS
einstellen: durch BIOS-Setup
- Speichermodule prüfen:
- Zur Überprüfung bieten sich memtest86 oder auch
"Überprüfung der System-Stabilität" (http://sdb.suse.de/de/sdb/html/hmeyer_memtest-sig11.html) an.
- Insbesonders bei unterschiedlichen Chip-/Modul-Typen gibt es
immer wieder Probleme!
- Bei einem PCI-Bus mit 66MHz müssen die DRAM-Module
mit mindestens 60ns (oder weniger) spezifiziert sein
(keine Übertaktung).
- Überprüfen Sie die Halterung der RAM-Module, sie müssen
exakt passen und dürfen nicht lose oder verkantet
sein. Ziehen Sie die Module ggf. heraus und setzen Sie sie
wieder ein (korrodierte Kontakte).
- Ändern Sie die Reihenfolge der Module und Speicherbänke.
- Überprüfen Sie den CPU-Lüfter auf seine Funktion und ob er
wirklich exakt auf der CPU sitzt (ggf. Wärmeleitpaste verwenden)
- Schalten Sie das systemeigene Power-Management (APM) aus. Dies
ist insbesondere beim Adaptec 2940 als Fehlerquelle mehrfach
beobachtet worden: durch BIOS-Setup
- Einige Pentium-Clones machen Probleme, wenn z.B. der Kernel oder der Compiler
pentium-optimiert wurde, aber keine echter Pentium, sondern
z.B. ein K6 oder Cyrix 6x86 verwendet wird. Optimieren Sie in einem
derartigen System den Kernel bzw. Programme maximal für 486er
Prozessoren, ggf. nur für 386er.
- Kontrollieren Sie die allgemeinen BIOS-Setup-Einstellungen,
setzen Sie ggf. die Einstellung auf die (konservativen)
BIOS-Defaults.
- Bei einem fehlerhaftem PC-BIOS hilft wirklich nur
ein Update des BIOS. Fragen Sie Ihren Händler oder den
Hersteller.
- Das Netzteil liefert nicht genügend Strom oder die
Stromversorgung schwankt, versuchen Sie einige
Geräte auszuschalten.
Weitere Info:
Siehe auch:
Überprüfung der System-Stabilität
SCSI-Checkliste
Triton-Chipsatz und Busmaster DMA
Formatieren auf einer IDE-Platte ist nicht möglich
Adaptec 2940 - Reset Error
Adaptec 2940 und Reboot
Reboot wird nicht bis zum Neustart ausgeführt
Stichwörter: HARDWARE, APM, 2940, INKONSISTENTE DATEN, UNERKLÄRLICH, SIG11, SIGNAL11, SEGMENTATION FAULT, POWER MANAGEMENT, MKFS, MKE2FS, CRC
Kategorien:
Fragen und Antworten
, Hardware
SDB-kfr_58, Copyright SuSE Linux AG, Nürnberg, Germany
- Version: 28. Sep 1997
SuSE Linux AG - Zuletzt generiert: 17. Apr 2002 von sdb (sdb_gen 1.40.0)