[kde-de] Konqueror - utf-8 - Umlaute

RittervomNie at web.de RittervomNie at web.de
Do Jul 21 21:02:21 CEST 2005


Hallo Heiner,

Heiner Gewiehs schrieb:
> Ich friemel mir eine Website zusammen.
Das ist schön.
> Als Editor habe ich Bluefish.
Das ist auch schön.
> 
> Der erste Satz lässt sich im Firefox korrekt darstellen, im 
> Konqueror hapert es mit den Umlauten.
> Das sieht dann so aus:
Das ist ebenso schön.
> Die Klappkarten in der Keramik - Kollektion zeigen Nahaufnahmen 
> farbenfroher Töpferarbeiten aus Andalusien und Katalonien.
Das ist ganz lustig.

Wahrscheinlich fehlt dir ein Stück in Deiner Theorie, was ich hiermit 
ergänzen möchte. Denn nicht nur jedes Dateisystem hat einen Zeichensatz 
(nehmen wir mal das deutsche Wort), auch jeder Editor hat einen solchen. 
Leider steht SuSE mit seiner UTF-8 Kodierung ziemlich allein auf weiter 
Flur und ist ziemlich mutig bei der Umsetzung der Linux-Standards. Alle 
anderen sind da etwas nachlässiger und ignorieren (bspw. beim Laden von 
Dateien) die LANG-Variable im System und nehmen bspw. ISO-8859-1 an 
(Kate tut das so). Du musst also auch beim laden und Speichern von 
Dateien darauf achten, dass Dein Editor den richtigen Zeichensatz 
unterstützt.

Um das alles zu umgehen schauen wir in den HTML-Standard. Dort darfst 
Du, als eines der ersten "META"-Tags, den Zeichensatz des Dokumentes 
angeben:

<meta http-equiv="content-type" content="text/html; charset=ISO-8859-1">

Hier musst Du nur dafür sorgen, dass der Zeichensatz des Editors 
eingestellt ist. Schon stellt jeder Browser mit dieser Angabe auch die 
Umlaute richtig dar. Das Dateisystem (Umsetzung der Umlaute in 
Dateinamen, nicht im Inhalt der Dokumente!) hat damit nichts zu tun.

Zusammenfassend: Das Dateisystem benötigt die Angabe eines Zeichensatzes 
um die Umlaute in Dateinamen darzustellen. Jeder Browser benötigt im 
HTML-Dokument die Angabe eines Zeichensatzes für die Interpretation des 
Zeichensatzes im Dokument.

Wenn ich Dir einen kleinen Tipp geben darf, im MySQL-Paket gibt es ein 
kleines Dienstprogramm, das heißt "replace", damit kannst Du die Umlaute 
in Dokumente schön umwandeln:

replace ä "&auml;" \
         ö "&ouml;" \
         ü "&uuml;" \
         Ä "&Auml;" \
         Ö "&Ouml;" \
         Ü "&Uuml;" \
         ß "&szlig;" -- $@

Wenn Du ganz mutig, bist, dann schaust die in die man-pages von tr (man 
tr) und nimmst vielleicht das, ist schneller.

Ich hoffe ich konnte Dein Verständnis für Zeichensätze ausreichend 
vervollständigen und Dir gleichzeitig ein paar Linux-Befehle naheführen. 
Jetzt widme ich mich wieder den schönen Dingen und schnippel ein 
bisschen an meinem neuen Mammutbäumchen rum (sequoiadendron giganteum).

P.S.

Für Webseite und HTML BITTE Selfhtml und w3c.org schauen, einen 
EINFACHEN Texteditor verwenden und weiter Linux und Co nutzen *g*.