Sonderzeichen        zurück ]      [ Stichworte ]      [ Die Hyper-Bibliothek ]      [ Systemtheorie ]         [ Meine Bücher ]
 
bild

Den Ausdruck Zeichen verwende ich der Konvention folgend homonym für zwei ganz verschieden Dinge:
- eigentliche Zeichen verweisen auf etwas
- uneigentliche Zeichen verweisen nicht, sondern sind Elemente einer Schrift, etwa Satzzeichen, Buchstaben

Als Sonderzeichen bezeichne ich die Schriftzeichen einer Schrift, die nicht zu deren Alphabet gehören. Zu den Sonderzeichen gehören beispielsweise Satzzeichen, Klammern und mathematische Symbole. Auch Diakritika (é, à) werden manchmal zu den Sonderzeichen gezählt, obwohl man die entsprechenden Buchstaben auch den Alaphabet zuordnen kann. Zu den Sonderzeichen werden auch leere Zeichen (Leerschlag, space) gezählt.

Unicode
Auf modernen Textbearbeitungssystemen lassen sich auch recht entlegene Sonderzeichen ohne große Umstände benutzen. Unicode heisst eine verbreitete Form der Umsetzung. Jedes Zeichen auf dieser Welt, ob es nun ein Recycling-Symbol oder ein chinesisches Schriftzeichen ist, bekommt einen Platz in den Unicode-Tabellen und wird auf einem Rechner als eine (ev mehre Bytes umfassende) Speicherstelle abgebildet. Jedes Unicode-Zeichen hat eine eigene Nummer. In den Zeichentabellen findet sich etwa: U+0935 für das Zeichen "?".

HTML
In HTML-Dokumenten werden Sonderzeichen durch sogenannte Zeichen-Entität-Referenzen (engl.: character entity references, auch Entities genannt) dargestellt. Sie beginnen mit einem Und-Zeichen (&) und enden mit einem Semikolon (;), die Zeichenfolge dazwischen bestimmt das Zeichen (amp für das Und-Zeichen selbst, nbsp für ein geschütztes Leerzeichen, gt für das Größer-als-Zeichen). Zu beachten ist, dass für die korrekte Anzeige von HTML-Dokumenten im Browser die im Dokument angegebene (optional, falls nur ASCII-Zeichen und Entities verwendet werden), die vom Webserver angegebene und die im Browser eingestellte Kodierung übereinstimmen müssen. Nutzt man dafür Unicode, so entfällt die Notwendigkeit der Zeichen-Entity-Referenzen, außer bei HTML-eigenen Zeichen (&, ", ', <, >).


 
[wp]