Unicode: Unterschied zwischen den Versionen

Aktuelle Version vom 5. Januar 2026, 15:44 Uhr

Unicode ist ein internationaler Standard zur Darstellung von Schriftzeichen aus nahezu allen Sprachen der Welt. Er ordnet jedem Zeichen einen eindeutigen Codepunkt zu, unabhängig von Sprache, Schrift oder Plattform.

Codepoints

Jedes Zeichen erhält einen eindeutigen Wert (Codepoint) in der Form: U+xxxx Beispiel:

A → U+0041
€ → U+20AC
😊 → U+1F60A

UTF-8

UTF-8 ist die heute wichtigste Unicode-Kodierung.

Eigenschaften:

variable Länge: 1 bis 4 Byte pro Zeichen
ASCII-kompatibel (0–127 bleiben gleich)
platzsparend für westliche Sprachen
weltweiter Standard für Web, Dateien, Protokolle

Unicode-Codepunkt-Bereich	Byte-Länge in UTF-8	Beispiel
U+0000 – U+007F	1 Byte	A → U+0041
U+0080 – U+07FF	2 Byte	€ → U+20AC
U+0800 – U+FFFF	3 Byte	ä → U+00E4
U+10000 – U+10FFFF	4 Byte	😊 → U+1F60A

UTF-16 und UTF-32

Kodierung	Beschreibung
UTF-16	2 oder 4 Byte pro Zeichen; häufig in Windows/Java
UTF-32	4 Byte pro Zeichen; einfacher, aber weniger platzsparend

Vorteile von Unicode

unterstützt alle Sprachen (Deutsch, Arabisch, Chinesisch, Emojis usw.)
einheitlicher Standard weltweit
löst Probleme älterer Systeme (ASCII, ISO-8859-1)

Kurzmerksatz

Unicode weist jedem Zeichen weltweit einen eindeutigen Codepunkt zu und UTF-8 speichert ihn effizient in Bytes.

@@ Zeile 1: / Zeile 1: @@
-== Unicode ==
 '''Unicode''' ist ein internationaler Standard zur Darstellung von Schriftzeichen aus nahezu allen Sprachen der Welt.
 Er ordnet jedem Zeichen einen eindeutigen Codepunkt zu, unabhängig von Sprache, Schrift oder Plattform.
-=== Codepoints ===
+== Codepoints ==
 Jedes Zeichen erhält einen eindeutigen Wert (Codepoint) in der Form:
 ''U+xxxx''
@@ Zeile 12: / Zeile 10: @@
 * 😊 → U+1F60A
-=== UTF-8 ===
+== UTF-8 ==
 '''UTF-8''' ist die heute wichtigste Unicode-Kodierung.
@@ Zeile 21: / Zeile 19: @@
 * weltweiter Standard für Web, Dateien, Protokolle
-=== UTF-16 und UTF-32 ===
+{| class="wikitable" style="width:100%; text-align:center;"
+! Unicode-Codepunkt-Bereich !! Byte-Länge in UTF-8 !! Beispiel
+|-
+| U+0000 – U+007F || '''1 Byte''' || A → U+0041
+|-
+| U+0080 – U+07FF || '''2 Byte''' || € → U+20AC
+|-
+| U+0800 – U+FFFF || '''3 Byte''' || ä → U+00E4
+|-
+| U+10000 – U+10FFFF || '''4 Byte''' || 😊 → U+1F60A
+|}
+== UTF-16 und UTF-32 ==
 {| class="wikitable" style="text-align:center; width:100%;"
 ! Kodierung !! Beschreibung
@@ Zeile 30: / Zeile 40: @@
 |}
-=== Vorteile von Unicode ===
+== Vorteile von Unicode ==
 * unterstützt alle Sprachen (Deutsch, Arabisch, Chinesisch, Emojis usw.)
 * einheitlicher Standard weltweit
 * löst Probleme älterer Systeme ([[ASCII]], ISO-8859-1)
-=== Kurzmerksatz ===
+== Kurzmerksatz ==
 '''Unicode weist jedem Zeichen weltweit einen eindeutigen Codepunkt zu und UTF-8 speichert ihn effizient in Bytes.'''

Anonym

Suche

Unicode: Unterschied zwischen den Versionen

Namensräume

Mehr

Seitenaktionen

Aktuelle Version vom 5. Januar 2026, 15:44 Uhr

Inhaltsverzeichnis

Codepoints

UTF-8

UTF-16 und UTF-32

Vorteile von Unicode

Kurzmerksatz

Navigation

Navigation

Kategorien

Fach

Prüfungen

Wikiwerkzeuge

Wikiwerkzeuge

Anonym

Suche

Unicode: Unterschied zwischen den Versionen

Aktuelle Version vom 5. Januar 2026, 15:44 Uhr

Codepoints

UTF-8

UTF-16 und UTF-32

Vorteile von Unicode

Kurzmerksatz

Navigation

Wikiwerkzeuge

Seitenwerkzeuge