/ Infocenter
Wirtschafts News & Business Wissen

Alle Buchstaben

A B C D E F G H I J K L M N O P Q R S T U V W Z

Gleiche Buchstaben

Wirtschafts-Lexikon

Datencodierung

Wie funktioniert die Datencodierung? 

Daten werden in Computern als Abfolge von Bits, bestehend aus Einsen und Nullen, gespeichert und verarbeitet. Eine Codierung kann als Umwandlung eines bestimmten für den Menschen lesbaren Datensatzes, beispielsweise eines Textes, eines Bildes oder eines Videos, in eine Abfolge dieser Einsen und Nullen verstanden werden. Decodierung ist der umgekehrte Prozess, der die codierten Daten wieder für den Menschen lesbar macht.
Die älteste Datencodierung ist der Morsecode. Bei diesem werden Buchstaben und Zahlen in eine Abfolge kurzer und langer Töne umgewandelt, über Telegrafenleitungen versendet und am Zielort entschlüsselt. Andere historische, analoge Codierungssysteme sind das Flaggenalphabet auf Schiffen und die Signalübermittlung durch Musikinstrumente auf antiken Schlachtfeldern.
Die Datencodierung muss von der Verschlüsselung abgegrenzt werden, denn ihr Ziel ist nicht die Erhöhung der Geheimhaltung der Daten, sondern die möglichst effiziente Speicherung oder Übertragung anhand verschiedener Kriterien.

Eine Datencodierung kann als Umwandlung eines bestimmten für den Menschen lesbaren Datensatzes, beispielsweise eines Textes, eines Bildes oder eines Videos, in eine Abfolge dieser Einsen und Nullen verstanden werden.

Kriterien der Codierung

Für die Wahl der korrekten Codierung für einen bestimmten Datensatz müssen die Prioritäten der Codierung definiert werden. Häufig müssen die Aspekte der Datengröße, der Verlustfreiheit und die Flexibilität gegeneinander abgewogen werden. Ein Beispiel ist hier zur Veranschaulichung die Textcodierung.
Internationaler Standard für die Textcodierung ist der ASCII-Code (American Standard Code for Information Exchange). Bei diesem werden Zeichen mit einer Codetabelle mit 256 Positionen codiert. Dies entspricht der Datengröße von acht Bit, also einem Byte. In dieser Tabelle finden sich alle Buchstaben inklusive Akzente, alle Ziffern und zahlreiche Satzzeichen. Allerdings enthält er weder kyrillsche noch asiatische Schriftzeichen und auch nur wenige, für mathematische Anwendungen wichtige griechische Buchstaben.
Aus ASCII ist UTF-8 herausgegangen, dessen erste Hälfte ASCII entspricht. Zusätzliche Zeichen erfordern jedoch zur Codierung weitere Bytes, machen also Abstriche in der Datenkomprimierung. Dafür sind auch Zeichen wie Notenschlüssel und zahlreiche fremdsprachliche Zeichen codierbar. Für die zeichenreiche chinesische Sprache gibt es neben UTF-8 zahlreiche weitere Codierungen, die je nach Variante der Sprache (vereinfacht oder traditionell) und lokalen Dialekten zum Einsatz kommen.