Dies ist ein Text. Für den Computer besteht er nur aus Zahlen. Xyrill erklärt diesmal, wie es kommt, dass wir ihn trotzdem lesen können. Und jedes andere geschriebene Wort, das je existiert hat… natürlich nur idealtypisch.
Länge: 70:24 Minuten
Laut Wiktionary:
[Text ist eine] mündliche oder schriftliche Folge von Sätzen, die miteinander syntaktisch und semantisch verbunden sind (Kohärenz, Kohäsion), eine abgeschlossene Einheit bilden (Kompletion) und eine bestimmte kommunikative Funktion (Textfunktion) erfüllen.
[Von] lateinisch textus für "Inhalt" oder "Gewebe der Rede", "Text".
zur Definition
Problem: Computer können nur Zahlen! Wie bilden wir Zeichenketten als Zahlenfolgen ab?
Beispiel: Morse-Code
in der frühen Informatik (bis in die 1990er Jahre): Codepages (Zeichentabellen)
man ascii
(RFC 20)Ebenen in Unicode
Kodierungen für Unicode mit fixer Länge
Kodierungen für Unicode mit variabler Länge
man utf-8
)Probleme von Unicode
Für die historische Herleitung von Schriftkodierung empfehlen wir wieder den großartigen Podcast Request for Comments. Diesmal die Folge über RFC 20 ASCII.
Das nächste Mal geht es dann um T̪͙̪̻̹̩̠͔͑͋ͥ͘ę̥͔̝̘ͦͬx̨̜̩̜͙̦̻̗̳̒̊͆t̯̳̓ͥ͐ͣ́d͔̱̗̯̪̭́͛͜ͅa̵͕̯͕̻̜ͮ͒ͭȓ̜͚͚̯͎͓̋̎̈́͘s̥̯̠̬̆̿͡t̫̱̺͉̱̓͒͑͐͢e̸͖̮̙̺̠̗̬̅ͅl̝͉͚ͪ͋ͤ͜l̵̦̪͔͈̉͑u̴̝̲̠̳̖̘͚̔n͙̹̍̆͊̈͢g̨͍̣̝̣͇̯̮̠̏.