Einheit Informationsgehalt

Die Einheit des Informationsgehaltes heisst bit (basic indissoluble information unit). Wird oft verwechselt mit der Einheit für die Darstellung von Daten mit Hilfe binärer Zeichen Bit ("binary digit").
Es gibt im Gegensatz zu "bit" nur ganzzahlige "Bit". Zur Darstellung von n bit werden mindestens n Bit benötigt.

 

Informationsgehalt digitaler Signale

Erscheint am Empfänger immer nur das gleiche Zeichen, so ist p=1 und I=0 bit. Es wird keine Information übertragen, da feststeht, welches Zeichen als nächstes in der Zeichenkette (Nachricht) auftreten wir. Die Nachricht ist somit leer. Sendet die Nachrichtenquelle beide Dualzeichen mit gleicher Wahrscheinlichkeit, d.h. p=1/2, so ist I=1 bit für jedes einzelne Zeichen. Sendet die Quelle n verschiedene Zeichen mit den gleichen Wahrscheinlichkeiten p=1/n, dann ist

I = -log p   bit/Zeichen

 

Beispiel: Informationsgehalt der deutschen Schriftsprache

Annahme:
Alle 30 Zeichen (29 Buchstaben + Zwischenraum) sind gleich verteilt.
Dann gilt p = 1/30. Der Informationsgehalt I = -log 1/30 = log 30 = 4,9 bit.

Folgerung:
Zur binären Darstellung eines Zeichens benötigt man daher mindestens 5 Bit.

Diese Betrachtung ist jedoch stark vereinfacht, da die Buchstaben nicht mit gleicher Wahrscheinlichkeit auftreten.

Zeichen a b c d e f g h i j k l m
deutsch 6.47 1.93 2.68 4.86 17.48 1.65 3.06 4.23 7.73 0.27 1.46 3.49 2.58
englisch 8.04 1.54 3.09 3.99 12.51 2.30 1.96 5.49 7.26 0.16 0.67 4.14 2.53
  n o p q r s t u v w x y z
deutsch 9.84 2.98 0.96 0.02 7.54 6.83 6.13 4.17 0.94 1.48 0.04 0.08 1.14
englisch 7.09 7.60 2.00 0.11 6.12 6.54 9.25 2.71 0.99 1.92 0.19 1.73 0.09

 

Informationsgehalt analoger Signale

Bei analogen Signalen lässt sich der Informationsgehalt nur nach Umwandlung von analog auf digital berechnen. Dazu wird das Signal in "m" diskrete und gleich grosse Werte zerlegt. Der Informationsgehalt für das analoge Signal ist dann log m.

Beispiel: Ein beliegbiges Telefongespräch wird digitalisiert, in dem die Schallamplituden in 128 Stufen unterteilt werden. Jeder Amplitudenwert kann damit durch eine Folge von 7 binären Zeichen dargestellt werden. Dies geschieht 5000mal pro Sekunde. Eine Nachricht von 1s Dauer enthält somit den I = 35000 bit Information.

 

Achtung: Solche statistische Information besitzt wie wir jetzt wissen keinerlei Bedeutung.