Zuvor wurde eine diskrete Nachrichtenquelle als Markov-Prozess vorgestellt. Nun lässt sich eine Grösse definieren, die in einem gewissen Sinn misst, wieviel Information durch einen solchen Vorgang erzeugt wird bzw. mit welcher Rate Information erzeugt wird. Dieser Mittelwert des Informationsgehaltes H kann man berechnen in dem man die Summe der Informationsgehalte multipliziert mit der Wahrscheinlichkeit ihres Auftretens bildet.
H ist also der Mittelwert von I des Zeichenvorrats in bit/Zeichen. pi die Wahrscheinlichkeit mit der das i-te Zeichen erscheint und Ii Informationsgehalt des i-ten Zeichens.
Die Grösse H kommt aus der Thermodynamik, sie wird dort als Entropie bezeichnet und in hier bit angegeben. Die Entropie ist ein Mass für die Ordnungszustand eines thermodynamischen Systemes. (Genau genommen für ein Mass für die Abweichung vom idealen Gleichgewichtszustand.) Wegen Analogien zur Thermodynamik wird auch der Informationsgehalt einer Nachricht als Entropie bezeichnet.
Beispiel: Sendet eine Nachrichtenquelle zwei Signale (0 und 1) aus, so tritt 0 mit der Wahrscheinlichkeit p und 1 mit der Wahrscheinlichkeit q = 1-p auf. H hängt also von p ab.
H(p) wird auch als Shannon-Funktion bezeichnet.
Im Verlauf der Shannon-Funktion kann man erkennen, dass H(p) für p=1/2 ein Maximum erreicht, d.h. wenn die beiden Dualzeichen gleichhäufig auftreten. Allgemein gilt das H(p) maximal ist, wenn die Zeichen gleichverteilt sind (bei n-Zeichen ist p1=p2=p3=...=pn=1/n).
Beispiel: Der Informationsgehalt der Nachricht "W I N T E R S E M E S T E R"
Zeichen | p | lz | Entrophie H = ... |
W | 1/14 | 3.8 | 0.271 |
I | 1/14 | 3.8 | 0.271 |
N | 1/14 | 3.8 | 0.271 |
T | 2/14 | 2.8 | 0.4 |
E | 4/14 | 1.8 | 0.514 |
R | 2/14 | 2.8 | 0.4 |
S | 2/14 | 2.8 | 0.4 |
M | 1/14 | 3.8 | 0.271 |
Summe | 1 | - | 2.798 |
Das Verhältnis zwischen der tatsächlichen und der maximalen Entropie wird relative Entropie genannt.
Wenn die relative Entropie einer bestimmten Nachrichtenquelle zum Beispiel 0,7 ist, dann heisst dies grob gesagt, dass die Quelle in der Wahl ihrer Zeichen um eine Nachricht zu bilden, etwa zu 70% so frei ist, wie es mit diesen bestimmten Zeichen überhaupt geht.