Diskrete Nachrichtenquelle

Eine diskrete Nachrichtenquelle wählt aus einem Alphabet fortlaufend einzelne Zeichen aus S = {s1, ..., sn}. 

Sofern die Auswahl jederzeit von der vorhergegangenen Auswahl abhängig ist, handelt es sich um "stochastischen Prozess" der in der Wahrscheinlichkeitstheorie mit "Markov-Prozess" oder "Markov-Kette" bezeichnet wird.

Die Betrachtung einer diskreten Quelle, die durch einen Markov-Prozess beschrieben wird, schliesst unter anderem auch Fälle ein wie: 

 

  • Natürliche geschriebene Sprachen wie Deutsch, Englisch oder französisch.
  • Kontinuierliche Datenquellen die nach irgendeinem Quantisierungsprozess auf diskrete zuruckgeführt worden sind
  • Mathematische Fälle, in denen man einfach einen stochastischen Prozess abstrakt definiert, der eine Zeichenfolge erzeugt

Für diese dritte Art von Quellen hier nun ein Beispiel, das veranschaulichen soll, wie Für diese dritte Art von Quellen hier nun ein Beispiel, das veranschaulichen soll, wie durch eine Serie stochastischer Prozesse eine Sprache angenähert werden kann.eine Sprache angenähert werden kann.

Wie wird nun versucht, sich einer Sprache über verschiedene stochastische Prozesse anzunähern? Ein Beispiel für die dritte Art von Nachrichtenquellen ...

 

Serien der Näherung zur englischen Sprache

Näherung 0. Ordnung
(Zeichen sind voneinander unabhängig und gleichwahrscheinlich)

XFOMAG RJKLAJKQEJA ZLJSKFJSKIAJK IUTZRDF RKCWICFK KGVE VFDZIJGDDHQJUIRTV->nichts ist erkennbar

Näherung 1. Ordnung
(Zeichen sind voneinander unabhängig, jedoch mit Wahrscheinlichkeiten eines englischen Textes)

OCRO HLI RGWR NMIELWIS EU LL NBNESEBYA TH EEI ALHENHTTPA OOBTTVA NAH BRL. -> noch immer nichts erkennbar

Näherung 2. Ordnung
(Digramm-Struktur wie im englischen)

ON IE ANTSOUTINYS ARE T INCTORE ST BE S DEAMY ACHIN D ILONASIVE TUCOOWE AT TEASONARE FUSO TIZIN ANDY TOBE SEACE CTISBE.-> erste englische Wörter sind erkennbar

Näherung 3. Ordnung
(Trigramm-Struktur wie im englischen)

IN NO IST LAT WHEY CRATICT FROURE BIRS GROCID PONDENOME OF DEMONSTURES OF THE REPTAGIN IS REGOACTIONA OF CRE.-> englische Sprache wird erkennbar
Es ist als einfacher und besser, an diesem Punkt zu Worteinheiten überzugehen, als mit Tetragrammen bis n-gramm Strukturen weiterzuarbeiten. Hier werden die Wörte nun unabhängig voneinander ausgewählt, jedoch mit den ihnen eigenen Häufigkeiten.


Näherung 1. Ordnung
auf Wörter bezogen.

REPRESENTING AND SPEEDILY IS AN GOOD APT OR COME CAN DIFFERENT NATURAL HERE HE THE A IN CAME THE TO OF TO EXPERT GRAY COME TO FURNISHES THE LINE MESSAGE HAD BE THESE.-> englischer Text wird immer deutlicher

Wort-Näherung 2. Ordnung.
Die Wortübergangswahrscheinlichkeiten sind korrekt, jedoch ist keine weitere Strukturierung inbegriffen.

THE HEAD AND IN FRONTAL ATTACK ON AN ENGLISH WRITER THAT THE CHARACTER OF THIS POINT IS THEREFORE ANOTHER METHOD FOR THE LETTERS THAT THE TIME OF WHO EVER TOLD THE PROBLEM FOR AN UNEXPECTED.-> voilà geschafft
Damit wurde verdeutlicht, dass ein genügend komplexer stochastischer Prozess eine befriedigende Vorstellung einer diskreten Quelle ergibt.


Serien der Näherung zur englischen Sprache

  • Näherung 0. Ordnung (Zeichen sind voneinander unabhängig und gleichwahrscheinlich)
XFOMAG RJKLAJKQEJA ZLJSKFJSKIAJK IUTZRDF RKCWICFK KGVE VFDZIJGDDHQJUIRTV. ->nichts ist erkennbar
  • Näherung 1. Ordnung (Zeichen sind voneinander unabhängig, jedoch mit Wahrscheinlichkeiten eines englischen Textes)
<div class="indent"><div class="indent">OCRO HLI RGWR NMIELWIS EU LL NBNESEBYA TH EEI ALHENHTTPA OOBTTVA NAH BRL. -&gt; noch immer nichts erkennbar</div></div>
  • Näherung 2. Ordnung (Digramm-Struktur wie im englischen)
ON IE ANTSOUTINYS ARE T INCTORE ST BE S DEAMY ACHIN D ILONASIVE TUCOOWE AT TEASONARE FUSO TIZIN ANDY TOBE SEACE CTISBE. -> erste englische Wörter sind erkennbar
  • Näherung 3. Ordnung (Trigramm-Struktur wie im englischen)
IN NO IST LAT WHEY CRATICT FROURE BIRS GROCID PONDENOME OF DEMONSTURES OF THE REPTAGIN IS REGOACTIONA OF CRE. -> englische Sprache wird erkennbar

 

Es ist als einfacher und besser anzusehen, an diesem Punkt zu Worteinheiten überzugehen, als mit Tetragrammen ... bis n-gramm Strukturen weiterzuarbeiten. Hier werden die Wörte nun unabhängig voneinander ausgewählt, jedoch mit den ihnen eigenen Häufigkeiten.

  • Näherung 1. Ordnung auf Wörter bezogen.
REPRESENTING AND SPEEDILY IS AN GOOD APT OR COME CAN DIFFERENT NATURAL HERE HE THE A IN CAME THE TO OF TO EXPERT GRAY COME TO FURNISHES THE LINE MESSAGE HAD BE THESE. -> englischer Text wird immer deutlicher
  • Wort-Näherung 2. Ordnung. Die Wortübergangswahrscheinlichkeiten sind korrekt, jedoch ist keine weitere Strukturierung inbegriffen.
THE HEAD AND IN FRONTAL ATTACK ON AN ENGLISH WRITER THAT THE CHARACTER OF THIS POINT IS THEREFORE ANOTHER METHOD FOR THE LETTERS THAT THE TIME OF WHO EVER TOLD THE PROBLEM FOR AN UNEXPECTED. -> voilà geschafft

 

Damit wurde verdeutlicht, dass ein genügend komplexer stochastischer Prozess eine befriedigende Vorstellung einer diskreten Quelle ergibt.