Kekse von ALDI

Bei ALDI gibt es Schokoladenkekse. Jede Packung enthält 9 Kekse mit 5 möglichen Motiven. Wie wahrscheinlich ist es nun, dass in einer solchen Kekspackung alle 5 oder nur 4 oder nur 3, 2 oder nur ein Motiv auftaucht.
Die Lösung des Problems führt auf so genannte MARKOFF-Ketten.
Die Überlegung ist nun die Folgende: Nehmen wir an, ich habe von den 9 einzupackenden Keksen bereits 6 Kekse eingepackt. Unter diesen bereits eingepackten 6 Keksen können sich 1, 2, 3, 4 oder 5 verschiedene Motive befinden. Der nächste 7. Keks kann die Anzahl der bereits vorhandenen Motive um +1 erhöhen, oder die Anzahl der Motive bleibt gleich, weil sich das Motiv des neuen 7. Kekses schon unter den vorhandenen 6 Keksen befindet. Wie wahrscheinlich jeder dieser beiden Fälle ist, hängt maßgeblich von der bereits vorhandenen Anzahl der Motive ab. Damit ergeben sich folgende Überganswahrscheinlichkeiten:

p_ij = P(nach dem nächsten gezogenen Keks habe ich i verschiedene Motive | ich habe jetzt bereits j verschiedene Motive)

Eine aus den p_ij zusammengesetzte Matrix Pmat wird als Übergangsmatrix bezeichnet und sieht dann so aus:

Pmat =

( 1                 )           -           5   0   0   0   0            4   2 ...     0   0   5   5   0                        1                       -           0   0   0   5   1

Multipliziert man nun Pmat mit einem geeigneten Startvektor (5 Einträge), so lassen sich Schritt für Schritt die gesuchten Wahrscheinlichkeiten bestimmen. Dabei enthält die i-te Stelle dieses Vektors die Wahrscheinlichkeit dafür, dass i verschiedene Motive vorhanden sind. Ein geeigneter Startvektor ist start . Interpretation: Nach dem ersten gezogenen Keks ist die Wahrscheinlichkeit dafür, dass sich in der Packung ein Motiv befindet, ist gleich Eins. Die Wahrscheinlichkeiten dafür, dass sich in der Packung 2, 3, 4 oder 5 Motive befinden, sind Null.

start =

( 1 )            0            0            0            0

Um die Wahrscheinlichkeit für das Auftreten von 1, 2, 3, 4 oder 5 unterschiedlichen Motiven nach insgesamt zwei Keksziehungen zu ermitteln, multipliziere einfach Pmat mit dem Startvektor.

Pmat * start =

( 1 )           -           5            4           -           5              0              0              0

Multipliziert man Pmat mit diesem Vektor, so erhält man die Wahrscheinlichkeiten für die Motivanzahlen nach drei Keksziehungen. Stattdessen kann man auch Pmat^2 mit dem Startvektor multiplizieren.

Pmat * Pmat * start =

( 1  )           --           25            12           --           25            12           --           25              0              0

Durch fortgesetztes Multiplizieren mit Pmat erhält man die Wahrscheinlichkeiten für das Auftreten von 1, 2, 3, 4, oder 5 Motiven nach 9 Keksziehungen. Und die Verteilung sieht so aus:

Pmat^8 * start =

( 2.56`*^-6   )            0.0026112`            0.092928`            0.4773888`            0.42706944`

Allgemein lässt sich die Verteilung der Anzahl der Motive in einer Schachtel mit n Keksen berechnen durch Pmat^(n - 1) * start. Um eine allgemeine Formel für die Wahrscheinlichkeiten herzuleiten, hilft ein Blick auf die Eigenwerte von Pmat.

Eigenwerte von Pmat :

{1/5, 2/5, 3/5, 4/5, 1}

Nun lässt sich Pmat^(n - 1) und Pmat^(n - 1) * start berechnen.

Pmat^(n - 1) * start =

(         -1 + n           -1 + n           -1 + n           -1 + n          -1 + n    ... 4`       + 6.000000000000002` 0.6`       - 4.000000000000002` 0.8`       + 1.0000000000000016` 1.`

Die Wahrscheinlichkeit für das Auftreten von genau i Motiven in einer Schachtel mit n Keksen ist in Zeile i angegeben.

motiv =

(     -1 + n                                                   )           0.2 ...  + n         -1 + n         -1 + n           1 + 0.2`       - 4 0.4`       + 6 0.6`       - 4 0.8`

Dieser Sachverhalt lässt sich nun in einer Graphik darstellen, die die Wahrscheinlichkeiten für das Auftreten von 1 bis 5 Motiven in einer Schachtel mit n Keksen angibt.

[Graphics:HTMLFiles/kekse5_39.gif]

⁃Graphics⁃

Varianzbetrachtung: Bei wie vielen Keksen pro Packung ist die Frage danach, wie viele verschiedene Motive in der Packung sind, am interessantesten?

Berechne zunächst den Erwartungswert der Anzahl der Motive in einer Kekspackung, wenn diese n Kekse enthält.

Erwartung[x_] := Underoverscript[∑, i = 1, arg3] i * motiv[[i]]/.xn

RowBox[{Tabelle,  , mit,  , Cell[],      , (n, Erwartung[n])}]

( 1                     1                   )            2                     ...       19                    4.927942405962072`            20                    4.942353924769658`

Erwartungswert der Motivanzahl in Abhängigkeit von der Anzahl der Kekse in einer Packung:

[Graphics:HTMLFiles/kekse5_46.gif]

⁃Graphics⁃

Berechne nun die Varianz der Motivanzahl pro Kekspackung, wenn die Kekspackung n Kekse enthält.

Varianz[x_] := Underoverscript[∑, i = 1, arg3] (i - Erwartung[x])^2 * motiv[[i]]/.xn

Tabelle mit   (n, Varianz[n])

( 1                      0                    )            2                   ... 19                     0.06808401665941416`            20                     0.05505423692889271`

Varianz der Motivanzahl pro Kekspackung in Abhängigkeit von der Anzahl der Kekse pro Packung:

[Graphics:HTMLFiles/kekse5_53.gif]

⁃Graphics⁃

Interpretation: Bei 6 Keksen pro Schachtel ist die Frage danach, wie viele Motive sich in der Schachtel befinden, am interessantesten, da ihr Ausgang am "unbestimmtesten" ist.


Created by Mathematica