Yahoo Clever wird am 4. Mai 2021 (Eastern Time, Zeitzone US-Ostküste) eingestellt. Ab dem 20. April 2021 (Eastern Time) ist die Website von Yahoo Clever nur noch im reinen Lesemodus verfügbar. Andere Yahoo Produkte oder Dienste oder Ihr Yahoo Account sind von diesen Änderungen nicht betroffen. Auf dieser Hilfeseite finden Sie weitere Informationen zur Einstellung von Yahoo Clever und dazu, wie Sie Ihre Daten herunterladen.

Ist die Standardabweichung einer diskreten Zufallsgröße X eigentlich richtig definiert? (s.D.)?

Also mir ist folgendes aufgefallen und ich hoffe die Frage ist nicht dumm oder zu kurz überlegt, auch hoffe ich mich hier nicht mit den Ausdrücken zu verhaspeln und alles korrekt auszudrücken/darzustellen:

Erst mal erklärendes, die Standardabweichung von X ist definiert als die Quadratwurzel aus der Varianz von X.

Die Zufallsgröße X setzt sich aus verschiedenen Werten zusammen.

Zur Vereinfachung betrachte ich hier nur den Fall, dass alle Einzelwerte mit der gleichen Wahrscheinlichkeit auftreten.

Nehmen wir mal an, wir haben verschiedene Ereigniswerte;

Xi ( i = 1, 2, 3, 4, ..., k)

denen alle die gleiche Wahrscheinlichkeit für das Eintreten zugeordnet wird, dann kann man den Mittel/Durchschnitts/Ereigniswert ganz leicht rauskriegen indem man die Xi-Werte addiert und durch k teilt.

also:

Mittel/Durchschnitts/Ereigniswert = (1/k) * Summe(i = 1)(k) Xi = µ

Nun ist es so, dass einen auch die (mittlere/durchschnittliche) Abweichung von diesem Erwartungswert interessiert.

Also mal ein konkretes Beispiel, da nicht jeder Mensch so gut mit bloßen Buchstaben umgehen kann.

Nehmen wir mal an, eine Klasse hat 20 Schüler (ich weiß, unrealistisch, durch unsere tolle, huldigungswürdige Politik), und eine Arbeit wurde geschrieben.

Dann hätten wir 20 Ereigniswerte Xi ... k = 20, klar. Also die Durchschnittsnote einer Klassenarbeit kriegen wir, indem wir alle einzelnen Notenwerte addieren und durch die Anzahl der Schüler teilen.

Nehmen wir für unser konkretes Beispiel an es gab:

drei Einsen; sieben Zweien; sieben Dreien; eine Vier und zwei Fünfen;

Durchschnittsnote:

( 3 * 1 + 7 * 2 + 7 * 3 + 1 * 4 + 2 * 5)/20 = 2,6

Ok, kommen wir zurück zur Abweichung. Erst mal Abweichung wovon? Natürlich bezieht sich die Abweichung auf die Abweichung der realen Xi-Werte vom Mittelwert µ.

Und logischerweise erhält man das indem man den Mittelwert vom Xi-Wert abzieht, man bildet also die Differenz.

Beispielsweise ist/weicht die Note 1 um

1 - 2,6 = -1,6 Noten besser als der Durchschnitt/vom Durchschnitt ab.

Und die 5 um:

5 - 2,6 = 2,4 Noten schlechter.

(negative Abweichung besser, positive schechter)

Nennen wir also die einzelne Abweichung mal:

Ai = Xi - µ

Der Mensch möchte jetzt aus allen Abweichungen wieder den Mittelwert haben. Was macht man also logischerweise automatisch erst mal? Dasselbe, was man schon machte um den Mittelwert der Ereigniswerte auszurechnen. Man addiert alle Ai zusammen und teilt sie durch k.

Gedachte mittlere Abweichung:

(1/k) * Summe(i = 1)(k) Ai = sG (Kleinsigma Gedacht)

Wenn man das jetzt so definieren würde, stände man vor einem Problem, denn da sowohl Werte über, als auch unter dem Durchschnitt existieren, existieren sowohl positive, als auch negative Ai, wie ich ja auch eben am kurzen Beispiel gezeigt habe.

Alle positiven&negativen Ai-Werte zusammengenommen neutralisieren sich wieder zur Null, ist ja auch logisch, denn genau so kommen sie ja wieder auf den Erwartungswert, der von sich selbst nicht abweicht.

Wer das nicht glaubt, dem zeige ich es schnell am Beispiel:

3 * (-1,6) + 7 * (-0,6) + 7 * 0,4 + 1 * 1,4 + 2 * 2,4

= 0

Dann wäre sG immer 0.

Nun macht man praktisch einen Trick:

Man führt die "quadratische Abweichung" ein und nennt das ganze dann Varianz. So hat man zwei Vorteile:

1.

Durch das quadrieren wird die einzelne Streuung Stärker hervorgehoben. (Wobei ich mir gerade Gedanken mache um Ai <= 1; aber so habe ich es gelernt.)

2.

Durch das Quadrieren ist sichergestellt, dass es keine negativen Werte mehr gibt, die die positiven neutralisieren können, somit erhält man immer einen positiven reellen Wert für die Varianz.

Varianz = (1/k) * Summe(i = 1)(k) (Ai)^2;

Für unser konkretes Beispiel umgesetzt wieder:

(3 * (-1,6)^2 + 7 * (-0,6)^2 + 7 * 0,4^2 + 1 * 1,4^2 + 2 * 2,4^2)/k

= 1,24 = V

Gut, damit habe ich noch kein Problem. Aber mit dem, was jetzt getan wird um wieder von der Varianz, welche ja im Einzelnen die quadrierte Abweichung gewesen ist, auf die Abweichung zurückzukommen.

Die Definition ist hier nämlich schlicht:

Standardabweichung = Quadratwurzel(V) = s

Und das bereitet mir ein ungutes Gefühl im Magen. Man zieht hier nämlich die Quadratwurzel aus einer Summe von Quadraten und tut so, als wenn man damit den Schritt, das Quadrat einzuführen um die gezeigten Probleme zu umgehen, damit 1:1 wieder rückgängig gemacht hätte!

Also aus meiner Sicht, behauptet/definiert die Mathematik, wie wir sie heute kennen hier:

Wurzel((A1)^2 + (A2)^2 + (A3)^2 + (A4)^2 + ... + (Ak)^2)/Wurzel(k)

entspricht (Ich kann leider gerade kein = mit ^ obendrauf schreiben)

(A1 + A2 + A3 + A4 + ... + Ak)/k

was ja unser eigentliches logisch hergeleitetes sG war.

Dies wäre nur das gleich, wenn alle Ai gleich wären.

(Und das wiederum gäbe es praktisch nur für den Fall k = 2; wobei ich mir mit der Aussage nicht 100% sicher bin.)

Dann wäre es:

Schreiben wir die gleichen A

Update:

Dann wäre es:

Schreiben wir die gleichen Ai-Werte mal nur als Ak;

A1 = ... = Ak

Wurzel(k * Ak)/Wurzel(k) = Ak * Wurzel(k)/Wurzel(k) = Ak

entspricht:

k * Ak/k = Ak * k/k = Ak

Nach diesen ganzen langen und mühseligen Erklärungen, damit jeder folgen kann, kann ich jetzt endlich mit meiner eigentlichen Frage ansetzen.

Wieso definiert man die Differenz zwischen Real- und Mittelwert der Zufallsgröße nicht einfach als Betrag, also nimmt immer den positiven Wert?

Dann wäre

Summe(i = 1)(k) |Ai| > 0; Ak >= A1, Ak =! 0

Und somit sG =! 0

und sG könnte ohne Umwege als Standardabweichung s definiert werden.

Also Noch mal zum Schluss für mein Konkretes Beispiel:

Nach bisheriger Definition wäre die Standardabweichung von der Durchschnittsnote:

Quadratwurzel(V) = Quadratwurzel(1,24) =~ 1,113553 = s

Nach meinem Vorschlag, mit der Definition der Beträge:

sG = 18/20 = 9/10 = 0,9

Update 2:

So, ich hoffe jeder hat mein Problem nach den zahlreichen Erklärungen und Erläuterungen zur Genüge nachvollziehen können.

Gibt es Probleme, wenn man die Durchschnittsabweichung über die Beträge herleitet?

Die quadratische Durchschnittsabweichung einzuführen nur um die negativen Abweichungswerte loszuwerden ist für mich noch in Ordnung, aber dann einfach, um das wieder rückgängig zu machen, die Wurzel aus der Summe zu ziehen ist für mich zumindest Fragwürdig. Denn man hätte dann auch einfach einen höheren geraden Exponenten wählen und am Ende die entsprechende Wurzel ziehen können, würde dann aber natürlich wieder andere Werte erhalten.

Folgende Frage/Antwort hat mich zu diesen Überlegungen inspiriert:

http://de.answers.yahoo.com/question/index;_ylt=Aj...

Update 3:

"Nur eine definition" ist gut! Sinnvoll und logisch muss sie schon sein.

Cardano hat mal wieder exakt den Nagel auf den kopf getroffen und ist auf meine Gedankengänge eingegangen.

Wenn ich das richtig verstanden habe, meintest du mit den zulassbaren Abweichungen das, was man in der Schule als Toleranzwerte behandelt.

Was man sehr schön verbildlicht als Fläche unter der Normalverteilung hat.

Interessant bei den zentralen Momenten finde ich die ungeraden ;)

Sollte ich dich falsch verstanden habe, schicke mir bitte noch mal eine Email.

5 Antworten

Bewertung
  • vor 1 Jahrzehnt
    Beste Antwort

    Hi Perfektionist,

    in der mathematischen Literatur wird meistens folgende Formulierung verwendet:

    "die Standardabweichung ist ein 'Maß' für die Abweichung vom Erwartungswert".

    Diese Formulierung deutet vielleicht schon an, dass es bei der Definition nicht so sehr darauf ankommt für die Abweichungen vom Erwartungswert einen bestmöglichen Mittelwert zu finden.

    Das Interesse ist vielmehr die Wahrscheinlichkeit für eine Abweichung der Werte einer Zufallsvariablen vom Erwartungswert bis zu einer vorgegebenen Grenze möglichst genau abschätzen zu können.

    Oder umgekehrt eine Antwort auf die Frage zu geben, welche Abweichungen zugelassen werden müssen, um einen bestimmten Prozentsatz aller Fälle (z. B. 95% oder 99%) zu erfassen.

    Antworten auf solche Fragen geben zum Beispiel die Ungleichungen von Markow und Tschebyschow mit Hilfe eben dieser Standardabweichung.

    In diesem Zusammenhang ist es manchmal ganz erhellend in die Schriften der Klassiker hineinzusehen.

    Das Buch 'Wahrscheinlichkeitsrechnung' von Markow ist in einer deutschen Übersetzung von 1912 online verfügbar.

    http://digital.library.cornell.edu/cgi/t/text/page...

    Eine bessere Erklärung als in diesem Text in den Kapiteln 3 und 7 wirst Du kaum finden. Übrigens heißt der Erwartungswert bei Markow noch 'mathematische Hoffnung'.

    In Cardanos Buch 'Liber de ludo aleae' findest Du leider noch nichts zur Standardabweichung. Aber es war schließlich auch das erste Buch zur Wahrscheinlichkeitstheorie. Es stammt von 1525 und wurde erst 1663 gedruckt, dann aber öfter nachgedruckt und schließlich ab 1953 mehrfach in englischer Übersetzung gedruckt. Manchmal braucht man schon einen langen Atem ...

    Zu Deiner letzten Überlegung, das sich der Term für die Varianz auch mit anderen Exponenten bilden läßt:

    Das wird auch gemacht und es gibt einen eigenen Namen dafür. Diese Werte heißen zentrale Momente, genauer:

    Wenn der Exponent n verwendet wird, erhält man das n-te zentrale Moment, auch als zentrales Moment der Ordnung 2 bezeichnet.

    Werden anstelle der Differenzen die Beträge der Differenzen potenziert (wie Du es als einleuchtender bezeichnest), dann spricht man von absoluten zentralen Momenten.

    Die Varianz ist mit dieser Bezeichnung das zweite zentrale Moment

    und

    Deine Alternative zur Varianz (mit den Beträgen anstelle der Quadrate) ist das absolute zentrale Moment erster Ordnung.

    Das Unterschied zwischen der Standardabweichung und dem absoluten zentralen Moment 1. Órdnung besteht u.a. darin, dass Ausreisser bei der Standardabweichung stärker berücksichtigt werden.

    Es grüßt

    Hieronymus, der Untote

  • Anonym
    vor 4 Jahren

    Entschuldigung aber became hat das Lernen einer Sprache mit der Linkshändigkeit zu tun?! @ all.... wieso gebt ihr mir Daumen runter, wenn er so eine dulle Frage stellt!!!! Meine Antwort ist doch wahr !!!!!

  • vor 1 Jahrzehnt

    Es ist doch nur eine Definition, die sich als zweckmäßig erwiesen hat.Insbesondere wird dadurch eine Normalverteilung durch Erwartungswert und Standardabweichung völlig bestimmt. Und betrachtet man nun den Zentralen Grenzwertsatz, der der Normalverteilung eine zentrale Rolle in der Stochastik gibt, so macht die vorhandene Definition der Standardabweichung durchaus Sinn.

  • reGnau
    Lv 7
    vor 1 Jahrzehnt

    Hallo Perfektionist, ich kann Dir darauf leider keinen entsprechende Antwort geben, aber kannst Du bitte ein anderes Beispiel für Deine Aufgabe nehmen?

    sorry, mags nicht erklären.

    Ähm....

    Sorry, aber normalerweise hast Du ja bei einer Notenvergabe immer einen Punktestand, der berechnet wird, der dann wohl eher eine genauere Berechnung von Abweichungen zuliesse....

    Ich weiss nicht ob Du weisst, worauf ich hinaus will, aber wäre es nicht präziser, wenn man die Totalpunktzahl aller Noten für die Berechnung dieser Abweichung nutzen würde?

    Fiel mir gerade so mal ein, denn dadurch wäre das was Du da ausrechnen möchtest vermutlich noch eine Spur genauer, als das, was Du lediglich durch den Notendurchschnitt, bzw. die Noten an sich berechnen würdest.

    Nur mal so ein Gedanke. Sorry, wegen eben, aber es gibt nun mal Geschichten, die finde ich nicht wirklich sehr fair und ich denke, das kannst Du Dir vermutlich auch vorstellen, warum und gerade solche Aufgaben bringen mich dann eher dazu sie gar nicht erst ausrechnen zu wollen (ausserdem hab ich das auch in meinem gesamten Leben nicht wirklich schon einmal gemacht, das einzige was mir an dieser Aufgabe wirklich bekannt ist, ist die Berechnung des Notendurchschnitts, weil das in jeder Schule Standard ist.)

    Sorry, das musste jetzt wirklich sein.

    Ansonsten komme ich Dir dann mal wieder mit meinem Standardbegriff Limes für Grenzwert, was Du sowieso vermutlich nicht akzeptieren wollen wirst, obwohl ich eigentlich der Ansicht bin, dass aber genau das vermutlich die Berechnungsgrundlage für Deine diskrete Zufallsgrösse und die Berechnung der Standardabweichung für mich jedenfalls zu sein scheint.

    Sorry, ich bin und war nie ein Mathematiker und es wird vermutlich auch nie einer aus mir werden, obwohl ich mir wirklich redliche Mühe gebe, den Kram zu verstehen.

  • Wie finden Sie die Antworten? Melden Sie sich an, um über die Antwort abzustimmen.
  • Gerd
    Lv 7
    vor 1 Jahrzehnt

    frag das doch am besten deinen Pauker... morgen... hier ist nicht der Mathe-LK...

Haben Sie noch Fragen? Jetzt beantworten lassen.