Welcher Statistiktest bei nicht numerischen Faktoren?

Hi,

ich bin mit Statistik irgendwie überfordert und hoffe, dass sich hier jemand auskennt :)
Es geht um folgendes Experiment: Teilnehmer haben eine Liste von Sätzen angehört und mussten zwischen zwei Optionen entscheiden, welches Wort sie im Satz gehört haben. Die Hälfte der Sätze wurde von einer Frau, die andere Hälfte von einem Mann gesprochen.

Ich möchte wissen, ob die Tatsache, dass einmal eine Frau und einmal ein Mann gesprochen hat einen Einfluss auf die Anzahl der falschen Antworten hatte.

Normalerweise würde ich denken, ich muss da einen Wilcox-Test zwischen Geschlecht des Sprechers und Anzahl Falschantworten machen, aber dieser Test geht ja nur mit numerischen Faktoren...

(Falls es hilft, ich nutze R für die Statistik)

Don Quixote de la Mancha2012-05-21T06:53:33Z

Beste Antwort

Du willst ja wahrscheinlich die Hypothese testen "Richtige Antwort ist unabhängig vom Geschlecht des Vorlesers". Die Stichworte, die Du dann googeln solltest, sind "Vierfeldertest", "chi^2-Test", "exakter Fisher-Test" (z.B. unter http://de.wikipedia.org/wiki/Chi-Quadrat-Test#Vierfeldertest ). Auch "Yulescher Korrelationskoeffizient" bzw. "Yulesche Q-Statistik" hilft vielleicht weiter. Als Input können hier sehr wohl nominal skalierte Merkmale verwendet werden. Die Grundidee ist, eine Prüfgröße zu entwickeln, die bei homogener Verteilung (also für den Fall, dass das Gechlecht des Vorlesers unabhängig ist von der Korrektheit der Antwort) einer bekannten Verteilung folgt; dann kann man die Standard-Maschinerie der induktiven Statistik darauf loslassen.

Die Yulesche Q-Statistik folgt der relativ einfachen Idee, eine "Ratio" zu berechnen in der Form

( richtige Antwort bei Mann / falsche Antwort bei Mann ) / (richtige Antwort bei Frau / falsche Antwort bei Frau ).

Die Q-Statistik selbst ist dann ( Ratio - 1 ) / (Ratio + 1). Bei unabhängigen Merkmalen ist Ratio nahe bei 1 und daher die Q-Statistik nahe bei 0. Das ist gewissermaßen der Ersatz für eine Korrelation bei nominal skalierten Merkmalen.

Das sind ziemlich verbreitete Verfahren / Kennzahlen, also sollten die eigentlich auch in R zur Verfügung stehen.

asimov2012-05-21T13:03:36Z

wenn ich ernsthaft da eine untershied erwarten würde.
dann werde ich auch 2 untersuchungen machen , einmal für zuhörerinen und einmal für zuhörer.

obwohl ich da keine grosse abweichung erwarte, das ergebnis interresiert mich sehr :D