Wiley-Schnellkurs Statistik

Wiley-Schnellkurs Statistik

von: Reiner Kurzhals

Wiley-VCH, 2015

ISBN: 9783527695836

Sprache: Deutsch

250 Seiten, Download: 4526 KB

 
Format:  EPUB, auch als Online-Lesen

geeignet für: geeignet für alle DRM-fähigen eReader geeignet für alle DRM-fähigen eReader Apple iPad, Android Tablet PC's Apple iPod touch, iPhone und Android Smartphones Online-Lesen


 

eBook anfordern

Mehr zum Inhalt

Wiley-Schnellkurs Statistik



1
Einführung


Haben Sie sich diese Frage schon einmal gestellt:

Warum muss ich eigentlich eine Statistikvorlesung hören und eine Statistikprüfung schreiben?

Der größte Teil aller Studenten, ich schätze etwa 75 %, an allen Hochschulen auf dieser Welt, muss eine Statistikvorlesung besuchen und eine Statistikprüfung ablegen, in allen möglichen Fachrichtungen (Psychologie, Sozialwissenschaften, Betriebswirtschaft, Medizin, Informatik, usw.). Sie müssen das wahrscheinlich auch – warum eigentlich?

Der Grund ist ganz einfach, nur wird er in wissenschaftlichen Büchern gerne komplett ignoriert oder kompliziert umschrieben. Die Antwort ist schnell geschrieben:

  • Sie haben eine Vermutung (Hypothese) und möchten diese gerne beweisen; oftmals treffen Sie damit eine Entscheidung. Eine Vermutung könnte beispielsweise lauten: ein neues Medikament heilt besser als ein altes Medikament.
  • Sie können diese Vermutung in der Regel wegen fehlender Zeit und mangelndem Budget nicht an allen Objekten einer Grundgesamtheit belegen, also müssen Sie Ihre Vermutung an einer Teilmenge, meist eine Stichprobe, überprüfen.
  • Das Ergebnis einer Stichprobenuntersuchung, in der Regel ein Mittelwert (z. B. mittlerer Blutdruck), beinhaltet eine gewisse Schwankungsbreite, da jede mögliche Stichprobe ja auch ein wenig anders aussieht, den Stichprobenfehler. Damit das Ergebnis und die daraus resultierende Entscheidung mit größtmöglicher Sicherheit auch für die Grundgesamtheit aller Patienten gilt, liefert die Statistik Methoden, mit denen Sie mit einer vertretbaren Irrtumswahrscheinlichkeit eine Entscheidung für oder gegen Ihre anfängliche Vermutung treffen können.

Fast alle Wissenschaftler und Anwender haben das gleiche Problem mit der Überprüfung einer Vermutung auf Grundlage einer Stichprobe. Weil der Weg über ein statistisches Testverfahren der einzige ist, solch eine Vermutung zu belegen, unter Einhaltung einer vertretbaren Irrtumswahrscheinlichkeit, müssen Sie eine Statistikvorlesung hören und eine Statistikprüfung ablegen. Deshalb sollen Studenten fast aller Fachrichtungen die Methodenlehre der Statistik in den Grundzügen beherrschen.

Um Ihnen den Zugang zu dieser statistischen Methodenlehre so einfach wie möglich zu machen, habe ich versucht, so viel Wissenschaft wie möglich heraus zu lassen und so viel wie möglich an Anschauung und Beispielen mit aufzunehmen. Dazu habe ich versucht aus 15 Jahren Lehrerfahrung und vielen Statistikseminaren und Beratungen in der freien Wirtschaft, das nötigste Wissen für die einfachste Vermittlung von Statistik zu extrahieren und mit vielen Beispielen zu beschreiben.

Am Ende möchten Sie nur die Klausur bestehen, das habe ich versucht im Auge zu behalten. Darüber hinaus möchte ich aber dennoch versuchen, Ihnen die Welt der Statistik einfach vertrauter zu machen.

Was haben Amazon und Google mit Statistik zu tun?


Beide Internet-Unternehmen gehören zu den weltweit erfolgreichsten Unternehmen unserer Zeit (bezogen auf das Jahr 2014). Das Geschäftsmodell beider Unternehmen basiert auf simplen, statistischen Datenanalysen, die ich Ihnen in diesem Buch auch näher bringen möchte. Ich verwende hier einige Fachbegriffe, die an dieser Stelle teilweise schwer verständlich sind, aber sehr viel klarer werden, sobald Sie dieses Buch durchgearbeitet haben.

  • Anwendungsfall Amazon: Geschickte Berechnungen von statistischen Abhängigkeiten zwischen den Datensätzen eines Datenbestandes mit Hilfe von Assoziationsanalysen, die mit „Wenn-dann-Regeln“ beschrieben werden. Ein Beispiel für eine einfache Regel wäre: „Wenn ein Kunde das Produkt Barilla Tagliatelle kauft, dann kauft er in 85 Prozent der Fälle auch einen Chianti“. Mit diesem einfachen Empfehlungsdienst (Recommender System) konnte Amazon seine Umsätze, z. B. im Buchgeschäft, um bis zu 30 % erhöhen. Bei einem Milliardenumsatz macht das einen Unterschied.
  • Anwendungsfall Google: Geschickte Verbindung dreier verschiedener Zielkunden (Suchende, Webseitenbetreiber, Werbetreibende) machen das Geschäftsmodell von Google aus. Dabei ist das Suchen immer noch das Kerngeschäft von Google. Die Suchmaschine basiert auf einen Algorithmus, der einen zufällig durch das Netz surfenden Benutzer nachbildet. Die Wahrscheinlichkeit, mit der dieser auf eine Webseite stößt, korreliert mit dem PageRank, einer Methode, um die Linkpopularität einer Web-Seite zu berechnen. So werden die Seiten entsprechend ihrer Wertigkeit sortiert, um so eine Ergebnisreihenfolge bei einer Suchabfrage herzustellen.

Diese beiden Anwendungsfälle zeigen, wie Sie mit intelligenter, statistischer Datenanalyse erfolgreich Geschäfte machen können. Dazu passt es gut, dass der größte deutsche IT, Telekommunikations- und Neue Medien-Branche Verband „BITKOM“ Daten als “vierten Produktionsfaktor“ in der digitalen Welt bezeichnet (neben Arbeitskraft, Kapital und Rohstoffen). Diese neue Macht im Wirtschaftsleben ist sehr nah unter uns. Fast jeder Leser ist mit Google oder Amazon schon in Berührung gekommen.

Viele Bereiche der Wissenschaft, Wirtschaft und der Verwaltung haben mit Statistik direkt oder indirekt zu tun. Google und Amazon sind nur zwei Aufsehen erregende Beispiele. In Wahrheit ist die Anwendung der Statistik schon längst im Berufsleben verankert. Durch die steigende Möglichkeit der Datenspeicherung und Datenanalysegeschwindigkeit wird die intelligente Datenanalyse eine immer größere Bedeutung in vielfältigen Bereichen annehmen.

Beschreibende und Schließende Statistik


Die vielen Methoden und zugehörigen Anwendungsbereiche der Statistik sind teilweise recht komplex und unübersichtlich, manchmal selbst für erfahrene Statistiker. Dazu kommen noch moderne Begriffe wie Data Mining, Big Data, Smart Data, Data Science und vieles mehr, von denen wir meist nur eine grobe Ahnung haben, was sie bedeuten und wie wir sie in den schon existierenden Methoden und Anwendungen einzuordnen haben.

Hier werden wir uns mit der Basis der statistischen Methoden und Anwendungen auseinandersetzen. Dazu gehört die Unterscheidung der Statistik in die zwei übergeordneten methodischen Bereiche Beschreibende und Schließende Statistik.

Zur Vereinfachung hier eine Kurzdefinition der wesentlichen Inhalte dieser Bereiche anhand ihrer Hauptanwendungen in zwei Sätzen:

  • Beschreibende Statistik. Hauptanwendung: Messwerte eines Merkmals, wie zum Beispiel Blutdruckmessungen, kompakt und übersichtlich mit Kenngrößen zusammengefasst darstellen, zum Beispiel über einen mittleren Blutdruckwert. Wir nennen sie manchmal auch deskriptive Statistik.
  • Schließende Statistik. Hauptanwendung: Vermutungen über einen Parameter einer Grundgesamtheit, zum Beispiel eine Blutdruckverbesserung nach Medikamentengabe, anhand einer Stichprobe zu prüfen und das Stichprobenergebnis verallgemeinernd auf die Grundgesamtheit zu übertragen, mit Angabe einer vertretbaren, statistischen Irrtumswahrscheinlichkeit. Wir nennen sie manchmal auch induktive Statistik.

Die Verbindung zwischen diesen beiden Bereichen der Statistik sind Kennzahlen, die eine Datenmenge, in der Regel eine Stichprobe, übersichtlich und zusammenfassend charakterisieren, wie zum Beispiel der Stichprobenmittelwert. Mit solchen Kennzahlen versuchen wir dann mithilfe der statistischen Testmethoden Aussagen über die entsprechenden wahren, aber unbekannten Kennzahlen der Grundgesamtheit zu treffen. Ein Beispiel wäre, dass eine neues Medikament durchschnittlich den Blutdruck erheblich (Statistiker sagen: signifikant) stärker senkt, als das jetzige Standardprodukt auf dem Markt, und zwar für alle Patienten. Solche Aussagen basieren letztlich auf Stichprobendaten und sind daher mit einer vertretbaren Irrtumswahrscheinlichkeit zu beurteilen. Sie können diese Unsicherheiten aber mithilfe von den noch in den folgenden Kapiteln zu erklärenden statistischen Testmethoden kontrollieren und quantifizieren, also in Zahlen ausdrücken.

Das könnte dann zu folgenden Aussagen führen: Mit einer Irrtumswahrscheinlichkeit von höchstens 2% können wir die Vermutung der signifikanten Überlegenheit des neuen Medikaments gegenüber dem bisher gebräuchlichen Medikament bestätigen. Mit anderen Worten, Sie werden mit einer großen Sicherheit davon ausgehen können, dass Sie sich hier richtig entschieden haben.

Das Ziegenproblem


An dieser Stelle möchte ich Ihnen gerne das berühmte Ziegenproblem (Monty-Hall-Dilemma) vorstellen. Dieses Problem möchte ich Ihnen näher bringen, weil es zum einen sehr gerne von Unternehmen in Assessment Centern zur Selektion von Bewerbern genutzt wird und zum anderen für diejenigen, die Spaß an Hochleistungsdenken haben oder gerne auch mal ihre Grenzen erfahren möchten; das spornt bekanntlich zu mehr Leistung...

Kategorien

Service

Info/Kontakt