Dieses Video gehört zum openHPI-Kurs Introduction to Bayesian Data Analysis. Möchten Sie mehr sehen?
Beim Laden des Videoplayers ist ein Fehler aufgetreten, oder es dauert lange, bis er initialisiert wird. Sie können versuchen, Ihren Browser-Cache zu leeren. Bitte versuchen Sie es später noch einmal und wenden Sie sich an den Helpdesk, wenn das Problem weiterhin besteht.
Scroll to current position
- 00:00Jetzt werde ich dieses Modell, das wir gerade in brm angepasst haben, auspacken.
- 00:05Und ich werde einige der Eigenschaften des Modells untersuchen, das wir verwenden wollen, um die Daten zu verstehen, die wir suchen
- 00:14bei.
- 00:14Und die beiden wichtigen Ideen, die ich in dieser und der nächsten Vorlesung vermitteln möchte, sind die Idee einer
- 00:22prior prädiktive Verteilung und die Idee einer posterioren prädiktiven Verteilung.
- 00:27Schauen wir uns also noch einmal an, wie das Modell aussieht.
- 00:32Anders als bei einem linearen Modell würde die vollständige Spezifikation des Modells also Gleichung zwei lauten.
- 00:38Aber wenn ich in einem Bayes'schen Modell von Modell spreche, dann meine ich nicht nur den generativen Prozess für die beobachteten Daten, sondern auch
- 00:47einschließlich meiner vorherigen Angaben zu den Parametern.
- 00:51Wenn ich also von einem Modell in der Bayes'schen Datenanalyse spreche, meine ich damit die Gleichungen eins und zwei zusammen als eine
- 00:59Aussage über das Modell.
- 01:00Okay, das ist also ein großer Unterschied zwischen dem frequentistischen und dem Bayes'schen Ansatz.
- 01:05Nachdem wir nun einige Prioritäten für die Parameter mu und sigma festgelegt haben.
- 01:11Noch bevor ich irgendwelche Daten gesehen habe, kann ich bereits simulierte Daten aus diesem Modell erzeugen.
- 01:18Wenn ich also intuitiv eine Stichprobe aus einer Gleichverteilung nehme und eine Stichprobe aus dieser Gleichverteilung nehme, erhalte ich eine Stichprobe
- 01:26von mu und sigma, könnte ich diese hier einfügen und einen generierten Datenpunkt erhalten.
- 01:31Dieser generierte Datenpunkt wird als prädiktive Verteilung bezeichnet.
- 01:35Die formale Aussage ist hier, alles was ich tue, ist, die Theta-Parameter zu integrieren.
- 01:40Ich habe dies bereits beim letzten Mal besprochen.
- 01:41Was die Integration des Parameters out bedeutet.
- 01:44Aber das ist alles, was ich hier tue, und es spielt wirklich keine Rolle, wie viele Parameter ich habe.
- 01:50zwei haben, könnte ich Hunderte haben.
- 01:52Ich könnte trotzdem eine prädiktive Verteilung erstellen.
- 01:55Wie funktioniert das also?
- 01:57Wie kann ich eine prädiktive Verteilung erstellen?
- 01:59Wie ich bereits erwähnt habe, ist dies nur eine Spielzeugversion.
- 02:03Ich nehme eine Stichprobe aus dem Prior für mu, ich nehme eine Stichprobe aus dem Prior für sigma.
- 02:10Ich habe hier eine Zahl und hier eine Zahl aus den früheren Verteilungen und gebe diese in die rnorm-Funktion ein.
- 02:17Jetzt sehen Sie den Vorteil der Kenntnis der dpqr-Funktionsfamilie.
- 02:21Damit können wir priorisierte prädiktive Verteilungen erstellen.
- 02:24In diesem Fall generiere ich also 5 Datenpunkte mit diesem speziellen mu und sigma.
- 02:30Ich erhalte also einen vorhergesagten Datensatz.
- 02:32Jetzt.
- 02:32Noch bevor ich Daten gesehen habe, untersuche ich die Eigenschaften des Modells anhand der Prioritäten und des generativen Prozesses
- 02:41Das ist die Likelihood-Funktion.
- 02:42Das sind also einige simulierte Daten.
- 02:44Ich kann das jetzt so oft machen, wie ich will.
- 02:46Ich könnte also mehrere Datensätze mit beliebiger Stichprobengröße erhalten.
- 02:50Im Lehrbuch finden Sie den Code, um diese Art von Daten zu erzeugen.
- 02:55Aber ich zeige Ihnen nur das Ergebnis eines solchen generativen Prozesses.
- 02:58Ich habe Ihnen also vier simulierte Datensätze gezeigt, die auf dem Modell basieren, das wir gerade spezifiziert haben.
- 03:05Und schauen Sie es sich einfach an.
- 03:07Was sehen Sie hiervon?
- 03:09Das Modell ist völlig unvernünftig, weil es davon ausgeht, dass es in diesem speziellen Fall Daten mit einem Mittelwert von etwa
- 03:179000 Millisekunden.
- 03:20Neun Sekunden ist also die durchschnittliche Reaktionszeit für das Drücken einer Taste.
- 03:25Stellen Sie sich das einmal vor.
- 03:26Wie realistisch ist das?
- 03:28Als Modell?
- 03:28Das ist nicht richtig.
- 03:29Ich würde mir keine neun Sekunden Zeit nehmen, um Knöpfe zu drücken, wenn ich gebeten werde, sie einfach immer wieder zu drücken.
- 03:34Dieser ist sogar noch langsamer und ein bisschen realistischer, aber immer noch etwas seltsam.
- 03:40Sie sehen also diese merkwürdigen Verteilungen und natürlich habe ich das Binning nicht richtig gemacht.
- 03:45Deshalb sehen Sie diesen einzelnen vertikalen Balken hier, hier und hier.
- 03:49Wenn ich sie richtig einordne, sehen Sie, dass sie um diesen sehr großen Wert herum verteilt sind.
- 03:54Aber der wichtigste Punkt, den ich hier vermitteln möchte, ist, dass dies unrealistische Datenpunkte sind, die vom Modell erzeugt wurden.
- 04:01Und das sagt uns, dass die Prioritäten hier nicht angemessen sind.
- 04:07Ich werde Ihnen später zeigen, dass sie nicht schädlich sind, wenn Sie die Datenanalyse tatsächlich durchführen.
- 04:11Aber als Modell ist dies kein sehr sinnvolles Modell für die Reaktionszeiten.
- 04:16Okay,
- 04:18Die Frage ist nun, ob die Prioritäten, die ich gerade angegeben habe, nicht vernünftig sind.
- 04:24Wenn sie nicht vernünftig sind, was ist dann meine Alternative?
- 04:27Das ist also eine Idee, die ich für Sie auspacken werde und die sich aus der Idee der prädiktiven Verteilung ergibt.
- 04:33Wenn Sie sich die vorherigen Vorhersageverteilungen ansehen, erkennen Sie, dass das Modell völlig lächerlich ist
- 04:40Daten, dann ist die erste Frage, die Sie sich stellen sollten: Wie sollte ich mein Modell ändern?
- 04:46So dass die Prioritäten vernünftiger sind, so dass sie vernünftigere Daten produzieren.
- 04:51Angesichts des Problems, an dem ich gerade arbeite.
- 04:52Okay.
- 04:53In der Bayes'schen Literatur gibt es eine umfangreiche Terminologie für verschiedene Arten von Prioren.
- 05:01In unserem Buch mussten wir also eine Klassifizierung wählen.
- 05:05Also haben wir einfach das hier gewählt.
- 05:07Nun, es ist nicht willkürlich, aber wir haben dies für unser eigenes Buch gewählt.
- 05:10Wir haben also vier grundlegende Klassen von Prioritäten, die natürlich ein Kontinuum darstellen.
- 05:14Es handelt sich also nicht um diskrete Kategorien.
- 05:16Aber das ist ein Kontinuum, das die Art der Prioritäten zusammenfasst, die man verwenden kann.
- 05:22Ein Typ wäre also der Typ, den ich Ihnen bereits gezeigt habe, ein flacher, uninformativer Prior.
- 05:27Dies könnte der einheitliche Prior sein.
- 05:29Und hier habe ich einen einheitlichen Prior, der von einem negativen Wert zu einem positiven Wert geht.
- 05:37Natürlich ist ein negativer Wert in diesem speziellen Fall nicht sinnvoll.
- 05:41Aber im Prinzip könnten Sie solche Prioritäten tatsächlich angeben.
- 05:44Okay, die zweite Klasse von Prioren, die wir in den Beispielen, die ich zeigen werde, verwenden werden, ist ein so genannter regularisierender Prior
- 05:53In diesem Fall ist das Pluszeichen, das Sie hier unter der Normalen sehen, nach der Normalen hier,
- 05:59Das bedeutet, dass wir eine Normalverteilung definieren, mit einem Mittelwert von Null und einer Standardabweichung von 1000 in der
- 06:07auf die übliche Weise.
- 06:08Aber wir werden sie bei Null abschneiden.
- 06:11Wie dieses Modell grafisch aussieht, wird die tatsächliche Form dieses Modells in etwa so aussehen.
- 06:20Dies ist der Nullpunkt.
- 06:22Ich würde also einen Prior definieren, der einen bestimmten Mittelwert von Null und eine gewisse Standardabweichung hat, aber ich habe bei diesem Wert abgeschnitten
- 06:29Punkt.
- 06:29Das bedeutet also, dass dieser Teil der Verteilung jetzt verschwunden ist.
- 06:32Der Grund, warum ich einen solchen Prior verwende, ist, dass ich festlegen möchte, dass mu nicht negativ sein darf.
- 06:40Wenn ich über Reaktionszeiten spreche, können Sie keine negativen fünf Millisekunden haben.
- 06:45Null ist eine untere Grenze.
- 06:46Dies wäre also ein vernünftiger Weg, die Normalverteilung abzuschneiden.
- 06:50Dies ist also eine verkürzte Normale.
- 06:52Auf ähnliche Weise könnte ich mich für eine andere Art von Prior entscheiden, die wir als Hauptprior bezeichnen.
- 06:57Sie sehen also, dass der Mittelwert nicht mehr Null ist, sondern 250.
- 07:03Der Grund, warum wir es als Hauptpriorität bezeichnen, ist, dass wir aus früheren Untersuchungen wissen, dass das Drücken von Tasten oder sogar Intuition
- 07:11helfen Sie uns hier.
- 07:12Ein solcher Tastendruck würde im Durchschnitt nicht länger als 200-250 Millisekunden dauern.
- 07:17Sie könnten also davon ausgehen, dass der Prior etwa 250 Millisekunden beträgt und Sie könnten eine Menge
- 07:27Variation um diese 250 Millisekunden herum, indem Sie hier eine ziemlich große Standardabweichung definieren.
- 07:33Es handelt sich also um eine Hauptpriorität, weil sie die Priorität auf 250 zentriert, was eine vernünftige vorherige Annahme über die Reaktion ist
- 07:40mal, aber er ist sehr großzügig, wenn es darum geht, den neuen Parameter um plus oder minus 200 Millisekunden zu verändern.
- 07:51Die Zeitspanne kann also 50 Millisekunden oder 450 Millisekunden betragen.
- 07:58Das ist es also, was dieser Prior tut und beachten Sie, dass ich auch diesen abschneide.
- 08:02Sie kann also niemals negativ sein, was auch hier sinnvoll ist.
- 08:05Und eine weitere Klasse von Prioren, die wir häufig verwenden werden, insbesondere wenn wir Hypothesentests mit Basisfaktoren durchführen, ein Thema, das
- 08:13Ich werde in diesem Kurs nicht darauf eingehen, aber es steht im Lehrbuch. Dort ist die Verwendung informativer Prioritäten extrem wichtig.
- 08:21Sie sollten also so viele Informationen einfügen, wie Sie angesichts der Daten, die Sie bereits in der Literatur oder durch
- 08:28Meta-Analyse oder so.
- 08:29In diesem Beispiel habe ich also einen abgeschnittenen Prior mit Mittelwert 200 und Standardabweichung 20 verwendet.
- 08:37Das ist eine viel, viel engere Priorität und in der Praxis, wenn ich Papiere schreibe und recherchiere, verwende ich normalerweise informative
- 08:45Prioritäten, wenn ich kann.
- 08:46Wenn es also 20 Jahre Forschung zu einem bestimmten Thema gibt, kann ich eine Meta-Analyse durchführen und die posteriore Verteilung herausfinden
- 08:53aus der früheren Arbeit an dem bestimmten Parameter, den die Leute betrachten.
- 08:57Das kann ich in mein Modell einfügen.
- 08:59Ich baue also auf vorheriges Wissen auf, um meine neue Analyse durchzuführen.
- 09:04Dies ist also eine sehr nützliche Methode, um Ihre Daten im Lichte des Vorwissens zu verstehen.
- 09:11Diese Art von Prioren kann Ihnen also dabei helfen, herauszufinden, was die Daten unter verschiedenen Annahmen aussagen werden.
- 09:20Das nennt man eine Sensitivitätsanalyse, bei der eine Reihe verschiedener Prioritäten verwendet wird, um zu verstehen, wie sich die Posterioren verändern oder ob sie
- 09:27sogar als Folge der Änderung der Prioritäten ändern.
- 09:31Wie ich schon sagte, gibt es keine Standardterminologie, sondern nur unsere.
- 09:34Sie werden also in verschiedenen Lehrbüchern unterschiedliche Ausdrücke oder Begriffe finden, aber aus dem Kontext wird klar, was
- 09:41Art von Prior ist gemeint.
- 09:44In der nächsten Vorlesung werde ich Ihnen ein Beispiel dafür geben, wie man eine Sensitivitätsanalyse durchführen kann, um festzustellen, ob
- 09:53Sie ein vernünftigeres Modell haben oder nicht.
- 09:55Sie können also verschiedene Priors verwenden, um herauszufinden, welchen Prior Sie für Ihre endgültige veröffentlichte Analyse wählen sollten. Das kommt noch
- 10:02als nächstes.
To enable the transcript, please select a language in the video player settings menu.