Thursday, 14 September 2017

Set Missing Werte Zu Null In Stata Forex


HINWEIS: Die IDRE Statistical Consulting Group wird die Migration der Website auf das WordPress CMS im Februar, um die Wartung und Erstellung neuer Inhalte zu erleichtern. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht länger erhalten bleiben. Wir werden versuchen, die Weiterleitungen so zu halten, dass die alten URLs weiterhin so gut funktionieren, wie wir können. Willkommen beim Institut für Digitale Forschung und Bildung Helfen Sie der Stat Consulting Group, indem Sie ein Geschenk geben Stata FAQ Wie kann ich fehlende Werte in verschiedene Kategorien umkodieren Stata erlaubt es uns, verschiedene Arten von numerischen fehlenden Werten zu kodieren. Es hat 27 numerische fehlende Kategorien. "Quote und quotieren. Z. B. Auf dieser Seite wird gezeigt, wie man fehlende Werte in verschiedene Kategorien einbinden kann. Zuerst erstellen wir einen Datensatz zur Veranschaulichung. In diesem Datensatz sind alle Variablen numerisch und die Variablen female und ses fehlende Werte. Die nicht fehlenden Werte für variables Weibchen sind 0 (für männlich) und 1 (für weiblich). Die nicht fehlenden Werte für die Variable ses sind 0 (niedrig), 1 (med) und 2 (hoch). Die restlichen Werte gelten als fehlende Werte. Lets sagen, dass wir -999 in eine Kategorie, -99 in einen anderen und den Rest der fehlenden Werte in eine dritte Kategorie für alle Variablen. Methode 1: Verwenden von Befehl Ersetzen Wir können fehlende Werte manuell durch ".a für -999," b für -99 und. c für den Rest der fehlenden Werte ersetzen. Zum Beispiel für variable weibliche. Können wir Folgendes tun: Der obige Codebuchbefehl zeigt, dass die Variable weiblich drei Arten von fehlenden Werten und 4 fehlenden Werten hat. Methode 2: Verwenden von Befehl mvdecode Methode 1 möglicherweise nicht die beste Art, fehlende Werte in verschiedene Kategorien umzukodieren. Für eine Sache, müssen wir es tun, eine Variable zu einer Zeit. Statas mvdecode Befehl kommt praktisch für uns. Noch besser können wir mit dem Schlüsselwort alle auf alle Variablen im Datensatz verweisen. Gehen von fehlenden Wertcodes zu numerischen Werten Das andere Problem, das wir hier behandeln, ist, wie man fehlende Wertcodes wieder in numerische Werte umwandelt. Das Kommando mvencode ist mit dem Befehl mvdecode gekoppelt, den wir oben besprochen haben und der hier zu verwenden ist. Der Inhalt dieser Website sollte nicht als eine Bestätigung für eine bestimmte Website, Buch oder Software-Produkt von der Universität von Kalifornien ausgelegt werden. NOTICE: Die IDRE Statistical Consulting-Gruppe wird die Migration der Website, um die WordPress CMS im Februar zu erleichtern Wartung und Erstellung neuer Inhalte. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht länger erhalten bleiben. Wir werden versuchen, die Weiterleitungen so zu halten, dass die alten URLs weiterhin so gut funktionieren, wie wir können. Willkommen beim Institut für Digitale Forschung und Bildung Helfen Sie der Stat Consulting Group mit einem Geschenk STATA Learning Module Fehlende Daten 1. Einleitung Dieses Modul untersucht fehlende Daten in STATA und fokussiert auf fehlende Zahlen. Es wird beschrieben, wie fehlende Daten in Ihren Rohdaten-Dateien angezeigt werden, sowie wie fehlende Daten in STATA logischen Befehlen und Zuweisungsanweisungen behandelt werden. Wir veranschaulichen einige der fehlenden Dateneigenschaften in STATA anhand von Daten aus einer Reaktionszeitstudie mit acht Probanden, die durch die Variable id angegeben sind. Und die Reaktionszeit der Versuchspersonen wurde zu drei Zeitpunkten gemessen (Versuch1 Versuch2 Versuch3). Die Eingabedatendatei wird unten gezeigt. Sie können feststellen, dass einige der Reaktionszeiten mit einem einzigen codiert sind. Wie dies bei dem Thema 2 der Fall ist. Die Person, die die Zeit für diesen Versuch mißt, mißt die Ansprechzeit nicht richtig, daher fehlen die Daten für den zweiten Versuch. 2. Wie STATA fehlende Daten in STATA-Prozeduren verarbeitet STATA-Befehle, die Berechnungen beliebiger Art durchführen, fehlende Daten fehlen, indem die fehlenden Werte ausgelassen werden. Allerdings ist die Art und Weise, dass fehlende Werte ausgelassen werden, nicht immer konsistent über Befehle, so let39s einen Blick auf einige Beispiele. Zuerst wollen wir unsere Reaktionszeitvariablen zusammenfassen und sehen, wie STATA die fehlenden Werte behandelt. Wie Sie in der Ausgabe unten sehen, fassen Sie die Berechnungsmethode mit 4 Beobachtungen für die Studien trial1 und trial2 und 6 für trial3 zusammen. Kurz gesagt, führte der Befehl summarise die Berechnungen auf allen verfügbaren Daten durch. Ein zweites Beispiel zeigt, wie der Befehl tabulation oder tab1 fehlende Daten verarbeitet. Wie zusammengefasst, verwendet tab1 nur verfügbare Daten. Beachten Sie, dass die Prozentangaben auf der Grundlage der Gesamtzahl der nicht fehlenden Fälle berechnet werden. Möglicherweise möchten Sie, dass die Prozentwerte aus der Gesamtzahl der Beobachtungen berechnet werden sollen und der Prozentsatz für jede in der Tabelle angezeigte Variable fehlt. Dies kann durch die fehlende Option nach der Tabellierung erreicht werden. Befehlen Sie Let39s, wie der korrelierte Befehl fehlende Daten verarbeitet. Wir würden erwarten, dass es die Berechnungen auf der Grundlage der verfügbaren Daten durchführen würde, und lassen Sie die fehlenden Werte. Hier ist ein Beispiel-Befehl. Die Ausgabe ist unten. Beachten Sie, wie die fehlenden Werte ausgeschlossen wurden. Stata führt Listenlöschung und nur Anzeige Korrelation für Beobachtungen, die nicht fehlende Werte auf alle Variablen aufgeführt. Stata ermöglicht auch paarweises Löschen. Für die Beobachtungen, die nicht fehlende Werte für jedes Paar von Variablen aufweisen, werden Korrelationen angezeigt. Dies kann mit dem Befehl pwcorr gemacht werden. Wir verwenden die obs-Option, um die Anzahl der Beobachtungen anzuzeigen, die für jedes Paar verwendet werden. Wie Sie sehen können, unterscheiden sie sich je nach der Anzahl der fehlenden. 3. Zusammenfassung der fehlenden Werte in STATA-Prozeduren zusammengefasst Für jede Variable wird die Anzahl der nicht fehlenden Werte verwendet. Tabelle Standardmäßig werden fehlende Werte ausgeschlossen und Prozentsätze auf der Anzahl der nicht fehlenden Werte basieren. Wenn Sie die fehlende Option auf dem Tab-Befehl verwenden, basieren die Prozentsätze auf der Gesamtzahl der Beobachtungen (nicht fehlende und fehlende) und der Prozentsatz der fehlenden Werte werden in der Tabelle angegeben. Corr Standardmäßig werden Korrelationen basierend auf der Anzahl der Paare mit nicht fehlenden Daten (paarweises Löschen von fehlenden Daten) berechnet. Mit dem Befehl pwcorr kann angefordert werden, dass Korrelationen nur für Beobachtungen berechnet werden, für die nach dem Befehl pwcorr nicht alle fehlenden Daten vorhanden sind (löschbare Löschung fehlender Daten). Reg Wenn keine der nach dem Befehl reg aufgeführten Variablen fehlen, werden die Beobachtungen, die diesen Wert (e) fehlen, von der Analyse ausgeschlossen (d. H. Listwise Löschen von fehlenden Daten). Weitere Informationen finden Sie im STATA-Handbuch, um zu erfahren, wie fehlende Daten behandelt werden. 4. Fehlende Werte in Zuweisungsanweisungen Es ist wichtig zu verstehen, wie fehlende Werte in Zuweisungsanweisungen behandelt werden. Betrachten Sie das unten gezeigte Beispiel. Der folgende Befehl zeigt, wie fehlende Werte in Zuweisungsanweisungen behandelt werden. Die Variable sum1 basiert auf den Variablen trial1 trial2 und trial3. Wenn eine dieser Variablen fehlte, wurde der Wert für sum1 auf fehl gesetzt. Daher fehlt sum1 für die Beobachtungen 2, 3 und 4, wie dies bei der Beobachtung 7 der Fall ist. In der Regel ergeben Berechnungen mit fehlenden Werten fehlende Werte. Beispielsweise ergibt 2 2 4 2. Ausbeuten. 2 2 ergibt 1. 2 ergibt. 2 3 ergibt 6 2. Ausbeuten. Wenn Sie addieren, subtrahieren, multiplizieren, dividieren usw. Werte, die fehlende Daten beinhalten, fehlt das Ergebnis. In unserem Reaktionszeitversuch fehlt die Gesamtreaktionszeit sum1 für vier von sieben Fällen. Wir könnten versuchen, die Daten für die nicht fehlenden Versuche zu summieren, indem wir die Zeilentotalfunktion verwenden, wie im folgenden Beispiel gezeigt. Die Ergebnisse zeigen, dass sum2 nun die Summe der nicht fehlenden Studien enthält. Beachten Sie, dass die rowtotal-Funktion fehlt als Nullwert behandelt. Beim Summieren mehrerer Variablen kann es nicht sinnvoll sein, fehlende Werte als Null zu behandeln, wenn auf alle zu summierenden Variablen keine Beobachtungen fehlen. Die rowtotal-Funktion mit der fehlenden Option gibt einen fehlenden Wert zurück, wenn eine Beobachtung für alle Variablen fehlt. Andere Anweisungen funktionieren ähnlich. Wir haben zum Beispiel beobachtet, was passiert ist, wenn wir versuchen, eine mittlere Variable ohne Verwendung einer Funktion zu erstellen (wie im folgenden Beispiel). Wenn keine der Variablen trial1, trial2 oder trial3 fehlen, wird der Wert für avg1 auf fehlen gesetzt. Alternativ berechnet die rowmean-Funktion die Daten für die nicht fehlenden Tests auf dieselbe Weise wie die rowtotale Funktion. Hinweis: Gab es eine große Anzahl von Versuchen, sagen 50 Studien, dann wäre es ärgerlich, um avgrowmean (trial1 trial2 trial3 trial4.) Eingeben. Hier ist eine Verknüpfung, die Sie in dieser Situation verwenden können: Schließlich können Sie die Funktionen rowmiss und rownomiss verwenden, um die Anzahl der fehlenden und die Anzahl der nicht fehlenden Werte in einer Liste von Variablen zu ermitteln. Dies wird nachstehend erläutert. Für variable nomiss. Die Beobachtungen 1, 5 und 6 hatten drei gültige Werte, die Beobachtungen 2 und 3 hatten zwei gültige Werte, die Beobachtung 4 hatte nur einen gültigen Wert und die Beobachtung 7 keine gültigen Werte. Die Variable miss zeigt das Gegenteil, es gibt eine Anzahl der fehlenden Werte. 5. Fehlende Werte in logischen Anweisungen Es ist wichtig zu verstehen, wie fehlende Werte in logischen Anweisungen behandelt werden. Sagen Sie beispielsweise, dass Sie eine 01-Variable für trial1 erstellen möchten, die 1 ist, wenn sie 1,5 oder weniger ist, und 0, wenn sie über 1,5 liegt. Wir zeigen dies unten (falsch, wie Sie sehen werden). Es scheint, dass etwas schief gelaufen ist mit unserer neu erstellten Variablen newvar1. Den Beobachtungen mit fehlenden Werten für trial2 wurde für newvar1 eine Nullstelle zugewiesen. Let39s erforschen, warum dies geschah, indem man die Frequenztabelle von trial2 betrachtete. Wie Sie in der Ausgabe sehen können, werden fehlende Werte nach dem höchsten Wert 2.1 aufgelistet. Dies liegt daran, dass STATA einen fehlenden Wert als größtmöglichen Wert (zB positive Unendlichkeit) behandelt und dieser Wert größer als 2.1 ist, also die Werte für Newvar1 zu 0. Nachdem wir verstehen, wie STATA fehlende Werte behandelt, werden fehlende Werte explizit ausgeschlossen, um sicherzustellen, dass sie korrekt behandelt werden, wie unten gezeigt. Wie Sie im folgenden STATA-Ausgang sehen können, hat die neue Variable newvar2 fehlende Werte für Beobachtungen, die auch für trial2 fehlen. 6. Fehlende Werte in logischen Anweisungen Beim Erstellen oder Umkodieren von Variablen mit fehlenden Werten ist darauf zu achten, dass die Variable fehlende Werte enthält. 7. Für weitere Informationen Der Inhalt dieser Website sollte nicht als eine Bestätigung für eine bestimmte Website, Buch oder Software-Produkt von der Universität von Kalifornien ausgelegt werden.

No comments:

Post a Comment