Sunday, 15 October 2017

Generieren Gleit Durchschnitt Stata


Diese Datenstruktur ist für den Zweck recht untauglich. Angenommen, eine Identifikations-ID, die Sie neu formatieren müssen. z. B. Dann ist ein gleitender Durchschnitt einfach. Verwenden Sie tssmooth oder einfach nur generieren. z. B. Mehr darüber, warum Ihre Datenstruktur ganz untauglich ist: Nicht nur die Berechnung eines gleitenden Durchschnitts benötigt eine Schleife (nicht unbedingt mit egen), aber Sie würden mehrere neue Extravariablen erstellen. Mit denen in jeder nachfolgenden Analyse wäre irgendwo zwischen ungeschickt und unmöglich. EDIT Ill geben eine Probe Schleife, während nicht aus meiner Haltung, dass es schlechte Technik ist. Ich sehe keinen Grund hinter deiner Namenskonvention, wobei P1947 ein Mittelwert für 1943-1945 ist. Ich nehme an, das ist nur ein Tippfehler. Angenommen, wir haben Daten für 1913-2012. Für 3 Jahre lang verlieren wir ein Jahr an jedem Ende. Das könnte genauer geschrieben werden, auf Kosten einer Makre von Makros in Makros. Mit ungleichen Gewichten ist einfach, wie oben. Der einzige Grund, egen zu benutzen, ist, dass es nicht aufgibt, wenn es Verpassungen gibt, die das oben tun wird. Aus Gründen der Vollständigkeit ist zu beachten, dass es leicht ist, Verpassungen zu behandeln, ohne auf egen zurückzugreifen. Und der Nenner Wenn alle Werte fehlen, wird dies auf 00 reduziert oder fehlt. Andernfalls, wenn irgendein Wert fehlt, fügen wir 0 zum Zähler und 0 zum Nenner hinzu, der derselbe ist, der ihn ignoriert. Natürlich ist der Code erträglich wie oben für Durchschnitte von 3 Jahren, aber entweder für diesen Fall oder für die Mittelung über mehr Jahre, würden wir ersetzen die Zeilen oben durch eine Schleife, was ist was egen does. Stata: Datenanalyse und statistische Software Nicholas J Cox, Durham University, UK Christopher Baum, Boston College egen, ma () und seine Einschränkungen Statarsquos am offensichtlichsten Befehl für die Berechnung der gleitenden Mittelwerte ist die ma () - Funktion von egen. Angesichts eines Ausdrucks, schafft es einen - periodischen gleitenden Durchschnitt dieses Ausdrucks. Standardmäßig wird als 3. ungerade genommen. Jedoch kann, wie der manuelle Eintrag anzeigt, egen, ma () nicht mit varlist kombiniert werden:. Und aus diesem Grund allein gilt es nicht für Paneldaten. In jedem Fall steht es außerhalb des Satzes von Befehlen, die speziell für Zeitreihen geschrieben sind, siehe Zeitreihen für Details. Alternative Ansätze Um berechnende Durchschnitte für Panel-Daten zu berechnen, gibt es mindestens zwei Möglichkeiten. Beide hängen davon ab, dass der Datensatz vorher gesendet wurde. Das lohnt sich nicht nur: Sie können sich nicht nur wiederholt spezifizieren, um die Variable und die Zeitvariable zu bestimmen, aber Stata verhält sich scharf zwischen den Lücken. 1. Schreiben Sie Ihre eigene Definition mit generieren Verwenden Sie Zeitreihenoperatoren wie L. und F.. Geben Sie die Definition des gleitenden Durchschnitts als Argument einer generierten Anweisung an. Wenn Sie dies tun, sind Sie natürlich nicht auf die gleichgewichteten (ungewichteten) zentrierten gleitenden Durchschnitte, die von egen, ma () berechnet wurden, beschränkt. Zum Beispiel werden gleichgewichtete dreiseitige gleitende Durchschnitte gegeben und manche Gewichte können leicht angegeben werden: Sie können natürlich auch einen Ausdruck wie log (myvar) anstelle eines Variablennamens wie myvar angeben. Ein großer Vorteil dieses Ansatzes ist, dass Stata automatisch die richtige Sache für Panel-Daten macht: führende und nacheilende Werte werden in Panels ausgearbeitet, genauso wie Logik diktiert sie sein sollte. Der bemerkenswerteste Nachteil ist, dass die Kommandozeile ziemlich lang werden kann, wenn der gleitende Durchschnitt mehrere Begriffe beinhaltet. Ein weiteres Beispiel ist ein einseitiger gleitender Durchschnitt, der nur auf vorherigen Werten basiert. Dies könnte nützlich sein, um eine adaptive Erwartung zu schaffen, was eine Variable nur auf Informationen aktuell basiert: Was könnte jemand prognostizieren für die aktuelle Periode auf der Grundlage der letzten vier Werte, mit einem festen Gewichtung Schema (eine 4-Periode Verzögerung könnte sein Besonders häufig mit vierteljährlichen Zeiträumen verwendet.) 2. Verwenden Sie egen, filter () aus SSC Verwenden Sie den benutzerdefinierten egen-Funktionsfilter () aus dem egenmore-Paket auf SSC. In Stata 7 (aktualisiert nach dem 14. November 2001) können Sie dieses Paket installieren, nach welcher Hilfe egenmore auf Details zu filter () verweist. Die beiden obigen Beispiele würden gerendert (in diesem Vergleich ist der Generatoransatz vielleicht transparenter, aber wir sehen ein Beispiel für das Gegenteil in einem Moment.) Die Lags sind eine Numlist. Führt zu negativen Verzögerungen: In diesem Fall -11 dehnt sich auf -1 0 1 oder Blei 1, lag 0, lag 1. Die Coef ficients, eine andere numlist, multiplizieren die entsprechenden hinteren oder führenden Elemente: In diesem Fall sind diese Elemente F1.myvar . Myvar und L1.myvar Die Wirkung der Normalisierungsoption besteht darin, jeden Koeffizienten durch die Summe der Koeffizienten so zu skalieren, daß Coef (1 1 1) normalisiert ist, äquivalent zu Koeffizienten von 13 13 13 und Coef (1 2 1) Normalisierung äquivalent zu Koeffizienten von 14 12 14 ist Sie müssen nicht nur die Verzögerungen angeben, sondern auch die Koeffizienten. Weil egen, ma () den gleich gewichteten Fall liefert, ist die Hauptgrundlage für egen, filter (), den ungleich gewichteten Fall zu unterstützen, für den Sie Koeffizienten angeben müssen. Es könnte auch gesagt werden, dass die Verpflichtung der Benutzer, Koeffizienten anzugeben, ein wenig zusätzlicher Druck auf sie ist, darüber nachzudenken, welche Koeffizienten sie wollen. Die Hauptberechtigung für gleiche Gewichte ist, glauben wir, Einfachheit, aber gleiche Gewichte haben lausige Frequenzdomäneneigenschaften, um nur eine Betrachtung zu erwähnen. Das dritte Beispiel oben könnte entweder so genauso kompliziert sein wie der generierte Ansatz. Es gibt Fälle, in denen egen, filter () gibt eine einfachere Formulierung als zu generieren. Wenn Sie einen neunfristigen Binomialfilter wünschen, welche Klimatologen nützlich sind, dann sieht es vielleicht weniger schrecklich aus als und einfacher, sich richtig zu machen, genauso wie bei der generierten Annäherung egen, filter () funktioniert ordnungsgemäß mit Panel-Daten. In der Tat, wie oben erwähnt, hängt es davon ab, dass der Datensatz vorher gesendet wurde. Eine grafische Spitze Nach der Berechnung Ihrer gleitenden Durchschnitte, werden Sie wahrscheinlich wollen, um einen Graphen zu betrachten. Der benutzerdefinierte Befehl tsgraph ist schlau über Tattendatensätze. Installiere es in einem up-to-date Stata 7 von ssc inst tsgraph. Was ist mit der Abrechnung, wenn keines der obigen Beispiele von Einschränkungen Gebrauch macht. Tatsächlich wird es nicht möglich sein, Gelegentlich Menschen wollen, wenn bei der Berechnung der gleitenden Durchschnitte zu verwenden, aber seine Verwendung ist ein wenig komplizierter als es in der Regel ist. Was würden Sie von einem gleitenden Durchschnitt erwarten, mit dem berechnet. Lassen Sie uns zwei Möglichkeiten identifizieren: Schwache Interpretation: Ich möchte keine Ergebnisse für die ausgeschlossenen Beobachtungen sehen. Starke Interpretation: Ich möchte gar nicht, dass du die Werte für die ausgeschlossenen Beobachtungen nimmst. Hier ist ein konkretes Beispiel. Angenommen, als Folge von einigen, wenn Bedingung, sind Beobachtungen 1-42 enthalten, aber nicht Beobachtungen 43 auf. Aber der gleitende Durchschnitt für 42 hängt unter anderem von dem Wert für die Beobachtung ab, wenn der Durchschnitt sich rückwärts und vorwärts erstreckt und mindestens 3 beträgt, und es wird in einigen Fällen auch von einigen der Beobachtungen abhängen. Unsere Vermutung ist, dass die meisten Leute für die schwache Interpretation gehen würden, aber ob das richtig ist, egen, filter () nicht, wenn entweder. Sie können immer ignorieren, was Sie donrsquot wollen oder sogar unerwünschte Werte festlegen, um danach zu fehlen, indem Sie ersetzen. Ein Hinweis auf fehlende Ergebnisse an den Enden der Serie Weil gleitende Mittelwerte Funktionen von Verzögerungen und Leads sind, erzeugt egen, ma () fehlt, wo die Verzögerungen und Leads nicht existieren, am Anfang und am Ende der Serie. Eine Option nomiss zwingt die Berechnung von kürzeren, nicht beeinträchtigten gleitenden Durchschnitten für die Schwänze. Im Gegensatz dazu weder generieren noch egen, filter () tut, oder erlaubt, etwas Besonderes, um fehlende Ergebnisse zu vermeiden. Wenn einer der für die Berechnung benötigten Werte fehlt, fehlt dieses Ergebnis. Es liegt an den Anwendern, zu entscheiden, ob und welche Korrekturchirurgie für solche Beobachtungen erforderlich ist, vermutlich nach dem Betrachten des Datensatzes und unter Berücksichtigung einer zugrunde liegenden Wissenschaft, die zum Tragen gebracht werden kann. MOVAVG: Stata-Modul mit Mata zu generieren Moving Averages Wenn Sie eine Korrektur anfordern , Bitte erwähnen diese Artikel Handle: RePEc: boc: bocode: s457476. Siehe allgemeine Informationen zur Korrektur von Material in RePEc. Für technische Fragen zu diesem Artikel, oder um seine Autoren, Titel, Abstract, bibliographischen oder Download-Informationen zu korrigieren, wenden Sie sich an: (Christopher F Baum) Wenn Sie diesen Artikel verfasst haben und noch nicht bei RePEc registriert sind, empfehlen wir Ihnen, dies zu tun . Dies ermöglicht es, Ihr Profil mit diesem Element zu verknüpfen. Es erlaubt Ihnen auch, potenzielle Zitate zu diesem Artikel zu akzeptieren, dass wir unsicher sind. Wenn Referenzen ganz fehlen, können Sie sie mit diesem Formular hinzufügen. Wenn die vollständigen Referenzen ein Element auflisten, das in RePEc vorhanden ist, aber das System nicht mit ihm verknüpft ist, können Sie mit diesem Formular helfen. Wenn Sie von fehlenden Gegenständen wissen, die dieses zitieren, können Sie uns helfen, diese Links zu erstellen, indem wir die relevanten Referenzen in der gleichen Weise wie oben für jedes verweisende Element hinzufügen. Wenn Sie ein registrierter Autor dieses Artikels sind, können Sie auch die Registerkarte Zitate in Ihrem Profil überprüfen, da es einige Zitate gibt, die auf Bestätigung warten. Bitte beachten Sie, dass Korrekturen einige Wochen dauern können, um durch die verschiedenen RePEc-Dienste zu filtern. Weitere Dienstleistungen Folge-Serie, Zeitschriften, Autoren amp mehr Neue Papiere per E-Mail Abonnieren Sie neue Ergänzungen zu RePEc Autorenregistrierung Öffentliche Profile für Wirtschaftsforscher Verschiedene Rankings der Forschung in der Wirtschaft amp verwandte Felder Wer war ein Student von wem, mit RePEc RePEc Biblio Kuratierte Artikel amp Papiere zu verschiedenen ökonomischen Themen Hochladen Sie Ihr Papier auf RePEc aufgeführt werden und IDEAS EconAcademics Blog Aggregator für Wirtschaftsforschung Plagiate Fälle von Plagiaten in Wirtschaftswissenschaften Job Market Papers RePEc Arbeitspapier Serie gewidmet, um den Job-Markt Fantasy League Vortäuschen Sie sind an der Spitze einer Wirtschaft Abteilung Dienstleistungen von der StL Fed Daten, Forschung, apps amp mehr von der St. Louis FedOften Zeiten können wir daran interessiert sein, einen räumlichen gleitenden Durchschnitt eines charakteristischen X. Wir können diesen gleitenden Durchschnitt verwenden, um die Kontrolle über die Heterogenität in der Bevölkerung zu helfen Kann mit der räumlichen Verteilung der Beobachtungen in Zusammenhang stehen. Um dies zu tun, müssen wir eine Methode haben, ein räumliches Mittel zu erzeugen. Ich kenne dies manuell, weil ich keine Erfahrung mit räumlichen Daten in Stata habe und weiß nicht, was der eingebaute Befehl ist (vorausgesetzt, dass es einen gibt). Wenn du nur nach dem räumlichen Mittel suchst, dann kannst du den eingebauten Befehl bevorzugen. Allerdings ist diese Methode flexibel und leicht modifizierbar, wenn Sie zum Beispiel Maßnahmen über die euklidische 2D-Distanzformel hinaus verwenden möchten und stattdessen die 3D-Formel oder die nD-Formel wirklich bevorzugen. Ebenso gleitende durchschnittliche Statistik könnte leicht durch Bewegungsabweichung oder jede andere Statistik ersetzt werden, die über den Befehl egen erzeugt werden könnte. So könnte diese Übung nützlich sein, um zu prüfen, auch wenn überflüssig. Globale Nobs 1000 klarer Satz obs Nobs Generiere 2D-Koordinaten gen latt runiform () 100 gen longg runiform () 100 Generiere die Variable von Interesse. Die Variable hat eine zufällige Komponente und eine räumlich abhängige Komponente. Gen X (lattlongg) 100rnormal () zwei (Streuung latt X) (Streuung longg X) Wir können sehen, dass, obwohl es einen allgemeinen Trend zu größeren Werten als Längengrad oder Breitengrad zu erhöhen, ist es schwer, ein starkes Muster zu identifizieren. Nun können wir den gleitenden Durchschnitt von X für jede Beobachtung berechnen. (Es gibt wohl einen Befehl dafür, was ich nicht kenne). Gen Xave Gen dist Forv i1Nobs Berechnen Sie den Abstand aller Punkte von obs i ersetzen dist ((latt-latti) 2 (longg-longgi) 2) .5 Berechnen Sie den Mittelwert von X, wenn der Abstand innerhalb des interessierenden Bereichs liegt. Egen tempx mean (X) if distltmeanrange Ersetzen Sie Xave tempx, wenn ni drop tempx zwei (scatter latt Xave) (scatter longg Xave) Nun, mit Blick auf den gleitenden Durchschnitt können wir leicht visuell identifizieren die Wirkung der Lage auf den erwarteten Wert von X.

No comments:

Post a Comment