Dit datastruktuur is nogal ongeskik vir doel. Die aanvaarding van 'n identifiseerder ID wat jy nodig het om te hervorm. bv Dan is maklik 'n bewegende gemiddelde. Gebruik tssmooth of net op te wek. bv Meer oor hoekom jou datastruktuur is nogal ongeskik: Nie net sou berekening van 'n bewegende gemiddelde het 'n lus (nie noodwendig wat egen), maar jy sal skep 'n hele paar nuwe ekstra veranderlikes. Die gebruik van dié in enige daaropvolgende ontleding sal iewers tussen ongemaklike en onmoontlik wees. EDIT Siek gee 'n voorbeeld lus, terwyl dit nie die beweging van my standpunt dat dit swak tegniek. Ek dont sien 'n rede agter jou naamkonvensie waardeur P1947 is 'n gemiddelde vir 1943-1945 Ek neem aan dis net 'n tikfout. Kom ons veronderstel dat ons data vir 1913-2012. Vir middel van 3 jaar, verloor ons 'n jaar aan elke kant. Dit kan meer saaklik geskryf, ten koste van 'n vlaag van makros binne makros. Die gebruik van ongelyke gewigte is maklik, soos hierbo. Die enigste rede om egen gebruik is dat dit nie die geval tou opgooi as daar missings, wat die bogenoemde sal doen. As 'n saak van volledigheid, daarop te let dat dit maklik is om missings hanteer sonder om Egen. en die deler As alle waardes ontbreek, dit verminder tot 0/0, of ontbreek. Andersins, indien enige waarde ontbreek, ons voeg 0 tot die teller en 0 om die deler, wat dieselfde is as ignoreer dit. Natuurlik die kode is redelik soos hierbo vir gemiddeldes van 3 jaar, maar óf vir so 'n geval of vir 'n gemiddelde oor meer jare, sal ons die lyne hierbo te vervang deur 'n lus, en dit is wat egen does. Stata: Data-analise en statistiese sagteware Nicholas J . Cox, Durham Universiteit, die Verenigde Koninkryk Christopher Baum, Boston College egen, MA () en sy beperkinge Statarsquos mees voor die hand liggend bevel vir die berekening van bewegende gemiddeldes is die ma () funksie van egen. Gegewe 'n uitdrukking, dit skep 'n - periode bewegende gemiddelde van daardie uitdrukking. By verstek, is geneem as 3. moet vreemd wees. Maar, soos die handleiding inskrywing dui, egen, MA () mag nie gekombineer word met die varlist:. en, net vir hierdie rede is dit nie van toepassing op paneel data. In elk geval, dit staan buite die stel instruksies wat spesifiek vir tydreekse geskryf sien tydreekse vir meer inligting. Alternatiewe benaderings tot bereken bewegende gemiddeldes vir paneel data, is daar ten minste twee keuses. Beide is afhanklik van die dataset nadat vooraf tsset. Dit is baie moeite werd te doen: nie alleen kan bespaar jy jouself herhaaldelik spesifiseer paneel veranderlike en tyd veranderlike, maar Stata optree slim enige gapings in die data gegee. 1. Skryf jou eie definisie met behulp genereer Gebruik time-reeks operateurs soos L. en F.. gee die definisie van die bewegende gemiddelde as die argument om 'n te genereer verklaring. As jy dit doen, jy, natuurlik, nie beperk tot die gelyke gewigte (ongeweegde) gesentreer bewegende gemiddeldes bereken deur egen, MA (). Byvoorbeeld, ewe-geweeg drie-tydperk bewegende gemiddeldes sal deur gegee word en 'n paar gewigte kan maklik gespesifiseerde: Jy kan natuurlik, spesifiseer 'n uitdrukking soos log (myvar) in plaas van 'n veranderlike naam soos myvar. Een groot voordeel van hierdie benadering is dat Stata doen outomaties die regte ding vir paneel data: voorste en agter waardes uitgewerk binne panele, net soos logika dikteer hulle behoort te wees. Die mees noemenswaardige nadeel is dat die command line eerder lank kan kry as die bewegende gemiddelde behels verskeie terme. Nog 'n voorbeeld is 'n eensydige bewegende gemiddelde wat slegs gebaseer is op vorige waardes. Dit kan nuttig wees vir die opwekking van 'n aangepaste verwagting van wat 'n veranderlike sal suiwer gebaseer op inligting tot op hede: wat kan iemand voorspelling vir die huidige tydperk gebaseer op die afgelope vier waardes, met behulp van 'n vaste gewig skema (A 4-tydperk lag kan wees veral algemeen gebruik met kwartaallikse tijdreeksen.) 2. gebruik egen, filter () van SSC gebruik die gebruiker geskryf egen funksie filter () van die egenmore pakket op SSC. In Stata 7 (opgedateer na 14 November 2001), kan jy die pakket installeer deur waarna help egenmore punte om besonderhede oor filter (). Die twee voorbeelde hierbo sou word gelewer (In hierdie vergelyking genereer die benadering is dalk meer deursigtig, maar ons sal 'n voorbeeld van die teenoorgestelde in 'n oomblik sien.) Die lags is 'n numlist. lei dat negatiewe lags: in hierdie geval -1/1 brei om -1 0 1 of lei 1, lag 0, lag 1. Die Coëf ficients, 'n ander numlist, vermeerder die ooreenstemmende sloerende of leidende items: in hierdie geval die items is F1.myvar. myvar en L1.myvar. Die effek van die opsie normaliseer is aan elke koëffisiënt skaal deur die som van die koëffisiënte sodat Coëf (1 1 1) normaliseer is gelykstaande aan koëffisiënte van 1/3 1/3 1/3 en Coëf (1 2 1) normaliseer is gelykstaande om koëffisiënte van 1/4 1/2 1/4. Jy moet nie net die lags, maar ook die koëffisiënte spesifiseer. Omdat egen, MA () gee die ewe geweegde geval, die belangrikste rasionaal vir egen, filter () is om die ongelyk geweegde geval, waarvoor jy moet koëffisiënte spesifiseer ondersteun. Dit kan ook gesê word dat die verpligting om gebruikers te koëffisiënte spesifiseer 'n bietjie ekstra druk op hulle om te dink oor wat koëffisiënte wat hulle wil. Die belangrikste rede vir gelyke gewigte is, ons dink, eenvoud, maar gelyke gewigte het gemeen frekwensiedomein eienskappe, om net 'n oorweging te noem. Die derde voorbeeld hierbo kan óf waarvan net omtrent so ingewikkeld as die genereer benadering. Daar is gevalle waar egen, filter () gee 'n eenvoudiger formulering as genereer. As jy 'n nege-termyn binomiaal filter, wat klimatoloë nuttig vind wil, kyk dan miskien minder aaklig as, en makliker om reg as kry, net soos met die genereer benadering, egen, filter () werk behoorlik met paneel data. Trouens, soos hierbo genoem, dit hang af van die dataset nadat vooraf tsset. 'N Grafiese punt Na die berekening van jou bewegende gemiddeldes, sal jy waarskynlik wil hê om te kyk na 'n grafiek. Die gebruiker geskrewe tsgraph is slim oor tsset datastelle. Installeer dit in 'n up-to-date Stata 7 deur SSC Inst tsgraph. Wat van subsetting met as een van die bogenoemde voorbeelde maak gebruik van as beperkings. Om die waarheid te egen, sal ma () nie toelaat dat indien gespesifiseer word. Soms mense wil gebruik as die berekening bewegende gemiddeldes, maar die gebruik daarvan is 'n bietjie meer ingewikkeld as wat dit is gewoonlik. Wat sou jy verwag van 'n bewegende gemiddelde bereken met as. Kom ons identifiseer twee moontlikhede: Swak interpretasie: Ek dont wil enige resultate vir die uitgesluit Waarnemings sien. Sterk interpretasie: Ek dont selfs wil hê jy moet die waardes vir die uitgesluit waarnemings. Hier is 'n konkrete voorbeeld. Veronderstel as gevolg van 'n paar as voorwaarde, waarnemings 1-42 ingesluit maar nie Waarnemings 43 op. Maar die bewegende gemiddelde vir 42 sal afhang, onder andere, op die waarde vir waarneming 43 as die gemiddelde strek heen en weer en is van lengte ten minste 3, en dit sal op soortgelyke wyse afhanklik van 'n paar van die waarnemings 44 en verder in sekere omstandighede. Ons raaiskoot is dat die meeste mense sal gaan vir die swak interpretasie, maar of dit korrek is, beteken egen, filter () nie ondersteun as óf. Jy kan altyd ignoreer wat jy donrsquot wil of selfs ongewenste waardes stel om daarna ontbreek deur die gebruik van te vervang. 'N Nota oor vermiste resultate aan die einde van 'n reeks Omdat bewegende gemiddeldes is funksies van sloerings en lei, egen, MA () produseer ontbreek waar die lags en lei nie bestaan nie, aan die begin en einde van die reeks. 'N opsie nomiss dwing die berekening van korter, uncentered bewegende gemiddeldes vir die sterte. In teenstelling hiermee het nie genereer word nie egen, filter () doen, of laat, niks spesiaal ontbreek resultate te vermy. Indien enige van die waardes wat nodig is vir die berekening ontbreek, dan is dit gevolg ontbreek. Dit is aan gebruikers om te besluit of en watter korrektiewe chirurgie nodig is vir sulke waarnemings, vermoedelik na te kyk na die datastel en die oorweging van enige onderliggende wetenskap wat tot bear. In Stata gebring kan word, hoe doen ek 'n nuwe veranderlike gebaseer op bestaande data Hier volg voorbeelde van hoe om nuwe veranderlikes te skep in Stata met behulp van die gen (kort vir genereer) en egen opdragte: om 'n nuwe veranderlike te skep (bv newvar) en stel die waarde daarvan om 0. gebruik: om 'n nuwe veranderlike te skep (bv totaal) van die transformasie van bestaande veranderlikes (bv die som van v1 v2 v3 en v4...), gebruik: Alternatiewelik, gebruik egen met die ingeboude rowtotal opsie: die egen opdrag lekkernye ontbrekende waardes as 0. Om 'n veranderlike te skep (bv . avg) wat die gemiddelde van vier veranderlikes Stores (bv v1 v2 v3 en v4), gebruik:.. gebruik die / (streep) te afdeling en 'n (asterisk) vir vermenigvuldiging aan te dui. Alternatiewelik, gebruik egen met die ingeboude rowmean opsie: Stata ook kan jy voordeel van ingeboude funksies te neem vir veranderlike transformasies. Byvoorbeeld, om die natuurlike log van v1 neem en die skep van 'n nuwe veranderlike (bv v1log), gebruik: Vir meer hulp, sien die hulp lêers binne Stata (vir elk van die volgende onderwerpe, gaan die ooreenstemmende hulp bevel): Welkom by die Instituut vir digitale Navorsing en Onderwys SAS Vrae: hoe kan ek lag en lei veranderlikes in longitudinale data As jy op soek na inligting oor konsekwent eenhede van tyd (jare, kwartiere, maande), is daar dikwels belangstelling in die skep van veranderlikes op grond van hoe data vir 'n gegewe tydperk kan vergelyk word met die tydperke voor en na. As jy 'n longitudinale data, wat jy wil om te kyk oor eenhede van tyd binne 'n enkele onderwerp. Wanneer jou data in 'n lang vorm (een waarneming per keer punt per vak), hierdie kan maklik in Stata hanteer standaard veranderlike skepping stappe as gevolg van die manier waarop Stata prosesse datastelle: dit die hele datastel winkels en kan maklik na enige wys in die datastel wanneer genereer veranderlikes. SAS werk anders. SAS veranderlikes is tipies geskep deur 'n data stap waarin SAS beweeg deur die dataset, waarneming deur waarneming, die uitvoering van die berekeninge vir die gegewe waarneming en toegang tot slegs een waarneming in 'n tyd. Hierdie stelsel van die stoor van data en toegang maak dit moontlik vir SAS groot datastelle, maar ook baie moeilik om tydreekse veranderlikes in SAS behulp van 'n data stap skep analiseer. Maar processed brei bied 'n maklik-om-te gebruik alternatief vir die data stap. Kom ons begin met 'n voorbeeld dataset met slegs een vak. Die onderstaande datastel bevat Amerikaanse werkloosheid vanaf September 2006 tot Augustus 2008. Vir elke maand, ons wil die verskil tussen die tempo en die tempo van die vorige maand weet (r (i) - r (i-1)), sy koers en die tempo van die volgende maand (R (i1) - r (i)), en hierdie twee verskille ((r (i1) r (i)) - (r (i) r (i-1) ). om dit te doen, sal ons processed gebruik te brei na 'n nuwe datastel insluitend hierdie veranderlikes op te wek. In die processed brei lyn, ons sal die nuwe dataset unemplaglead noem. ons dui daarop dat ons nie wil die waardes te transformeer (met behulp van 'n spline, byvoorbeeld), maar net om die ongetransformeerde data van die gespesifiseerde rekord gryp. ons dui daarop dat ons tyd reeks word gedefinieer volgens datum in die ID-lyn en in die drie omskep lyne, skep ons die drie waardes wat ons wil hê vir elke keer punt in ons data: die tempo, die vorige koers (ratelag1), en die volgende koers (ratelead1) in elke lyn, ons vertel SAS die naam van die veranderlike in ons nuwe dataset, die tipe transformasie (lag lei.) en die getal. tyd punte om terug of vorentoe vir die transformasie (1 in hierdie voorbeeld) lyk. Ons kan die gevolglike dataset sien. Op grond van hierdie datastel, kan ons nou maklik bereken die drie tydreekse veranderlikes ons vroeër beskryf. Maar wat as ons het data vir verskeie lande Die dataset hieronder bevat werkloosheid data van 2000-2005 vir drie lande. Ons wil lag in elke land te skep en lei veranderlikes. Om dit te doen, kan ons processed gebruik te brei met 'n deur verklaring na sortering op land. Met processed uit te brei. Jy kan ook genereer bewegende gemiddeldes, splines, en geïnterpoleer waardes. Vir meer besonderhede, sien die processed brei bladsye van die SAS Online Documentation. Stata vir Navorsers: werk met groepe Dit is deel ses van die Stata vir Navorsers reeks. Vir 'n lys van onderwerpe gedek deur hierdie reeks, sien die Inleiding. As jy nuut is tot Stata ons raai lees die artikels in orde is. Take wat vereis werk met groepe is algemeen en kan wissel van die baie eenvoudige (quotCalculate die gemiddelde mpg van die binnelandse motors en die buitelandse motors separatelyquot) om die baie komplekse (quotModel studente se prestasie op 'n gestandaardiseerde toets, met inagneming dat die studente is gegroepeer in klasse wat is gegroepeer in skole wat gegroepeer in districts. quot). Gelukkig werk met groepe is een van Statas grootste sterkpunte. In hierdie artikel goed bespreek gereedskap vir die werk met groepe, en op dieselfde tyd probeer om jou meer ervaring te gee met behulp van Statas sintaksis om bruikbare resultate te kry. In die volgende afdeling (Hiërargiese Data) en stel 'n teoretiese raamwerk vir denke oor gegroepeerde data, maar dit sal meer sin maak as youve het 'n paar ondervinding in die werk met groepe eerste. Wel begin deur te gaan deur 'n paar basiese gereedskap wat gebruik word vir die werk met groepe, en 'n paar truuks vir die gebruik van hulle. Deur dit te doen goed gebruik maak van een van die voorbeeld datastelle vir hierdie reeks, households. dta. Maak seker dat jy die lêers van X kopieer: SSCC TutorialsStataResearch of afgelaai het. en sit dit in 'n gerieflike plek soos U: StataResearch. Maak seker dat jou huidige werk gids is ingestel na die plek (of waar jy sit dit). Dan begin 'n doen-lêer: duidelik al vang log naby stel meer af log behulp groups1.log, vervang Youll wil om jou hardloop nie lêer dikwels in hierdie afdeling. Oorweeg die behoud van 'n data venster oop sodat jy maklik kan sien wat die doen lêer doen om jou data. Hierdie datastel bevat inligting oor twintig fiktiewe mense wat in ses verskillende huishoudings woon. Dit datastruktuur is een van die mees algemene teëgekom by die SSCC. Een veranderlike wat verduideliking vereis is rel2head. of quotrelationship aan die hoof van household. quot Dit is 'n kategoriese veranderlike wat neem op drie waardes, met waarde vir etikette aangewend. Tik etiket lys om hulle te sien. Dit is tipies van die werklike wêreld data (behalwe werklike data gewoonlik baie meer soorte verhoudings). Deur Die belangrikste instrument vir die werk met groepe is deur. Onthou dat as jy deur varlist. voordat 'n bevel, sal Stata eerste opbreek die opstel in een groep vir elke waarde van die veranderlike (of elke unieke kombinasie van die deur veranderlikes as Theres meer as een) data, en dan loop die opdrag afsonderlik vir elke groep. Vir verdere hersiening, sien die artikel deur in gebruik en Sintaksis. Hier is 'n paar voorbeelde van dinge wat jy kan doen met die. Berekening van opsommingstatistiek Oor Groepe Vind die gemiddelde ouderdom van die volwassenes in elke huishouding: deur huisgesin som ouderdom as agegt18 (Jy kan dieselfde resultate meer kompak met blad huishouding kry as agegt18, som (ouderdom)) Bewaar die totale huishoudelike inkomste in 'n nuwe veranderlike: deur huisgesin egen householdIncometotal (inkomste) Let daarop dat householdIncome is dieselfde vir al die individue woon in 'n gegewe huishouding. Dis omdat sy 'n kenmerk van die huishouding, nie die individu. Wel praat meer oor hierdie onderskeid in Hiërargiese Data. Die identifisering van kenmerke van 'n groep skep 'n aanwyser vir of 'n huishouding het kinders of nie, ongeag aantal: gen kind (agelt18) deur huisgesin egen hasChildrenmax (kind) As 'n huishouding het geen kinders, sal die maksimum waarde van kind wees nul. As dit enige glad, sal die maksimum een wees. In hierdie geval, kind is geneig om 'n nuttige veranderlike in eie reg wees. Maar as jy didnt dit nodig het, kan jy die hele proses te doen in een lyn met: deur huisgesin egen hasChildrenmax (agelt18) Nou in plaas van om die maksimum van 'n veranderlike, jy vind die maksimum van 'n uitdrukking, maar die resultaat is dieselfde : die maksimum sal een vir die hele huishouding wees as 'n huisgesin het geen kinders daarin en nul anders. Tel waarnemings wat Ontmoet 'n Toestand Vind die aantal kinders in elke huishouding: deur huisgesin egen numChildrentotal (kind) Hier neem ons voordeel van die feit dat die totaal van 'n aanwyser veranderlike is die aantal waarnemings waarvoor die aanwyser veranderlike is waar. Weereens, kan totale (kind) gewees totale (agelt18). Gevolg verspreiding van Gestel ons moet die gemiddelde ouderdom van die volwassenes te stoor in elke huishouding as 'n veranderlike. Die voor die hand liggend beginpunt sou wees: deur huisgesin egen meanAdultAgemean (ouderdom) as agegt18 egter meanAdultAge ontvang 'n vermiste vir al die kinders in die datastel. Dis omdat die as voorwaarde doen twee dinge in hierdie opdrag: dit beheer wat wat waarnemings word gebruik in die berekening van die gemiddelde gestoor word in meanAdultAge. maar ook wat waarnemings wat beteken gestoor in. As ons die huishoudings nodig meanAdultAge om beskikbaar te wees in al die waarnemings vir daardie huishouding (en ons gewoonlik doen), dan moet ons die resultaat quotspreadquot om die ander waarnemings. deur huisgesin egen tempmean (meanAdultAge) drop meanAdultAge hernoem temp meanAdultAge Al die waarnemings in elke huishouding wat 'n waarde vir meanAdultAge het dieselfde waarde. So het die gemiddelde () funksie gee terug wat value8212but dit doen dit vir al die waarnemings in die huishouding. (Onthou dat wanneer gemiddelde () ondervind ontbrekende waardes dit in wese ignoreer hulle en bereken die gemiddelde van die nie-ontbrekende waardes.) So het die temp veranderlike bevat die korrekte waarde van meanAdultAge vir alle waarnemings, volwassenes en kinders. Ons het toe daal die ou meanAdultAge veranderlike en die naam van tydelike meanAdultAge. As ons beplan vooruit kan ons 'n reël van die kode in vergelyking met die bogenoemde red: deur huisgesin egen tempmean (ouderdom) indien agegt18 deur huisgesin egen meanAdultAgemean (tydelike) drop temp Dit is soms genoem quotspreadingquot gevolg: as jy die regte kan vind beantwoord vir 'n paar van die waarneming in 'n groep, kan jy dan versprei dit na die ander. Wat jy kan doen die verspreiding van enige van verskeie Egen funksies: min (). Max (). ens, maar gemiddelde () is miskien die mees intuïtief. Oefeninge Skep 'n aanduiding veranderlike vir kinderlose huishoudings met behulp van die NUMCHILDREN veranderlike jy vroeër geskep. Verdedig jou keuse of om te gebruik deur in die proses. (Oplossing) Vind die ouderdom van die jongste volwasse in elke huishouding ten tyde van hul eerste kind gebore is. (Wenk: dit is 'n kenmerk van die huishouding, nie 'n individu.) (Oplossing) Vind die gemiddelde huishoudelike inkomste van mense in enkelouer-huishoudings en twee-ouer gesinne. (Oplossing) N en N meeste Stata opdragte is eintlik lusse: iets te doen om waarneming een, doen dit dan waarneming twee en dies meer. Soos Stata werk deur middel van hierdie lus, dit spore wat waarneming dit is besig met 'n interne veranderlike N genoem. Jy is welkom om hierdie veranderlike te gebruik in jou opdragte: sal slegs 'n lys van waarneming vyf, want die toestand N5 is net waar wanneer Stata is besig met waarneming vyf. N raak selfs meer bruikbaar wanneer dit gekombineer met die. Veronderstel jy wil 'n lys van die eerste waarneming in elke huishouding: deur huishouding: l as N1 Dit gebeur net so dat die eerste waarneming is die hoof van die huishouding in elke geval, wat nie ongewoon is. Maar wat as plaas van om rel2head jy net geweet het die hoof van die huishouding deur hul plek in die huishouding Dan youd moet baie versigtig wees oor die sortering te wees. Statas verstek soort algoritme is nie quotstable, quot betekenis dat as jy sorteer op huishoudelike dit kan die einde van waarnemings in die huishouding verander. As die volgorde van waarnemings sake, moet jy die stabiele opsie voeg tot enige soort opdragte. Op dié manier Stata sal 'n ander soort algoritme wat stadiger, maar sal die einde van waarnemings nie verander binne 'n groep te gebruik. Maar gedoen dat jy altyd die hoof van die huishouding kan identifiseer met 'n kombinasie van die huisgesin, en indien N1. Nog 'n interne veranderlike, N. bevat die aantal waarnemings in die datastel. Dit is ook die waarneming getal van die laaste waarneming. Jy kan dit gebruik in opdragte nes N: deur huishouding: l as NN Dit bevat 'n lys van die laaste waarneming in elke huishouding. Die skep Binne-Groep Identifiseerders Dikwels sal jy wil 'n binne-groep identifiseerder het, sodat jy altyd kan vertel wat waarneming is wat, selfs nadat 'n verkeerde soort. In hierdie geval kan die binne-groep identifiseerder logies genoem persoon: deur huisgesin gen perso - Die persoon veranderlike binne hul huishouding sal stem ooreen met die waarneming van die persoon in die huidige volgorde. As jy 'n globaal unieke identifiseerder wou, hardloop die bogenoemde opdrag sonder deur huishouding. Dit vind van die grootte van 'n groep soos n. N vereer deur groepe. So N bevat die aantal waarnemings in die deur 'n groep tans gewerk. Jy kan maklik huishouding grootte met: deur huisgesin gen sizeN Onderskrifte Oorweeg die opdrag: In die uitvoering daarvan, Stata kyk na een waarneming in 'n tyd, en stel newIncome vir daardie waarneming gelyk aan inkomste vir dieselfde waarneming. Onderskrifte kan jy kyk na die waarde van 'n veranderlike vir enige waarneming jy wil. Probeer: income1 beteken quotthe waarde van inkomste vir waarneming 1.quot So sal newIncome2 wees 60,000 vir alle waarnemings (nie dat dit is 'n nuttige gevolg). Versprei Eienskappe van 'n Spesiale Waarneming Oorweeg probeer om die vroulike hoof van huishoudings te identifiseer: deur huisgesin gen femaleHeadfemale1 Sedert die eerste persoon in elke huishouding is die kop, die huishouding 'n vroulike hoof as en slegs as die eerste persoon is vroulike. Wat gebeur as die hoof van die huishouding was verlede in plaas van eerste verander dit net na: deur huisgesin gen femaleHeadfemaleN Wat gebeur as die hoofde van huishoudelike werent in 'n besondere plek in die huishoudelike gebruik sorteer hulle die eerste persoon in die huishouding te maak: soort huishouding rel2head deur huisgesin gen femaleHeadfemale1 Wat gebeur as die kode vir quothead van householdquot werent die laagste waarde van rel2head. Die volgende sal altyd werk: gen isHead (rel2head1) soort huishouding isHead deur huisgesin gen femaleHeadfemaleN Wat gebeur as sommige huishoudings het nie 'n kop, en wat jy nodig het femaleHead vermis vir diegene huishoudings Doen die bogenoemde, maar voeg 'n as voorwaarde tot die laaste lyn: deur huisgesin gen femaleHeadfemaleN as isHeadN Hierdie algemene metode enige tyd wat jy nodig het om te kies uit die eienskappe van 'n spesiale ry binne 'n groep (die respondent 'n opname, die maand waarin 'n onderwerp gegradueer, ens) sal werk: Skep 'n aanduiding veranderlike wat is een van die spesiale ry en nul vir alle ander rye Sorteer volgens die groep ID en die nuwe aanwyser veranderlike die spesiale ry sal laaste wees en kan verkry word met n solank as wat jy begin deur as jy die spesiale wil waarneming eers eerder as verlede wees, kan jy gsort (veralgemeen soort) te gebruik: gsort huishoudelike - isHead met gsort jy 'n minusteken voor 'n veranderlike naam kan sit en die waarnemings sal gesorteer word in dalende orde deur daardie veranderlike eerder as stygende . Kontroleer of 'n veranderlike wissel binne 'n Groep Die householdIncome veranderlike moet dieselfde waarde vir al die individue binne 'n gegewe huishouding het. Jy kan kyk wat met: soort huishouding householdIncome deur huisgesin beweer householdIncome1householdIncomeN Omdat die waarnemings in 'n huisgesin gesorteer volgens householdIncome. die kleinste waarde sal eerste wees en die grootste waarde sal laaste wees. As die eerste en laaste waardes is dieselfde, dan weet jy al die waardes is dieselfde. Oefeninge Hoe kan jy seker maak dat elke huishouding het een en net een hoof van die huishouding (oplossing) Skep 'n aanduiding veranderlike vir of 'n huishoudings waarde van ouderdom wissel. Gebruik dit om net diegene huishoudings wie se ouderdom nie wissel blaai. (Oplossing) berekeninge gebaseer op 'n Waarnemings Bure Onderskrifte kan wiskundige uitdrukkings, insluitend N en N bevat. Begin 'n nuwe te doen lêer wat die datastel genoem skole laai. Dit bevat inskrywingsgetalle vir tien fiktiewe (en nie vreeslik geloofwaardige) skole. Wel definieer 'n studente portuurgroep as almal in haar graad, die graad bo haar, en die graad onder haar. Om die grootte van elke grade portuurgroep vind, tik die volgende: deur skool: gen peerGroupstudentsstudentsn1studentsn-1 Die gevolg ontbreek vir graad een, want dit 'n graad nie die geval het voordat dit, en vir graad twaalf omdat dit nie die geval het 'n graad nadat dit. So studentsn-1 of studentsn1 gee ontbrekende waardes vir hulle. Gelukkig Stata 'n vermiste waarde in sulke gevalle terug net eerder as om 'n quotindex uit boundsquot fout of iets soortgelyks. Oefeninge Wat sou gebeur as jy deur die skool verlaat het: in: die skool: gen peerGroupstudentsstudentsn1studentsn-1 Wat sal gebeur as 'n paar skole 'n waarneming vir 'n paar grade (oplossing) Implementering van 'n uitgebreide definisie van peerGroup waar die die maats van die eerste skrapers didnt het en die eerste en tweede skrapers, en die portuurgroep van die twaalfde skrapers is die elfde en twaalfde skrapers (dws die ontbrekende waardes vul). (Oplossing) Panel Data paneel data, of data met verskeie individue verskeie kere waargeneem kan word behandel soos gegroepeerde data selfs al is 'n quotgroupquot in hierdie geval is 'n individu. (Dit is die rede waarom meer algemene terme in Hiërargiese Data stel ons.) Begin 'n ander lêer wat 'n datastel genoem indiensneming laai nie. Dit bestaan uit vyf mense waargeneem vir twintig maande, met elke status persone indiensneming aangeteken elke maand. Identifisering Spel 'n Tipiese persoon in hierdie paneel is in diens vir 'n rukkie, dan is werkloos vir 'n rukkie, ens Elke tydperk van aaneenlopende diens of werkloosheid is 'n quotspellquot en 'n gemeenskaplike eerste taak met soveel data genoem is om die spel te identifiseer. Begin deur die identifisering van die maande wat 'n nuwe spel begin, dit wil sê die maande waar 'n status persone indiensneming is anders as wat dit was die vorige maand: deur persoon: gen begin (employedemployedn-1) Vir die eerste maand waarin 'n persoon waargeneem word, die hoeveelheid employedn-1 bestaan nie en is dus ontbreek. Sedert diens nooit ontbreek (hoe sou jy dit nagaan) hierdie waarborg dat die eerste maand 'n persoon waargeneem word gemerk as die begin van 'n nuwe spel. Volgende kom iets wat jy moet by jou sak truuks: deur persoon: gen spellsum (begin) Die som () funksie vind hardloop somme, dit wil sê die som van 'n veranderlike vir alle waarnemings tot en met die huidige waarneming. Sedert begin is een wanneer 'n spel begin en 'n nul anders, som (begin) vir 'n waarneming is die aantal uitspel wat tot begin om daardie point8212and wat dien as 'n uitstekende spel ID. Sodra youve geïdentifiseer die spel, kan jy dit hanteer as groepe. Maar hierdie spel ID's net sin maak binne die konteks van 'n persoon (elke persoon het hul eie spel nommer een). So het die behoorlike deur is deur iemand spel. en die eerste keer dat jy dit gebruik het sal jy na bysort sê. Maar alles youve geleer steeds van toepassing. Byvoorbeeld, die vind van die duur van 'n spel is presies soos die vind van die grootte van 'n huisgesin bysort persoon spel: gen durationN Oefeninge Dink terug aan die opdrag: deur persoon: gen begin (employedemployedn-1) Wat sou gebeur as jy die deur uitgelaat . (Oplossing) veranderlikes bevat die begin maand te skep, jaar, einde maand en einde van die jaar vir elke spel. (Oplossing) Vind die gemiddelde spel lengte vir elke persoon. Maak seker dat die gemiddelde word bereken oor uitspel, nie maande. (Oplossing) Laaste Hersiene: 2016/01/04
No comments:
Post a Comment