Thursday 12 October 2017

Come Inserire I Dati Mancanti Nel Forex Stata


AVVISO: Il gruppo di consulenza Idre statistica sarà la migrazione del sito web per il CMS WordPress nel mese di febbraio per facilitare la manutenzione e la creazione di nuovi contenuti. Alcune delle nostre pagine più vecchie verranno rimossi o archiviati in modo tale che essi non saranno più mantenuti. Cercheremo di mantenere i reindirizzamenti in modo che i vecchi URL continueranno a lavorare nel miglior modo possibile. Benvenuti al Istituto per la ricerca e l'istruzione digitale Aiuto Consulting Group Stat dando un regalo Stata modulo di apprendimento inserire i dati in Stata Questo modulo mostrerà come immettere i dati in Stata. Questo copre inserendo i dati con delimitato da virgole, delimitato da tabulazioni, spazio delimitato, e dati di colonna fisse. Nota . tutti i file di input di esempio per questa pagina sono stati creati da noi e non sono inclusi con Stata. È possibile creare voi stessi di provare questo codice da copiare e incollare i dati in un file di testo. 1. Dati Digitando nel editor di Stata Uno dei metodi più semplici per ottenere i dati in Stata sta utilizzando l'editor dei dati Stata, che assomiglia a un foglio di calcolo di Excel. È utile quando i dati sia su supporto cartaceo e deve essere digitato, o se i dati sono già digitato in un foglio di calcolo di Excel. Per ulteriori informazioni su l'editor dei dati Stata, vedere il modulo di modifica. 2. Commatab di file separati con i nomi delle variabili on line 1 Due formati di file comuni per i dati grezzi sono separati da virgole file e scheda i file separati. Tali file vengono comunemente realizzati in fogli di calcolo come Excel. Si consideri il file delimitato da virgole illustrato di seguito. Questo file ha due caratteristiche: - La prima linea ha i nomi delle variabili separati da virgole, - Le seguenti linee sono i valori per le variabili, separate anche da virgole. Questo tipo di file può essere letto utilizzando il comando insheet, come illustrato di seguito. Siamo in grado di verificare se i dati è venuto a destra utilizzando il comando list. Dal momento che si dovrà probabilmente più osservazioni, è possibile utilizzare in per elencare solo un sottoinsieme di osservazioni. Qui di seguito, riportiamo le osservazioni da 1 a 3. Ora che il file è stato letto in Stata, è possibile salvarlo con il comando di salvataggio (che salterà fare questo passo). Lo stesso comando esatto insheet potrebbe essere usato per leggere un file delimitato da tabulazioni. Il comando insheet è intelligente, perché può capire se si dispone di una virgola delimitato o scheda file delimitato, e poi leggerlo. (Tuttavia, insheet non poteva gestire un file che utilizza una miscela di virgole e tabulazioni come delimitatori.) Prima di iniziare la sezione successiva, permette di sgombrare i dati esistenti in memoria. 3. Commatab immagine (nomi delle variabili nel file) Consideriamo un file che è identico a quello che abbiamo esaminato nella sezione precedente separato, ma non hanno i nomi delle variabili sulla linea 1 Questo file può essere letto utilizzando il comando insheet come mostrato sotto. Ma da dove Stata ottenere i nomi delle variabili Se Stata non ha nomi per le variabili, è nomi li v1. v2. v3, ecc, come potete vedere qui sotto. Consente chiaro i dati in memoria, e quindi provare a leggere nuovamente i dati. Ora, consente di provare a leggere i dati e di 'Stata i nomi delle variabili sul comando insheet. Come L'elenco mostra comando, Stata usato i nomi delle variabili in dotazione sul comando insheet. Il comando insheet funziona altrettanto bene sui file che utilizzano le schede come separatori. Stata esamina il file e determina se le virgole o tabulazioni vengono utilizzati come separatori e legge il file in modo appropriato. Ora che il file è stato letto in Stata, è possibile salvarlo con il comando di salvataggio (che salterà fare questo passo). Consente chiaro i dati in memoria prima di passare alla sezione successiva. file separato da 4. Spazio Consideriamo un file in cui le variabili sono separate da spazi come quello mostrato qui sotto. Si noti che la marca di auto è contenuta tra virgolette. Ciò è necessario perché i nomi contengono spazi all'interno di essi. Senza le virgolette, Stata potrebbe pensare AMC è la marca e il Concord è il mpg. Se la marca non ha avuto spazi incorporati al loro interno, non sarebbero necessarie le virgolette. Questo file può essere letto con il comando infile come illustrato di seguito. Si può chiedere se stessi, dove ha fatto il str13 provengono da Dal momento che facciamo è una variabile di carattere, abbiamo bisogno di dire Stata che si tratta di una variabile di carattere, e per quanto tempo può essere. Il str13 dice Stata è una variabile str ING e che potrebbe essere di larghezza fino a 13 caratteri. Il comando lista conferma che i dati sono stati letti correttamente. Ora che il file è stato letto in Stata, è possibile salvarlo con il comando di salvataggio (che salterà fare questo passo). Consente chiaro i dati in memoria prima di passare alla sezione successiva. 5. file di formato fisso consideri un file utilizzando i dati delle colonne fisse come quella mostrata qui sotto. Si noti che le variabili sono chiaramente indicati dalla quale colonna (s) si trovano. Si noti inoltre che la marca della vettura non è contenuta tra virgolette. Le citazioni non sono necessari perché le colonne definiscono in cui la marca inizia e finisce, e gli spazi incorporati non creano più confusione. Questo file può essere letto con il comando infisso come illustrato di seguito. Anche in questo caso abbiamo bisogno di dire Stata che fanno è una str ing variabile facendo precedere fare con str. Non abbiamo bisogno di indicare la lunghezza dal Stata può dedurre che marca può essere largo fino a 13 caratteri in base alle posizioni delle colonne. Il comando lista conferma che i dati sono stati letti correttamente. Ora che il file è stato letto in Stata, è possibile salvarlo con il comando di salvataggio (che salterà fare questo passo). Consente chiaro i dati in memoria prima di passare alla sezione successiva. 6. Altri metodi di ottenere dati in Stata Questo non copre tutti i possibili metodi di ottenere dati grezzi in Stata, ma non copre molte situazioni comuni. Vedere la Guida Utenti Stata per informazioni più complete sulla lettura dei dati grezzi in Stata. Un altro metodo che va menzionato è l'uso di programmi di conversione di dati. Questi programmi possono convertire i dati da un formato di file in un altro formato di file. Ad esempio, si potrebbe creare direttamente un file Stata da un foglio di calcolo Excel, un foglio di calcolo Lotus, un database di Access, un database dBase, un file di dati SAS, un file system SPSS, ecc Due esempi sono Stat Trasferimento e DBMS copia. Entrambi questi prodotti sono disponibili sui PC SSC e DBMS copia è disponibile su Nicco e Aristotele. Infine, se si utilizza Nicco, Aristotele o Cluster RS6000, c'è un comando specifico per la conversione dei dati SAS in Stata chiamata sas2stata. Se si dispone di dati SAS si desidera convertire in Stata, questo può essere un modo utile per ottenere i dati SAS in Stata. 7. Sintesi Portare l'editor dei dati Stata per la digitazione dei dati. Leggere in virgola o file delimitato scheda denominata auto2.raw prendendo i nomi delle variabili dalla prima riga di dati. Leggere in virgola o file delimitato scheda denominata auto3.raw nominare le variabili mpg peso e prezzo. Leggere il file chiamato auto4.raw spazio separato. Il make variabile è circondato da virgolette perché si è integrato spazi vuoti. Leggere nel file di formato fisso denominato auto5.raw. Altri metodi DBMSCopy, trasferimento Stat, sas2stata, e la Guida Stata utenti. Il contenuto di questo sito web non deve essere interpretata come un'approvazione di un particolare sito web, il libro, o di un prodotto software dall'Università di California. NOTICE: Il gruppo di consulenza Idre statistica sarà la migrazione del sito web al CMS WordPress nel mese di febbraio per facilitare mantenimento e la creazione di nuovi contenuti. Alcune delle nostre pagine più vecchie verranno rimossi o archiviati in modo tale che essi non saranno più mantenuti. Cercheremo di mantenere i reindirizzamenti in modo che i vecchi URL continueranno a lavorare nel miglior modo possibile. Benvenuti al Istituto per la ricerca e l'istruzione digitale Aiuto Consulting Group Stat dando un dono modulo di apprendimento STATA dati mancanti 1. Introduzione Questo modulo esplorerà i dati mancanti in STATA, concentrandosi su dati mancanti numerici. Essa descriverà come indicare i dati mancanti nei file di dati grezzi, così come la quantità di dati mancanti vengono gestiti nei comandi logici STATA e istruzioni di assegnazione. Illustreremo alcune delle proprietà dei dati mancanti in STATA utilizzando i dati di uno studio di tempo di reazione con otto soggetti indicati dalla id variabile. ed i tempi di reazione dei soggetti sono stati misurati in tre punti temporali (trial1 trial2 trial3). Il file di dati di input è mostrato sotto. Si potrebbe notare che alcuni dei tempi di reazione sono codificati utilizzando un singolo. come è il caso per il soggetto 2. L'tempo di misura per quel processo non misurare il tempo di risposta corretta, pertanto i dati per il secondo processo è mancante. 2. Come STATA gestisce i dati mancanti nelle procedure STATA Come regola generale, i comandi STATA che eseguono i calcoli di qualsiasi tipo maniglia dati mancanti omettendo i valori mancanti. Tuttavia, il modo in cui i valori mancanti vengono omessi non è sempre coerente attraverso i comandi, in modo da let39s dare un'occhiata a qualche esempio. In primo luogo, let39s riassumere le nostre variabili i tempi di reazione e vedere come STATA gestisce i valori mancanti. Come si vede nella uscita in basso, riassumere mezzi calcolati utilizzando 4 osservazioni per trial1 e trial2 e 6 osservazioni per trial3. In breve, il comando Riassumere eseguito i calcoli su tutti i dati disponibili. Un secondo esempio, mostra come il comando di tabulazione o tab1 gestisce i dati mancanti. Come riassumere, tab1 utilizza i dati appena disponibili. Si noti che le percentuali sono calcolate in base al numero totale di casi non mancanti. È possibile che si potrebbe desiderare percentuali da calcolate rispetto al numero totale di osservazioni, e la percentuale mancante per ciascuna variabile riportati nella tabella. Ciò può essere ottenuto includendo l'opzione mancante dopo la tabulazione. comando, Let39s un'occhiata a come il comando correlato gestisce i dati mancanti. Ci si aspetterebbe che sarebbe eseguire i calcoli sulla base dei dati disponibili, e omettere i valori mancanti. Ecco un esempio del comando. L'uscita è mostrato di seguito. Si noti come sono stati esclusi i valori mancanti. Stata eseguirà listwise eliminazione e solo la correlazione di visualizzazione per le osservazioni che hanno valori non mancanti su tutte le variabili elencate. Stata consente anche per l'eliminazione a coppie. Le correlazioni sono visualizzati per le osservazioni con valori non mancanti per ciascuna coppia di variabili. Questo può fare utilizzando il comando pwcorr. Usiamo l'opzione obs per visualizzare il numero di osservazione utilizzato per ogni coppia, come si può vedere, si differenziano a seconda della quantità di perdere. 3. Sintesi di come i valori mancanti vengono gestiti nelle procedure STATA riassumere Per ogni variabile, vengono utilizzati il ​​numero di valori non mancanti. tabulazione Per impostazione predefinita, i valori mancanti vengono esclusi e le percentuali si basano sul numero di valori non mancanti. Se si utilizza l'opzione mancante sul comando scheda, le percentuali sono basate sul numero totale di osservazioni (non mancanti e mancanti) e la percentuale di valori mancanti sono riportati nella tabella. corr Per impostazione predefinita, le correlazioni sono calcolate in base al numero di coppie con dati non mancanti (soppressione a due a due dati mancanti). Il comando pwcorr può essere utilizzato per richiedere che le correlazioni essere calcolati solo per le osservazioni che hanno dati non mancanti per tutte le variabili elencate dopo il comando pwcorr (listwise cancellazione dei dati mancanti). reg Se una delle variabili elencate dopo il comando reg mancano, le osservazioni mancanti quel valore (s) sono esclusi dall'analisi (cioè listwise cancellazione dei dati mancanti). Per le altre procedure, consultare il manuale STATA per informazioni su come i dati vengono gestiti quelli mancanti. 4. Valori mancanti in istruzioni di assegnamento E 'importante capire come i valori mancanti vengono gestiti in istruzioni di assegnazione. Si consideri l'esempio riportato di seguito. Il comando elenco che segue illustra come valori mancanti vengono gestiti in istruzioni di assegnazione. Il sum1 variabile è basata sulle variabili trial2 trial1 e trial3. Se una qualsiasi di queste variabili erano mancanti, il valore per sum1 è stato impostato su mancante. Pertanto sum1 manca per le osservazioni 2, 3 e 4, come è il caso per l'osservazione 7. Come regola generale, i calcoli che coinvolgono valori mancanti producono valori mancanti. Ad esempio, 2 2 rendimenti 4 2. i rendimenti. 2 2 rendimenti 1. 2 rendimenti. 2 3 6 2 rendimenti. i rendimenti. ogni volta che si aggiunge, sottrarre, moltiplicare, dividere, ecc valori che coinvolgono dati mancanti, il risultato è mancante. Nel nostro esperimento tempo di reazione, la sum1 totale tempo di reazione non è presente per quattro su sette casi. Potremmo provare per un totale di dati per le prove non mancanti utilizzando la funzione rowtotal come mostrato nell'esempio seguente. I risultati sotto riportati evidenziano che sum2 ora contiene la somma delle prove non mancanti. Si noti che la funzione rowtotal tratta mancante come un valore zero. Quando si sommano diverse variabili che non può essere ragionevole per il trattamento mancante come zero se un osservazioni manca su tutte le variabili da sommare. La funzione rowtotal con l'opzione mancante restituirà un valore mancante Se un'osservazione è presente su tutte le variabili. Altre dichiarazioni funzionano in modo simile. Ad esempio, osservato cosa è successo quando si cerca di creare una variabile media senza l'utilizzo di una funzione (come nell'esempio qui sotto). Se una delle variabili trial1, trial2 o trial3 sono mancanti, il valore per avg1 sono impostati a mancare. In alternativa, le medie funzione rowmean i dati per le prove non mancanti nello stesso modo come la funzione rowtotal. Nota: Had gran numero ci sono state delle prove, dire 50 prove, allora sarebbe fastidioso dover digitare avgrowmean (trial1 trial2 trial3 trial4.). Qui è una scorciatoia è possibile utilizzare in questo tipo di situazione: Infine, è possibile utilizzare le funzioni rowmiss e rownomiss per determinare il numero dei dispersi e il numero di valori non mancanti, rispettivamente, in un elenco di variabili. Questo è illustrato di seguito. Per nomiss variabile. osservazioni 1, 5 e 6 avevano tre valori validi, osservazioni 2 e 3 ha avuto due valori validi, osservazione 4 aveva un solo valore valido e l'osservazione 7 non ha avuto valori validi. La mancanza variabile dimostra il contrario, fornisce un conteggio del numero di valori mancanti. 5. Valori mancanti nelle istruzioni logiche E 'importante capire come i valori mancanti vengono gestiti nelle dichiarazioni logiche. Ad esempio, dire che si desidera creare una variabile 01 per trial1 che è 1 se è 1.5 o meno, e 0 se è superiore a 1,5. Mostriamo questo qui di seguito (in modo non corretto, come si vedrà). Sembra che qualcosa è andato storto con il nostro newvar1 variabile appena creata. Le osservazioni con valori mancanti per trial2 sono stati assegnati uno zero per newvar1. Let39s esplorare il motivo per cui questo è accaduto, cercando al tavolo frequenza trial2. Come si può vedere in uscita, valori mancanti sono al elencato dopo il valore più alto 2.1 Questo perché STATA considera un valore mancante come il più grande valore possibile (per esempio positivo infinito) e che il valore è maggiore di 2,1, così poi i valori per newvar1 diventano 0. Ora che abbiamo capito come tratta STATA valori, ci sarà esplicitamente escludere i valori mancanti mancanti per assicurarsi che essi sono trattati correttamente, come illustrato di seguito. Come si può vedere nell'output STATA sotto, il nuovo newvar2 variabile ha valori mancanti per le osservazioni che sono anche scomparsi da trial2. 6. Valori mancanti nelle dichiarazioni logiche Quando si crea o ricodificazione delle variabili che coinvolgono valori mancanti, sempre prestare attenzione al fatto che la variabile include valori mancanti. 7. Per ulteriori informazioni Il contenuto di questo sito web non deve essere interpretata come un'approvazione di un particolare sito web, il libro, o di un prodotto software dalla University of California.

No comments:

Post a Comment