Naučite se programiranja statistike: Začnite rudarjenje statističnih podatkov

Razkritje: Vaša podpora pomaga pri vzdrževanju spletnega mesta! Za nekatere storitve, ki jih priporočamo na tej strani, zaslužimo naročnino.


Stata je aplikacija, namenjena podpori statističnih analiz. Razvil jo je StataCorp in izšel leta 1985. Ime je izpeljano iz „statistike“ in „podatkov“, uporablja pa se predvsem pri analizi podatkov in specialističnih raziskavah.

Kljub temu, da je starejši od 30 let, je Stata še vedno v skupni rabi. Omogoča, da je vsaka analiza v celoti dokumentirana in lahko ustvari grafiko, simulacije in grafikone.

Obstajajo štiri različne različice aplikacije, od študentske različice do različice za zelo velike baze podatkov. Stata je mogoče namestiti v računalnike Mac, Windows in Unix. Najpogostejša različica je Stata / IC (IC pomeni “Inter Cooled”).

Uvod v statistiko

Stata ima vgrajen urejevalnik podatkov, ki je podoben oknu za urejanje preglednic. Na dnu aplikacije je okno z ukaznim pozivom. V tem oknu so zapisani vsi ukazi, ki so bili vneseni med sejo. Rezultati so prikazani v osrednjem oknu.

Ko se naloži nabor podatkov, Stata prikaže spremenljivke in oznake znotraj njega v oknih spremenljivk in lastnosti.

Če se želite igrati s Stata, ne da bi ustvarili svoje podatke, Stata ponuja vrsto primerkov in dodatne knjižnice ročnih nabora podatkov, ki jih je mogoče prenesti iz interneta. Naložite naloge podatkov z ukazom sysuse dir, nato kliknite povezavo za uporabo poleg imena datoteke ali kliknite opisno ime, če želite izvedeti več o njej.

Vnašanje ukazov in podatkov v statistiko

Stato je mogoče programirati z ukazno vrstico z uporabo ukaznega poziva, ki smo ga omenili zgoraj. Ko uporabite ukaz, ga lahko ponovno uporabite s pritiskom na tipko PgUp, dokler se ukaz ne prikaže v oknu.

Aplikacijo lahko nadzirate tudi prek grafičnega uporabniškega vmesnika ali z uvozom datoteke Do (imenovane tudi sintaksna datoteka), ki je niz vnaprej določenih ukazov, ki se izvajajo kot skript.

Uporabniki Stata običajno priporočajo, da se grafični vmesnik najbolje izogne, vendar omogoča enostaven način za učenje programskega jezika Stata. Vsakič, ko pokažete in kliknete ukaz, se v oknu ukaza prikaže ustrezna koda, tako da lahko vidite, kaj Stata počne v ozadju.

Nabor podatkov, ki jih uporabljate, lahko uvozite v Stata iz datoteke CSV ali datoteke Stata. V zadnjih različicah Stata lahko podatke neposredno uvozite iz Excela z ukazom import excel.

Osnovni statistični ukazi

Stata lahko izvaja različne vrste izračunov in analiz, zato pomaga imeti osnovno delovno znanje njegovih ukazov. Vsak ukaz je odvisen od velikih in malih črk, čeprav se lahko uporabljajo nekatere okrajšave.

V zgornjem razdelku smo omenili ukaz import excel. To je preprost primer ukaza Stata v akciji:

uvozite excel z uporabo datoteke filename.xls, ///
list (Sheet’1 ‘) celrange (A1: D20) jasno

Ta ukaz določa list in posebne celice, ki jih je treba uvoziti s pomočjo ukazov stanja in celice. Če je kot celica določena ena celica, se bodo vsi podatki, ki so zunaj te celice, uvoženi.

Ko boste začeli sodelovati s Stata, boste naleteli na številne druge ukaze. Nekaj ​​osnov je dobro vedeti:

  • prikaz prikazuje rezultat izračuna
  • povzemamo prikaže povzetek podatkov v datoteki (sledite ji spremenljivkam, ki jih želite preučiti)
  • pomoč prikaže pomoč za ukaz ali funkcijo (uporabite jo sami ali ji sledite z imenom ukaza, za katerega potrebujete pomoč)
  • če manjka () je eden od mnogih načinov filtriranja podatkov, ki jih podatki vrnejo, ko poizvedujete po naboru podatkov
  • graf nariše graf podatkov v naboru podatkov; slediti mora vrsta grafa, spremenljivka osi X in spremenljivka osi y
  • opišite prikaže podatke o datoteki
  • nič ustavi Stata, da vsakič, ko zaženete ukaz, odpre novo okno z rezultati
  • posnetek ustvari točko za razveljavitev za vaš projekt (ne pozabite: Stata nima vgrajenega ukaza za razveljavitev)
  • čist vrne rezultate poizvedbe brez roba tabele
  • jasno izprazni vse podatke iz RAM-a, ko je ukaz izveden. To je pomembno, ker Stata vse svoje podatke naloži v RAM, če ni drugače naloženo. Pri delu z velikimi nabori podatkov se lahko računalnik upočasni ali zruši
  • Najdi išče razširitve Stata ali vtičnike, ki lahko izboljšajo njegovo funkcionalnost
  • /// pove Stati, da se ukaz nadaljuje v naslednji vrstici; če želite, lahko komentirate po poševnici, komentarji pa bodo prezrti, če so v isti vrstici
  • ; pove Stata, da je ukaz končan
  • izhod zapre aplikacijo; to je enako kliku Datoteka -> Izhod z miško

Ko se navadite na delo v Stati, lahko ukaze shranite v datoteko Do s pomočjo okna Urejevalnik. Besedilno datoteko lahko shranite tudi s pripono .do in nato z ukazom do zaženete datoteko Do v Stata, ki ji sledi ime datoteke. Stata uporablja iste načine komentiranja kot C ++ in druge jezike; dvojna poševnica // komentira vse na koncu vrstice, medtem ko / / in * / lahko uporabite na začetku in na koncu, da komentirate celoten razdelek.

Spremljanje svojega dela

Ena največjih prednosti Stata je njegova sposobnost zapisovanja poizvedb, zaradi česar je neprecenljiv za raziskovalce, ki morajo dokazati, kako so prišli do določenih zaključkov. Da bi bila prijava aktivna, morate slediti nekaj korakom.

  1. Ustvari imenik za svoj projekt. Stata bo privzeto delovala v C: DATA, tako da ustvarjanje ločenega imenika ohranja stvari lepo.
  2. Vklopite prijavo. Uporabite ukaz s pomočjo ukaza, ki mu sledite z imenom datoteke, ki jo želite uporabiti.
  3. Ukaze vedno shranite v datoteko Do. Čeprav to ni nujno potrebno, je koristno, če želite reproducirati rezultat ali nazaj nad svojimi ukazi.

nadaljnje branje

  • Kanal StataCorp na YouTubu: enostavno prebavljivi videoposnetki pomoči o različnih funkcijah v programu Stata.
  • Uvod v Stata: PDF-hitri vodnik za Stato 8 s Harvard Kennedy School.
  • Statalist: forum za razprave, na katerem lahko uporabniki Stata izmenjujejo informacije in si pomagajo.
  • Viri UCLA Stata: imenik brezplačnih tečajev, modulov, povezav in pogostih vprašanj o osnovni in vmesni uporabi Stata.
  • Vodič za statistiko z univerze Princeton: Odličen vodnik za statistiko Germaín Rodríguez.
  • Ali datoteke in upravljanje projektov: kako ustvariti datoteke Do in spremljati svoje ukaze.
  • Makroti Stata 14: referenčni priročnik za nekatere makri, ki so na voljo v različici Stata 14.
  • StataCorp NetCourses: plačani tečaji proizvajalcev Stata, namenjeni olajšanju novih uporabnikov po dostopni ceni.

Povzetek

Stata je starejši programski jezik in razvojno okolje, namenjeno reševanju statističnih težav. Vendar ga aktivna skupnost še vedno pogosto uporablja. Če opravljate resno statistično delo, je Stata dober jezik, ki ga morate poznati. S temi uvodi in našimi priporočljivimi viri bi morali biti na poti.

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me