R-programmering: Kom igång med statistisk programmering

Avslöjande: Ditt stöd hjälper till att hålla webbplatsen igång! Vi tjänar en remissavgift för några av de tjänster vi rekommenderar på denna sida.


R är ett programmeringsspråk och utvecklingsmiljö som används för statistisk analys och skapande av datavisualisering av publiceringskvalitet. R är helt gratis, öppen källkod, del av GNU-projektet och stöds av R Foundation for Statistical Computing.

Var kom R ifrån?

R skapades första gången 1992 av två professorer vid University of Auckland i Nya Zeeland: Ross Ihaka och Robert Gentleman. Den allra första versionen av språket släpptes 1994. Det skulle dock vara ytterligare sex år innan en stabil betaversion av R ställdes tillgänglig för allmänheten i februari 2000.

R är en implementering av S-programmeringsspråket som ursprungligen utvecklades på 1970-talet av John Chambers och andra vid de värdefulla Bell Laboratories. R och S-PLUS, ett proprietärt språk som ägs av TIBCO, är de två moderna implementeringarna av S-programmeringsspråket.

Idag är R det mest populära programmeringsspråket för statistisk analys och används av industrigiganter som Facebook och Google. Intressant nog är den ursprungliga skaparen av S, John Chambers, nu en del av R Development Core Team, som har till uppgift att fortlöpande utveckla R. Menande att R är den andliga fortsättningen av S-programmeringsspråket även om det inte är en direkt ättling.

Vad används R för idag?

Ungefär hälften av all datavetare använder R för data mining och statistisk analys – det är det programmeringsspråk som du väljer inom den ganska nebulösa ”big data” -industrin som du fortsätter att höra om. R inkluderar inbyggda funktioner och variabler som är utformade för att underlätta statistisk analys, och det ger också grafikgenerationsverktyg som producerar datavisualisering av publiceringskvalitet.

R är mycket töjbart och det finns många paket för att hantera specifika dataanalysuppgifter och problem. Den är skyldig en del av sin popularitet till sin open source-status, vilket innebär att vem som helst kan använda R och ha tillgång till statistiska analysverktyg i världskvalitet.

R är utformad för att fungera på praktiskt taget vilken plattform som helst och kan köras på system med ett Unix-, Linux-, Windows- eller Mac OS-operativsystem.

GUI för R

Standard R har åtkomst över kommandoraden. Men användare som föredrar ett lättanvänt grafiskt användargränssnitt (GUI) har tur. Det finns många GUI: er tillgängliga för R, av vilka några är gratis och öppen källkod.

Om du vill lära dig mer om R GUI: er är sex av de mest populära alternativen:

  • RStudio Open Source-version
  • Skallra
  • Deducer
  • rkward
  • JGR (uttalas “Jaguar” och står för “Java Gui för R”)
  • R Befälhavare

Programmering med stil

Programmering är ett ganska fritt formmedium. När det gäller de flesta programmeringsspråk är linjeavbrott och intryck helt valfritt och ignoreras av maskinen som tolkar koden, och det finns få namnkonventioner som måste följas.

Bara för att du kan skriva kod med någon typ av stil betyder det inte att du borde göra det. Hur du utformar kod betyder mycket av minst tre skäl:

  • Dåligt utformad kod är svår att läsa och förstå.
  • Eftersom det är svårt att läsa och förstå kan dåligt utformad kod vara frustrerande att utöka.
  • Dessutom, om kod är svårläst och inte är utformad för tydlighet, kommer det att vara svårare än nödvändigt att felsöka.

Av detta skäl är det viktigt för hur du utformar kod i R endast för att koden faktiskt fungerar eller inte. För att hjälpa dig komma igång på höger fot är här de tre bästa rekommendationerna du bör följa när du skriver kod i R:

  • Ange din kod: Ingenting hjälper till att kodera tydlighet mer än korrekt intryck. I R använder du aldrig flikar för indragning, utan istället använder du fyra tomma utrymmen för varje indragningsnivå.
  • Använd tydliga och unika variabla och funktionsnamn: Namnge aldrig en variabel eller funktion genom att återanvända ett namn som redan används och gör ditt bästa för att undvika förvirrande namn. När felsökningskoder är månader framöver, eller när någon annan läser din kod, bör det vara enkelt att välja ut variabler och funktioner som du skapade.
  • Använda sig av <- snarare än =: Lika tecknet ska inte användas för att tilldela ett värde till en funktion eller variabel. Istället kan du kombinera en mindre än symbol och bindestreck (<-) för det här syftet. Medan det moderna R-systemet kommer att acceptera ett lika tecken, är dess användning tekniskt felaktigt, och det fungerar bara för att R var anpassad för att passa de dåliga syntaktiska rutinerna för nya programmerare. Gör det rätt. Använda sig av <-.

R-stil är ett kontroversiellt ämne och vi kan knappast göra det rättvisa med ett par hundra ord. Medan vi har försökt träffa tre höjdpunkter, finns det mycket mer att lära sig om det här ämnet. Om du vill behärska R-programmeringsstil och ser ut som du vet vad du gör när du skriver R, kolla in R Style: An Rchaeological Kommentary (PDF) av Paul E Johnson samt Googles R Style Guide.

Resurser

Även om vi har berättat mycket om R-programmering, har vi inte lärt dig hur du programmerar i R. Vi kan inte göra det i det här forumet men vi kan leda dig till den bästa R-programmeringsutbildningen du hittar på webb. Om du har lärt dig tillräckligt med R och är redo att börja skriva lite kod och knäppa några siffror, här är de bästa R-programmeringsresurserna som webben har att erbjuda.

Handledningar

Webben erbjuder många R-tutorials som du kan använda för att lära dig R-programmering. Vi tycker dock att dessa två är de allra bästa:

  • R for Cats and Cat Lovers: En rolig introduktion till R som hoppar över R-installationen, men antar ingen tidigare programmeringsupplevelse. Inspirerad av JavaScript för katter, täcker denna gratis handledning bara grunderna. Om du är helt ny inom datavetenskaplig programmering hjälper den här handledningen dig att få dina lager innan du går vidare till mer utmanande material.
  • En introduktion till R: Denna introduktion är allt annat än lätt och grundläggande. Hoppa inte in den här självstudien utan att först styra dina nerver och ställa in ett långtidsstudie schema. Denna djupgående och grundliga introduktion till R hanteras av R Core Team, vilket innebär att du utbildas av experterna när du arbetar dig igenom mer än 30 000 innehållsinnehåll. Om du redan känner till lite R och bara vill hoppa till specifika ämnen innehåller denna guide också ett användbart index över funktioner och variabler samt ett konceptindex.

Interaktiva handledning

Om du hellre vill lära dig genom att göra, kan en interaktiv handledning vara precis det du letar efter. Här är tre alternativ att överväga:

  • Prova R From Code School: En kort interaktiv introduktion till R-syntax och grundläggande programmering med R. Tänk på det som den interaktiva versionen av R for Cats, men med färre kattreferenser.
  • DataCamp Introduktion till R: En grundläggande interaktiv introduktion till R-programmering som täcker hur man utför aritmetik och arbetar med variabler och introducerar grundläggande datatyper.
  • Virvel: detta är faktiskt ett R-paket. Det betyder att du kommer att gå igenom interaktiva tutorials med R installerat direkt på ditt system. Det finns virvelkurser för att leda dig genom allt, börjar med installationen. Dessutom finns det en hel del ytterligare kurser utöver introduktionskursen med titlar som “R-programmering”, “dataanalys” och “regressionsmodeller.”

Böcker

Om du verkligen vill lära dig att utföra statistisk analys med R finns det ingen ersättning för formella läroböcker. Med tanke på användningen av R i industrin och akademin saknas det brist på R-texter av hög kvalitet. Vi har emellertid tagit oss tid att sortera igenom röran och fastställa fem av de mest rekommenderade och högst rankade R-programmeringstexterna som finns tillgängliga idag:

  • R in Action (2015) av Robert Kabacoff: en av de mest studerade R-texterna på marknaden, den presenterar R-programmeringsspråket och demonstrerar användningen av R för att lösa affärsproblem.
  • Practical Data Science with R (2014) av Zumel and Mount: precis som namnet antyder lär denna text teorin för statistisk analys med R men fokuserar på den praktiska tillämpningen av teori på verkliga problem. Skrivet av ett par imponerande kvalificerade dataforskare från den privata sektorn, om du bara läser en text på R, gör det till den här.
  • Upptäck statistik med R (2012) av Field, et al: denna irreverenta text anses universellt vara den mest underhållande introduktionen till statistisk analys med R. Dessutom ger texten en solid teknisk grund. Om du hatar läroböcker men förstår behovet av att läsa en är det den läroboken du letar efter.
  • The Art of R Programming (2011) av Norman Matloff: denna rundtur med tillämpad R-programmering leder läsaren genom verkliga scenarier där R används varje dag. Lämplig för både nybörjare och erfarna utvecklare. Denna text är utformad för att sträcka din uppfattning om vad dataanalys kan göra och samtidigt undervisa i grundläggande R-programmering.
  • R Cookbook (2011) av Paul Teetor: om du är mer upptagen med att lösa specifika problem än att lära teorin bakom R-programmeringsspråket och statistisk analys, kommer denna kokbok från O’Reilly att hjälpa dig att lösa problem och producera resultat snabbt.

Slutsats

R är gratis och öppen källkod, vilket gör det möjligt för alla att ha tillgång till statistiska analysverktyg i världsklass. Det används ofta i akademin och den privata sektorn och är det populäraste statistiska analysprogrammeringsspråket idag. Att lära R är inte lätt – om det var, skulle dataforskare inte vara så efterfrågan. Det finns dock ingen brist på kvalitetsresurser som du kan använda för att lära dig R om du är villig att lägga in tid och ansträngning.

Ytterligare läsning och resurser

Vi har fler guider, självstudier och infografik relaterade till programmering och statistik:

  • S-PLUS-programmeringsresurser: det vanliga kommersiella språket.
  • SAS programmering Introduktion och resurser: SAS är marknadsledande inom dataanalys.
  • Stata-programmering: Stata är en hel utvecklingsmiljö för dataanalys.

Vilken kod ska du lära dig?

Förvirrad om vilket programmeringsspråk du ska lära dig att koda på? Kolla in vår infographic, vilken kod ska du lära dig? Det diskuterar inte bara olika aspekter av språken, det svarar på viktiga frågor som “Hur mycket pengar kommer jag att tjäna på att programmera Java för att leva?”

Vilken kod ska du lära dig?
Vilken kod ska du lära dig?

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map