Programowanie R: Rozpocznij programowanie statystyczne

Ujawnienie: Twoje wsparcie pomaga utrzymać działanie witryny! Pobieramy opłatę za polecenie niektórych usług, które zalecamy na tej stronie.


R jest językiem programowania i środowiskiem programistycznym wykorzystywanym do analizy statystycznej i tworzenia wizualizacji danych o jakości publikacji. R jest całkowicie darmowym, otwartym oprogramowaniem, częścią Projektu GNU i jest wspierany przez R Foundation for Statistics Computing.

Skąd pochodzi R.?

R został po raz pierwszy wymyślony w 1992 roku przez dwóch profesorów z University of Auckland w Nowej Zelandii: Ross Ihaka i Robert Gentleman. Pierwsza wersja języka została wydana w 1994 r. Jednak upłynie jeszcze sześć lat, zanim stabilna wersja beta języka R zostanie udostępniona publicznie w lutym 2000 r..

R jest implementacją języka programowania S, pierwotnie opracowanego w latach 70. przez Johna Chambersa i innych w czcigodnym Bell Laboratories. R i S-PLUS, zastrzeżony język należący do TIBCO, to dwie nowoczesne implementacje języka programowania S.

Obecnie R jest najpopularniejszym językiem programowania analizy statystycznej i jest używany przez gigantów branżowych, takich jak Facebook i Google. Co ciekawe, oryginalny twórca S, John Chambers, jest teraz częścią R Development Core Team, którego zadaniem jest ciągły rozwój R. Oznacza to, że R jest duchową kontynuacją języka programowania S, nawet jeśli nie jest to bezpośredni potomek.

Do czego służy dziś R.?

Około połowa wszystkich badaczy danych używa R do eksploracji danych i analizy statystycznej – jest to język programowania wybrany w dość mglistej branży „dużych zbiorów danych”, o której ciągle słyszysz. R zawiera wbudowane funkcje i zmienne zaprojektowane w celu ułatwienia analizy statystycznej, a także zapewnia narzędzia do generowania grafiki, które wytwarzają wizualizacje danych o jakości publikacji.

R jest wysoce rozszerzalny i istnieje wiele pakietów rozwiązujących określone zadania i problemy związane z analizą danych. Część swojej popularności zawdzięcza statusowi open source, co oznacza, że ​​każdy może korzystać z R i mieć dostęp do światowej klasy narzędzi do analizy statystycznej.

R został zaprojektowany do pracy na praktycznie każdej platformie i może być uruchamiany na systemach z systemem operacyjnym Unix, Linux, Windows lub Mac OS.

GUI dla R

Dostęp do standardu R można uzyskać z wiersza poleceń. Jednak użytkownicy, którzy preferują łatwy w obsłudze graficzny interfejs użytkownika (GUI), mają szczęście. Istnieje wiele GUI dostępnych dla R, niektóre z nich są darmowe i open source.

Jeśli chcesz dowiedzieć się więcej o graficznych interfejsach użytkownika, oto sześć najpopularniejszych opcji:

  • Wersja RStudio Open Source
  • Grzechotka
  • Deducer
  • RKWard
  • JGR (wymawiane „Jaguar” i oznaczające „jotava solinterfejs użytkownika dla R„)
  • Dowódca R.

Programowanie ze stylem

Programowanie jest dość swobodnym medium. W przypadku większości języków programowania podziały wierszy i wcięcia są całkowicie opcjonalne i ignorowane przez maszynę, która interpretuje kod, i istnieje kilka konwencji nazewnictwa, których należy przestrzegać.

Jednak to, że możesz pisać kod w dowolnym stylu, nie oznacza, że ​​powinieneś. Sposób stylizacji kodu ma duże znaczenie z co najmniej trzech powodów:

  • Źle zaprojektowany kod jest trudny do odczytania i zrozumienia.
  • Ponieważ trudno jest go odczytać i zrozumieć, źle napisany kod może być frustrujący w rozszerzaniu.
  • Ponadto, jeśli kod jest trudny do odczytania i nie jest zaprojektowany ze względu na przejrzystość, debugowanie będzie trudniejsze niż to konieczne.

Z tego powodu sposób stylowania kodu w R ma drugie znaczenie tylko dla tego, czy kod rzeczywiście działa. Aby pomóc Ci zacząć od właściwej stopy, oto trzy najważniejsze stylistyczne zalecenia, których należy przestrzegać podczas pisania kodu w języku R:

  • Wciśnij swój kod: Nic nie poprawia przejrzystości kodu bardziej niż prawidłowe wcięcie. W R nigdy nie używasz tabulatorów do wcięcia, ale zamiast tego używasz czterech pustych spacji dla każdego poziomu wcięcia.
  • Używaj jasnych i unikalnych nazw zmiennych i funkcji: Nigdy nie nadawaj nazwy zmiennej lub funkcji przez ponowne użycie nazwy, która jest już w użyciu, i staraj się unikać mylących nazw. Podczas debugowania kodu za miesiąc lub gdy ktoś inny czyta twój kod, powinno być łatwo wybrać zmienne i funkcje, które utworzyłeś.
  • Posługiwać się <- zamiast =: Znak równości nie powinien być używany do przypisywania wartości do funkcji lub zmiennej. Zamiast tego połącz mniej niż symbol i myślnik (<-) w tym celu. Podczas gdy nowoczesny system R zaakceptuje znak równości, jego użycie jest technicznie niepoprawne i działa tylko dlatego, że R został dostosowany do złych praktyk składniowych nowych programistów. Zrób to dobrze. Posługiwać się <-.

Styl R jest kontrowersyjnym tematem i ledwo możemy oddać sprawiedliwość w kilkuset słowach. Chociaż próbowaliśmy osiągnąć trzy najwyższe punkty, na ten temat można dowiedzieć się znacznie więcej. Jeśli chcesz opanować styl programowania R i wyglądasz, jakbyś wiedział, co robisz, pisząc R, zapoznaj się z R Style: Komentarz Rcheologiczny (PDF) autorstwa Paula E Johnsona, a także z Przewodnikiem po stylu Google.

Zasoby

Chociaż dużo mówiliśmy o programowaniu w języku R, nie nauczyliśmy Cię programowania w języku R. Nie możemy tego zrobić na tym forum, ale możemy skierować Cię do najlepszej edukacji w zakresie programowania w języku R, którą znajdziesz na sieć. Jeśli nauczyłeś się wystarczająco dużo o R i jesteś gotowy, aby rozpocząć pisanie kodu i łamanie liczb, oto najlepsze zasoby programowania R, jakie oferuje sieć.

Poradniki

Internet oferuje wiele samouczków języka R, których można użyć do nauki programowania R. Uważamy jednak, że te dwa są najlepsze:

  • R dla kotów i miłośników kotów: zabawne wprowadzenie do R, które pomija instalację R, ale nie zakłada wcześniejszego doświadczenia w programowaniu. Ten darmowy samouczek, zainspirowany JavaScript dla kotów, obejmuje tylko podstawy. Jeśli jesteś nowy w programowaniu danych, ten samouczek pomoże ci ustalić orientację, zanim przejdziesz do bardziej wymagających materiałów.
  • Wprowadzenie do R: To wprowadzenie jest tylko lekkie i podstawowe. Nie wskakuj do tego samouczka bez uprzedniego uspokojenia nerwów i ustalenia długoterminowego harmonogramu badań. Tym dogłębnym i dogłębnym wprowadzeniem do języka R zarządza Zespół R Core, co oznacza, że ​​jesteś kształcony przez ekspertów podczas pracy nad ponad 30 000 słów treści. Jeśli znasz już trochę R i chcesz po prostu przejść do konkretnych tematów, ten przewodnik zawiera również pomocny indeks funkcji i zmiennych, a także indeks koncepcji.

Interaktywne samouczki

Jeśli wolisz uczyć się przez działanie, interaktywny samouczek może być właśnie tym, czego szukasz. Oto trzy opcje do rozważenia:

  • Wypróbuj R From Code School: Krótkie interaktywne wprowadzenie do składni R i podstawowego programowania z R. Pomyśl o tym jako o interaktywnej wersji R for Cats, ale z mniejszą liczbą referencji dla kotów.
  • DataCamp Wprowadzenie do R: Podstawowe interaktywne wprowadzenie do programowania R, które obejmuje sposób wykonywania arytmetyki i pracy ze zmiennymi oraz wprowadza podstawowe typy danych.
  • Wirowanie: w rzeczywistości jest to pakiet R. Oznacza to, że będziesz przechodził przez interaktywne samouczki z R zainstalowanym bezpośrednio w systemie. Dostępne są kursy wirowania, które przeprowadzą Cię przez wszystko, począwszy od instalacji. Ponadto istnieje wiele dodatkowych kursów poza kursem wprowadzającym z tytułami takimi jak „Programowanie R”, „Analiza danych” i „Modele regresji”.

Książki

Jeśli naprawdę chcesz nauczyć się przeprowadzać analizę statystyczną za pomocą R, nie możesz zastąpić formalnych podręczników. Biorąc pod uwagę wykorzystanie R w przemyśle i środowisku akademickim, nie brakuje wysokiej jakości tekstów R. Poświęciliśmy jednak czas na uporządkowanie bałaganu i wskazanie pięciu najbardziej zalecanych i najwyżej ocenianych tekstów programowych R dostępnych obecnie:

  • R in Action (2015) autorstwa Roberta Kabacoffa: jeden z najczęściej studiowanych tekstów R na rynku, przedstawia język programowania R i demonstruje użycie R do rozwiązywania problemów biznesowych.
  • Practical Data Science with R (2014) autorstwa Zumel and Mount: tak jak sugeruje nazwa, ten tekst uczy teorii analizy statystycznej z R, ale koncentruje się na praktycznym zastosowaniu teorii do rzeczywistych problemów. Napisane przez parę imponująco wykwalifikowanych naukowców z sektora prywatnego, jeśli czytasz tylko jeden tekst na R, zrób to.
  • Odkrywanie statystyki za pomocą R (2012) autorstwa Fielda i innych: ten lekceważący tekst jest powszechnie uważany za najbardziej zabawny wstęp do analizy statystycznej z R. Ponadto tekst ten stanowi solidne podstawy techniczne. Jeśli nie znosisz podręczników, ale rozumiesz potrzebę ich przeczytania, to właśnie tego szukasz.
  • The Art of R Programming (2011) autorstwa Normana Matloffa: ta prezentacja zastosowanego programowania R prowadzi czytelnika przez rzeczywiste scenariusze, w których R jest używany codziennie. Tekst ten, odpowiedni zarówno dla początkujących, jak i doświadczonych programistów, ma na celu poszerzenie Twojej wiedzy na temat tego, co może zrobić analiza danych, jednocześnie ucząc podstawowego programowania.
  • Książka kucharska R (2011) Paula Teetora: jeśli bardziej zajmujesz się rozwiązywaniem konkretnych problemów niż nauką teorii języka programowania R i analizy statystycznej, ta książka kucharska od O’Reilly pomoże ci szybko rozwiązać problemy i szybko uzyskać wyniki.

Wniosek

R jest darmowy i open source, dzięki czemu każdy może mieć dostęp do światowej klasy narzędzi analizy statystycznej. Jest szeroko stosowany w środowisku akademickim i prywatnym i jest obecnie najpopularniejszym językiem programowania analizy statystycznej. Nauka R nie jest łatwa – gdyby tak było, naukowcy zajmujący się danymi nie byliby tak bardzo poszukiwani. Nie brakuje jednak wysokiej jakości zasobów, których możesz użyć do nauki języka R, jeśli chcesz poświęcić czas i wysiłek.

Dalsza lektura i zasoby

Mamy więcej przewodników, samouczków i infografik związanych z programowaniem i statystykami:

  • Zasoby programistyczne S-PLUS: standardowy język komercyjny.
  • SAS Programowanie Wprowadzenie i zasoby: SAS jest liderem na rynku w zakresie analizy danych.
  • Programowanie Stata: Stata to całe środowisko programistyczne do przeprowadzania analizy danych.

Jakiego kodu należy się nauczyć?

Mylisz się w jakim języku programowania powinieneś nauczyć się kodować? Sprawdź naszą infografikę, jakiego kodu należy się nauczyć? Nie tylko omawia różne aspekty języków, ale odpowiada na ważne pytania, takie jak: „Ile pieniędzy zarobię na programowanie Java na życie?”

Jakiego kodu powinieneś się nauczyć?
Jakiego kodu należy się nauczyć?

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map