SAS-programmering: mijn spreadsheets voor statistische gegevens

Openbaarmaking: Uw steun helpt de site draaiende te houden! We verdienen een verwijzingsvergoeding voor sommige van de services die we op deze pagina aanbevelen.


SAS is een gespecialiseerde programmeertaal die voornamelijk is ontworpen voor het uitvoeren van statistische analyse van gegevens uit spreadsheets of databases. SAS wordt gebruikt om dergelijke gegevens te verzamelen, te analyseren en de resultaten uit te voeren naar tabellen, grafieken en andere tekst- of webgebaseerde documenten. In tegenstelling tot ingebouwde tools die beschikbaar zijn vanuit programma’s zoals Microsoft Excel, stelt SAS gebruikers in staat om gegevens op te halen en te beheren uit verschillende bronnen, en biedt het een veel grotere mate van controle en vrijheid bij het manipuleren en compileren van die gegevens.

De SAS-programmeertaal is speciaal ontworpen voor de SAS System-softwaresuite. De suite biedt zowel een grafische interface voor niet-programmeurs als verschillende geavanceerde opties die alleen mogelijk zijn met de SAS-taal.

SAS-programmering maakt gebruik van een tweestapsbenadering voor het verwerken van gegevens. In de DATA-stap haalt het programma gegevens op uit de bron en gebruikt het om een ​​SAS-gegevensset te maken. In de PROC-stap analyseert het programma die gegevens. Elk van deze stappen is onderverdeeld in een reeks verklaringen. In de stap DATA worden instructies gebruikt om de software te instrueren om een ​​actie uit te voeren, een gegevensset te lezen of het uiterlijk van de gegevens te wijzigen. In de PROC-stap worden instructies gebruikt om benoemde procedures aan te roepen, gegevens te sorteren of resultaten weer te geven.

Geschiedenis

Het werk aan SAS begon in 1966 aan de North Carolina University, met financiering van het National Institute of Health. In die tijd kreeg de nieuw aangeworven programmeur, Anthony Barr, de taak om variantie- en regressiesoftware te ontwikkelen die op IBM System-computers kon worden uitgevoerd en die zou worden gebruikt om landbouwgegevens te analyseren. Barr bracht, samen met een NCU-student, James Goodnight, de eerste versie van SAS uit in 1972, maar het project verloor vrijwel onmiddellijk daarna financiering. Barr en Goodnight bleven aan het project werken en het kreeg al snel financiering van de Universitaire Statistici van de Southern Experiment Stations in 1973. Verschillende nieuwe leden kwamen op dat moment bij het team en introduceerden nieuwe functies zoals econometrie, matrixalgebra en nieuwe programmering functionaliteit.

In 1976 haalde het team het project van NCU en verwerkte het in SAS Institute Inc. In de jaren tachtig en negentig werd SAS geïntroduceerd op verschillende nieuwe platforms en werden de functies verder uitgebreid en verfijnd. In de jaren 2000 begon het bedrijf met het ontwikkelen van een aantal nieuwe producten die specifiek waren gericht op analyse van bedrijfsgegevens, waaronder de Text Miner-software, die gegevens uit tekstbronnen analyseert, zoals bedrijfs-e-mails, en de CRM-software. In 2010 introduceerden ze een gratis versie van SAS voor studenten. Vanaf 2013 had SAS het grootste marktaandeel van alle geavanceerde analysesoftwareproducten.

In de jaren 2000 bracht het Britse bedrijf World Programming Limited zijn eigen SAS-compiler uit, World Programming System (WPS), die kan worden gebruikt voor het maken, bewerken en uitvoeren van SAS-programma’s en die veel van dezelfde functies bevat als SAS Systems.

SAS Institute vs World Programming Limited

Sinds 2010 heeft SAS System, Inc. meerdere rechtszaken aangespannen tegen World Programming Limited, met de bewering dat WPL inbreuk heeft gemaakt op de auteursrechten van SAS Institute en reverse-engineered SAS-software.

Het EU-Hof van Justitie oordeelde dat WPL geen inbreuk maakte op het auteursrecht van SAS-software, omdat ze geen toegang hadden tot de SAS-broncode en alleen de SAS-software gebruikten om de functionaliteit voor hun eigen product te bepalen. De uitspraak is belangrijk voor de softwarewereld, omdat het een precedent schept dat auteursrechtelijke bescherming niet geldt voor softwarefunctionaliteit.

WPL bleek echter in strijd te zijn met de auteursrechtwetten voor het gebruik van de SAS-handleiding, waarvan secties bijna letterlijk werden overgenomen in hun eigen handleiding. Een Amerikaanse federale rechtbank achtte WPL ook schuldig aan oneerlijke en misleidende handelspraktijken en beweerde dat WPL de voorwaarden van de SAS-softwareovereenkomst schond toen ze de gratis SAS Learning Edition-software gebruikten voor niet-commercieel gebruik (om hun eigen software te maken).

Boeken

Zoals bij de meeste programmeerboeken, zorg ervoor dat u degene kiest die is afgestemd op uw kennisniveau. In het geval van SAS zijn boeken meestal specifiek geschreven voor ervaren programmeurs, data-analisten of beide. En daar is een goede reden voor. SAS heeft een beperkte focus, dus zonder achtergrond op een van deze gebieden, is de kans groot dat je in de eerste plaats niet op zoek bent naar de taal.

  • The Little SAS Book van Delwiche and Slaughter: dit boek is ontworpen voor beginnende en ervaren SAS-programmeurs. Het verdeelt onderwerpen in korte, op zichzelf staande lessen met veel voorbeelden en visuals.
  • SAS Essentials: Mastering SAS for Data Analytics by Elliott and Woodward: hoewel dit boek is ontworpen voor beginnende SAS-programmeurs, heeft het een geavanceerdere benadering dan andere, omdat het voornamelijk is bedoeld voor studenten van het hoogste niveau en masterstudenten die programmeren, data-analyse of analyse. Naast het aanleren van algemene SAS-procedures, biedt het boek een overzicht van de huidige statistische technieken en methodologie voor gegevensmanipulatie.
  • SAS for Dummies van McDaniel en Hemedinger: aan de andere kant van het spectrum nemen deze boeken een leuke, eenvoudige benadering van SAS-programmering. Het biedt vergelijkbare informatie als SAS Essentials (achtergrondkennis over statistische analyse, een overzicht van SAS-systemen en gangbare SAS-procedures), maar er is een gemakkelijk te volgen, absolute beginnersbenadering van de taal voor nodig.
  • SAS leren door voorbeelden: een programmeursgids door Ron Cody: als je leert door te doen, dan is dit de tekst voor jou. Het splitst SAS op door specifieke technieken, geeft voorbeelden uit de echte wereld en ontleedt vervolgens de code om u stap voor stap te laten zien hoe het werkt. Elk hoofdstuk eindigt met testproblemen om te controleren wat je hebt geleerd.
  • SAS Certification Prep Guide: voor programmeurs die gecertificeerd willen worden voor loopbaanontwikkeling, dit is de officiële test-prep gids uitgegeven door het SAS Institute.

Opleiding

SAS-trainingen variëren van de complexe, op statistieken gebaseerde tutorials tot ultratechnische, programmaspecifieke handleidingen en zelfs enkele zeer basale, nieuw te programmeren tools. Als je een diploma in statistische analyse niet kunt betalen, of als je er al een hebt en extra training wilt, zijn er tal van opties beschikbaar:

  • SAS-certificering: het SAS Institute biedt verschillende wereldwijde certificeringen voor basis- en geavanceerde SAS-programmering, statistische analyse, business intelligence, gegevensbeheer en SAS-administratie.
  • Leer Analytics: gericht op analisten, deze SAS-certificeringstraining kan worden gegeven in een klas of via hun verzameling online videocolleges.
  • SAS-trainingsvideo’s: geplaatst door YouTuber Tamirat Chulta, deze korte trainingsvideo’s behandelen een breed scala aan veelvoorkomende toepassingen en programmeertips, zoals het combineren van datasets, het formatteren van invoer en het beheren van SAS-e-mail.
  • SAS-zelfstudies: de Study SAS-blog biedt links naar tientallen gratis SAS-notities en video-zelfstudies die worden aangeboden door UCLA, Texas A&M University en Virginia Commonwealth University. Onderwerpen variëren van algemene discussies over het wijzigen en verkennen van gegevens tot specifieke functies en taallogica.

Andere bronnen

Als het gaat om het analyseren van spreadsheetgegevens, vertrouwen de meesten van ons gewoon op de tools die ons favoriete spreadsheetprogramma biedt. Programmeurs die het meeste uit hun gegevens willen halen, zullen SAS-programmering echter een essentieel hulpmiddel voor analyse vinden. Of je nu net begint met SAS of je kennis wilt verbeteren, deze communitybronnen kunnen helpen:

  • SAS Institute: de oprichters van SAS bieden tal van bronnen voor SAS-programmeurs, waaronder online documentatie, ondersteuning, gratis tutorials, online trainingen, softwaredemo’s en hun gratis universiteitseditie.
  • World Programming System: als u geïnteresseerd bent in het alternatief voor SAS System, bevat de officiële WPS-site informatie over het programma, modules en ondersteunde platforms.
  • SAS Communities-pagina: deze online community die wordt beheerd door SAS Institute heeft meer dan 75.000 leden. Het organiseert actieve discussies over een verscheidenheid aan SAS- en data-analyseonderwerpen, waaronder SAS-programmering, gegevensbeheer, bedrijfsinformatie, SAS-administratie en risicobeheer. Er zijn ook regionale groepen voor programmeurs die lokale verbindingen willen maken.
  • SAS-blogs: het SAS-instituut host meer dan twee dozijn blogs, elk gericht op een ander SAS-gerelateerd onderwerp, waaronder SAS-training, analyse, bedrijfsvoorspelling, branche-inzicht en regionaal gerichte SAS-informatie. Als u op zoek bent naar de meest actuele informatie en meningen over het gebruik van SAS, dan is dit de plek om te beginnen.
  • Study SAS: hoewel niet regelmatig onderhouden, bevat deze SAS-blog tal van waardevolle bronnen, waaronder tutorials, online video’s, gratis eBooks en interviewtips voor SAS-programmeurs.
  • The SAS Dummy: deze blog wordt onderhouden door Chris Hemedinger, de manager van de SAS Online Communities en een van de auteurs van SAS voor Dummies. Net als het boek is zijn aanpak eenvoudig en zeer toegankelijk.
  • Conclusie

    Als u op zoek bent naar een tool om complexe data-analyse uit te voeren, is SAS System de marktleider en begrijpt u hoe de SAS-taalfuncties u een grote stap voorwaarts zullen geven in de wereld van bedrijfsanalyse.

    De SAS-taal heeft een zeer specifieke focus, dus het is onwaarschijnlijk dat algemene programmeurs het zullen oppikken en besluiten het voor de lol te leren. Aan de andere kant willen studenten statistiek en data-analyse die geen interesse hadden in programmeren hier een uitzondering maken.

    Er moet echter een financiële overweging worden gemaakt bij het kiezen van SAS als uw voorkeurstaal. Hoewel de taal zelf vrij beschikbaar is, hebben de twee belangrijkste compilers beide licenties nodig. Een studenteneditie van SAS System is gratis beschikbaar, maar je moet beginnen met betalen als je na het afstuderen een persoonlijk exemplaar wilt blijven gebruiken.

    Jeffrey Wilson Administrator
    Sorry! The Author has not filled his profile.
    follow me
      Like this post? Please share to your friends:
      Adblock
      detector
      map