SNOBOL: Več o tem jeziku za obdelavo besedila od 60. let dalje

Razkritje: Vaša podpora pomaga pri vzdrževanju spletnega mesta! Za nekatere storitve, ki jih priporočamo na tej strani, zaslužimo naročnino.


SNOBOL – StriNg orientiran in symBOlic Language – je družina programskih jezikov, ki je bila prvotno razvita sredi šestdesetih let prejšnjega stoletja, predvsem za namene obdelave besedila in strunskih analiz.

Kratka opomba o različicah in izvedbah

Zadnja stabilna izdaja SNOBOL prvotnih razvijalcev je bila SNOBOL4, leta 1967. Videli boste, da knjige in spletna mesta uporabljajo tako SNOBOL kot SNOBOL4 (včasih tudi »Snobol«). Po vsem letu 1967 se vsi nanašajo na isto (končno) različico jezika.

Bilo je tudi peščica razširitev in izvedb. Snocone je jezikovni predhodnik, ki jeziku zagotavlja skladen sladkor, kar olajša uporabo. SPITBOL je prevajalnik za SNOBOL; to je še posebej zanimivo, ker je bilo prvotno mnenje, da je SNOBOL neprimerljiv. Obstaja tudi programski jezik Snowball, ki ga je navdihnil in poimenoval SNOBOL.

Zaradi teh in drugih razširitev nekateri ljudje uporabljajo besedno zvezo “Vanilla SNOBOL”, kadar se sklicujejo na kodo, ki izvaja samo izvirno specifikacijo SNOBOL4 in ne dodatnih funkcij.

O jeziku

SNOBOL je bil ustvarjen posebej za manipulacijo z besedilom in vrsticami. Zaradi tega ima relativno edinstveno lastnost: vzorci veljajo za prvovrstne tipe podatkov. To omogoča manipulacijo s samimi vzorci, tako kot katero koli drugo strukturo podatkov. Poleg tega se strune lahko obravnavajo kot kode in ocenijo. To omogoča rekurzivno uporabo vzorcev in zelo zapleteno obdelavo in analizo strun. Program SNOBOL lahko celo spremeni svojo izvorno kodo.

Vzorci v SNOBOL-u so lahko preprosti, na primer kratki razponi besedila ali struge v obliki črk v obliki črke. Lahko pa so tudi zelo zapleteni, kot popoln formalni opis slovnice nekega jezika. Prevajalniki jezikov za programiranje se lahko pišejo v SNOBOL-u, pa tudi slovnična analiza naravnega jezika, preverjanje črkovanja in (v teoriji) prevajalniki.

SNOBOL je bil zelo priljubljen v akademijah računalniških znanosti v šestdesetih in sedemdesetih letih prejšnjega stoletja, v humani znanosti pa so ga široko uporabljali v osemdesetih letih prejšnjega stoletja. V tem trenutku je v veliki meri izpadel iz uporabe, v prid manj zmogljivemu programu Regular Expression z uporabo jezikov, kot sta Awk in Perl. Tam je še vedno peščica zvestih razvijalcev SNOBOL, jezik pa lahko postane prav tako uporaben kot vedno.

Spletne vadnice

  • Snobol4 Tutorial, vadnica iz leta 1985 Marka Emmerja;
  • Emmer je napisal tudi Vanilla Snobol4: Priročnik za priročnike in referenčni priročnik (PDF) in Makro SPITBOL: Visoko zmogljiv jezik SNOBOL4 (PDF);
  • Z uporabo SNOBOL / SITBOL na TWENEX.ORG je ta vadnica za SITBOL implementacijo SNOBOL, za uporabo v sistemu SDF Public Access TOPS-20 – tu je nekaj nenavadno specifičnih navodil za platformo, pa tudi dobra vadnica o samem SNOBOL;
  • SNOBOL4 Powerpoint Presentation, to so samo diapozitivi iz predstavitve o SNOBOL – ni odlična samostojna predstavitev, vendar je vredno pogledati pregled ključnih konceptov;
  • Uporaba SNOBOL na MTS, priročnik za uporabo jezika v matičnem okviru Michigan Terminal System – to je lahko koristno skupaj s emulatorjem Hercules, če morate delati na starem sistemu SNOBOL.

Orodja

  • SPITBOL, zbrana izvedba SNOBOL, ki je na voljo na Githubu;
  • SnoPy, knjižnica Python, ki omogoča uporabo besedilnih vzorcev na osnovi SNOBOL;
  • Mini tolmač SNOBOL, napisan v F #;
  • Makro implementacija SNOBOL4 v C.

Skupnost in stalno učenje

  • Yahoo Email Group, za razvijalce SNOBOL in ljudi, ki delajo s podobno tehnologijo za obdelavo besedila;
  • SNOBOL4.com, spletno mesto o jeziku podjetja, ki ga je ustanovil Mark Emmer, pisatelj več knjig in vaj o jeziku;
  • Rezerva SNOBOL.

Knjige o SNOBOL-u

  • Splošne knjige o laguni:
    • Snobol4 Primer, Ralph Griswold: osnovni uvod v jezik, ki ga je napisal eden od njegovih izumiteljev;
    • Programski jezik Snobol4 Ralph Griswold: imenovan “Zelena knjiga”, to je klasična knjiga o jeziku;
    • Obdelava strun in seznamov v Snobolu 4: Tehnike in aplikacije, avtor Ralph Griswold;
    • Uvod programerja v Snobol, Ward Douglas Maurer.
  • Posebne teme v programiranju SNOBOL:
    • SNOBOL Programiranje za humanistične vede, Susan Hockey;
    • Algoritmi v filmu Snobol 4, avtor James Gimpel;
    • Makro izvajanje Snobol 4: Študija razvoja strojno neodvisnega razvoja programske opreme, avtor Ralph Griswold.

Naj se naučim SNOBOL?

SNOBOL ni zelo priljubljen jezik, zato ni veliko delodajalcev, ki iščejo razvijalce SNOBOL. Z vidika napredovanja v karieri se torej bolje osredotočite na bolj zahtevne jezike.

Če pa vas zanima računalništvo, usmerjeno v besedilo (iskanje, prevajanje, obdelava v naravnem jeziku, literarna analiza), boste morda želeli preživeti nekaj časa s SNOBOL-om: še posebej, če ste že premaknili meje tega, kar lahko dosežete z običajnim izrazi.

Druga besedilna orodja

Če vas zanima SNOBOL, si želite ogledati nekaj teh drugih orodij za obdelavo in analizo besedila.

  • Natural Language Toolkit, platforma Python za delo s človeškimi jezikovnimi podatki;
  • Stanford CoreNLP, paket orodij za analizo naravnega jezika, ki temeljijo na Javi;
  • Awk, skriptni jezik, zasnovan posebej za obdelavo besedila;
  • Perl, še en skriptni jezik, za katerega velja, da ima na voljo najboljše izvajanje regularnih izrazov;
  • ANTLER je drugo orodje za prepoznavanje jezika in se lahko uporablja za razčlenitev naravnih in umetnih (računalniških) jezikov;
  • Apache OpenNLP, orodje za strojno učenje za obdelavo naravnega jezika;
  • Apache Lucene, nabor orodij za iskanje programske opreme na Javi in ​​Python-u;
  • GATE, Splošna arhitektura za tekstovni inženiring, okvir za “reševanje skoraj vseh težav z obdelavo besedila;”
  • Prolog, logični programski jezik, izumljen za obdelavo naravnega jezika;
  • Ikona, še en jezik za obdelavo besedila, ki ga je ustvaril Ralph Griswold po svojem delu na SNOBOL-u.

Morda boste želeli prebrati tudi besedilo prikrojevanja: Kako najti, organizirati in manipulirati z Ingersoll, Morton in Farris. Knjiga ponuja odličen pregled obdelave besedila, s primeri z uporabo več zgoraj naštetih programskih orodij.

Končno si oglejte TAPoR3, spletno mesto in spletno skupnost, namenjeno orodjem za analizo besedila.

Nadaljnje branje in viri

Na voljo imamo več vodnikov, vadnic in infografik, povezanih s kodiranjem in razvojem:

  • Perl vodnik in viri: to je odličen vodnik za začetek tega močnega skriptnega jezika.
  • Awk Resources: naučite se tega močnega skriptnega jezika, ki je na voljo v večini računalnikov.
  • Viri Prolog: s tem boste začeli s tem ikoničnim programskim jezikom logike.

Obdelava naravnega jezika zaživi!

Znanost o obdelavi naravnega jezika je daleč od časov SNOBOL-a. Izvedite vse o tem v naši infografiki, kako se izogniti zaljubljenosti s klepetalnico. Zajema dolgo zgodovino “razmišljajočih” računalnikov – in morda vas celo reši pred zlomljenim srcem!

Katere kode bi se morali naučiti?
Kako se izogniti zaljubljenosti s klepetalnico

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map