Reisen til den perfekte søkemotoren Infographic

Formidling: Din støtte hjelper med å holde nettstedet i gang! Vi tjener et henvisningsgebyr for noen av tjenestene vi anbefaler på denne siden.


Reisen til den perfekte søkemotoren

Det er interessant. Det var en tid – for omtrent to tiår siden nå – da de fleste av oss ikke visste om Internett.

Visst, noen av oss hadde blitt utsatt for Lycos og AltaVista, men Internett og spesifikt søkemotorer slik de er nå? Aldri. Hvis vi ønsket å kontakte noen, så vi dem opp i telefonboken. Hvis vi ønsket å forske på det bysantinske imperiets historie, dro vi til biblioteket. Det var ingen umiddelbar tilfredsstillelse av å gå til Google og søke etter alt mulig.

I disse dager er søkemotorer så forankret i hverdagen vår at det ikke er noe vi ikke engang tenker på lenger. Vi åpner ganske enkelt nettleservinduet (eller mobilenheten), skriver inn det vi leter etter, og et sekund senere har vi et svar eller en løsning.

Den eneste gangen folk virkelig legger merke til denne ideen om en “søkemotor” lenger er når Google slipper en ny algoritmeoppdatering. Disse oppdateringene er vanligvis et tegn for bedrifter og markedsførere at det er på tide å oppdatere nettstedet deres for å forbli i Googles gode nåder for rangeringsformål. Følgelig, ved å adlyde lovene til søkemotorer, ser bedrifter også etter de besøkende interesser.

På slutten av dagen er det det søkemotorene til slutt bryr seg om: Internett-brukere. Hjelpe med å koble dem til informasjonen de trenger og holde dem trygge mens de gjør det.

Men det var ikke slik internett eller søkemotorer opprinnelig så ut – eller hadde som mål å gjøre –
tilbake på 1960-tallet da alt startet. Hvis du ikke er kjent med søkemotorenes historie, kan du spenne deg sammen. Vi kommer til å ta deg med på en lang og vindfull vei gjennom alle søkemotorene som banet vei til Google.

Ikke så SMART som Google: Reisen til den perfekte søkemotoren

Ikke så SMART som Google: Reisen til den perfekte søkemotoren

Nesten alle med internettforbindelse har brukt en søkemotor før, men har du noen gang lurt på hvordan søkemotoren ble til? Hvem oppfant det? Hva var den første? Så følg med, for vi har hele historien.

Forgjengeren

  • Navn:
    • SMART Informasjonsinnhentingssystem
      • SMART er et forkortelse for Saltons Magical Automatic Retriever of Text
  • Utgitt:
    • 1960
  • Bruk:
    • Interaktiv informasjonsdatabase
  • Utviklet av:
    • Gerard Salton
    • Chris Buckley
    • Andre ved Cornell University
  • Innovations:
    • Vector space-modell:
      • En metode for automatisk vekting av søkeresultater for å vise de som er mest relevante for brukeren
    • Relevant tilbakemelding:
      • En måte for brukere å rangere relevansen av søkeresultater
    • Rocchio klassifisering:
      • En type klassifiseringsmetode som øker søkepresisjonen

I begynnelsen

  • Før bruk av World Wide Web og søkemotorer var internett:
    • En samling FTP-nettsteder (File Transfer Protocol) der brukere kan navigere for å finne spesifikke delte filer
    • Nyhetsgrupper der folk samhandlet og distribuerte informasjon som vanlige spørsmål.
  • Den første
    • Navn:
      • Archie
    • Utgitt:
      • 1990
    • Bruk:
      • FTP arkivindeks
    • Utviklet av:
      • Alan Emtage
      • Peter Deutsch
      • Bill Heelan
    • Innovations:
      • Tillatt eksterne brukere å se gjennom lister over anonyme FTP-nettsteder som inneholder:
        • programvare
        • Spørsmål og svar
        • Nyhetsarkiv
      • Periodisk og automatisk oppdatert liste over tilgjengelige servere
    • Annen info:
      • I september 1990 hadde Archie samlet en database med 210 nettsteder
      • Archie inneholdt 2,6 millioner filer (omtrent 150 GB data) i 1992
  • Archies venner
    • Navn:
      • Veronica
      • Jughead
    • Utgitt:
      • 1993
    • Bruk:
      • Gopher-indeks
    • Utviklet av:
      • Fred Barrie og Steven Foster
      • Rhett Jones
    • Innovations:
      • Begge motorene ble utviklet for å gjøre det lettere å søke gjennom Gopher-servere
      • Veronica opprettet indekser av Gopher-tekstfiler
      • Jughead kunne bruke boolske søkeord for å se gjennom en enkelt Gopher-server
    • Annen info:
      • Selv om Archie ikke var ment å referere til tegneseriekarakteren, trodde menneskene som skrev de påfølgende Veronica og Jughead det ville være engasjerende å fortsette temaet
      • Bakronymer ble opprettet for begge:
        • Veronica: “Veldig enkel gnagerorientert nettindeks til datastyrte arkiver”
        • Jughead: “Jonzy’s Universal Gopher Hierarchy Excavation and Display”
      • Veronica søkte gjennom 5 500 Gopher-servere og indekserte over 10 millioner artikler / dokumenter
  • Oppfinnelse av nettet
    • I 1989 startet Tim Berners-Lee og teamet hans ved CERN arbeidet med HTTP:
      • Et system for sending og mottak av hypertekstdokumenter som vil koble seg til hverandre i en slags nett.
      • Det ble raskt utvidet til å gi:
        • Større klient-server forhandling
        • metadata
        • Sikkerhet
    • Tidlige nettlesere inkludert:
      • ViolaWWW
      • I motsatt fall
      • MidasWWW
      • Mosaic
    • Etter hvert som antall webservere vokste, ble nettet grensesnittet for tilgang til Internett:
      • Nye servere ble kunngjort under “Hva er nytt” på NCSA-nettstedet
        • Mange nettsteder ga sin egen liste over “interessante nettsteder.”
      • Denne sentrale listen kunne ikke følge med veksten, noe som skapte et behov for å finne og organisere all informasjonen på nettet

Ingen robot nødvendig

  • Navn:
    • ALIWEB, som står for Archie-lignende indeksering for WEB
  • Utgitt:
    • Oktober 1993
  • Format:
    • Selvindgang nettsted indeks
  • Utviklet av:
    • Martijn Koster
  • Innovations:
    • HTTP-ekvivalent til Archie
    • Brukte ikke en netttsøkende robot
      • Webmastere for deltakende nettsteder måtte legge ut sin egen indeksinformasjon for hver side de ønsker å liste opp
        • Fordeler:
          • Brukere kan beskrive sine egne nettsteder
          • En robot løp ikke rundt og spiste opp nettbåndbredde
        • ulemper:
          • Indeksering av filer var komplisert for de fleste
          • Bruksvanskene betydde en relativt liten database
  • Annen info:
    • De prøvde å utligne kompleksiteten ved å legge til andre databaser i ALIWEB-søk, men den kunne ikke konkurrere med de nyere bot-baserte søkemotorene

Indeksøren

  • Navn:
    • WebCrawler
  • Utgitt:
    • 1994
  • Bruk:
    • Websideindeks for gjennomsøking
  • Utviklet av:
    • Brian Pinkerton
  • Innovations:
    • Første gjennomsøker for å indeksere hele websider, i stedet for bare fil- eller nettstednavn
  • Annen info:
    • Da WebCrawler først ble utgitt, hadde dokumenter fra over 6000 servere
    • Fem måneder etter utgivelsen mottok den i gjennomsnitt 15 000 spørsmål per dag
    • WebCrawler ble raskt så populær at det nesten var ubrukelig om dagen

Bibliotekets edderkopp

  • Navn:
    • Lycos
  • Utgitt:
    • 1994
  • Bruk:
    • Nettstedsindeks
  • Utviklet av:
    • Michael Mauldin
  • Innovations:
    • Det største biblioteket med indekserte nettsteder den gangen
  • Annen informasjon
    • Lycos er oppkalt etter ulvespindelen, Lycosidae Lycosa, fordi edderkoppen jakter byttet sitt i stedet for å fange det på en nett
    • På offentliggjøring hadde Lycos 54 000 dokumenter tilgjengelig
    • Den identifiserte nesten 400 000 dokumenter på en måned
    • I løpet av fem måneder hadde Lycos identifisert 1,1 millioner dokumenter
    • I november 1996 inneholdt katalogen 60 millioner dokumenter

Ordet Smiths

  • Navn:
    • Excite, opprinnelig kalt Architext
  • Utgitt:
    • 1995
  • Bruk:
    • Nettstedets indeks
  • Utviklet av seks Stanford-studenter:
    • Joe Kraus
    • Ben Lutch
    • Ryan McIntyre
    • Martin Reinfried
    • Graham Spencer
    • Mark Van Haren
  • Innovations:
    • Gjort søket mer relevant ved å bruke ideen om å se på ordforhold gjennom statistisk analyse, en banebrytende tilnærming den gangen
    • Ved lanseringen hadde Excite.com indeksert 1,5 millioner sider, et stort antall for den tiden
  • Annen info:
    • Excite hadde signert store avtaler med Netscape og Microsoft
    • Excite fortsatte å vokse med inntekter på over 150 millioner dollar fra og med 1998
    • To stipendiater fra Stanford, Larry Page og Sergey Brin, grunnlagt av Google, og tilbød seg å selge selskapet sitt til Excite for en million dollar i 1999
      • De var villige til å nøye seg med bare 750 000 dollar
      • Excite avviste hva som skulle bli den største søkemotoren i historien – et selskap på 180 milliarder dollar
    • Yahoo ønsket å kjøpe Excite, men ble avslått
    • Excite fusjonerte med @Home Network i 1999, og de gikk konkurs i 2001

Proto-Google

  • Navn:
    • Altavista
  • Utgitt:
    • 1995
  • Bruk:
    • Fulltekst nettsted indeks
  • Utviklet av:
    • Louis Monier
    • Michael Burrows
  • Innovations:
    • Betraktet av History of SEO som “den første søkbare fulltekstdatabasen på hele Internett med et enkelt grensesnitt”
    • Første søkemotor å se etter:
      • Bilder
      • Audio
      • video
    • Opprettet Babel Fish, det første flerspråklige søket, som kunne oversette:
      • Engelsk
      • fransk
      • tysk
      • italiensk
      • portugisisk
      • spansk
      • russisk
  • Annen info:
    • AltaVista betyr “utsikt ovenfra”
    • I 1996 var AltaVista den største nettindeksen
      • 33 GB i størrelse
      • 30 millioner sider fra 225 000 servere
      • Tilgang i gjennomsnitt 12 millioner ganger per dag
        • Det er omtrent 140 ganger i sekundet

Nettbutleren

  • Navn:
    • Spør Jeeves
  • Utgitt:
    • 1997
  • Bruk:
    • Naturlig språkindeks
  • Utviklet av:
    • Garrett Gruener
    • David Warthen
  • Innovations:
    • Utviklet for å være en naturlig søkemotor
    • Menneskelige redaktører hjalp til med noen vanlige søk
  • Annen info:
    • Butleren er en referanse til Jeeves betjent fra P.G. Wodehouse’s Jeeves-Wooster-romaner
    • I 2010 ommarkerte Ask Jeeves seg som et fellesskapsspørsmål & Svartjeneste

Vinneren

  • Navn:
    • Google
  • Utgitt
    • 1998
  • Bruk:
    • Rekursiv nettstedindeks
  • Utviklet av:
    • Larry Page
    • Sergey Brin
  • Innovations:
    • PageRank opprettet et sitasjonsvektingssystem som:
      • Evaluert hvilke nettsteder som var mer pålitelige basert på styrken til andre nettsteder som lenket til dem
      • I dag er dette grunnlaget for nesten alle søkemotorer
  • Annen info:
    • “Side” i PageRank refererer til Larry Page, ikke websider.
    • På grunn av fokuset på tilbakekoblinger ble Google opprinnelig kalt “BackRub”
    • Det første nettstedet som Google-søkeroboten søkte på var Stanford University-hjemmesiden
    • Googles indeks er over 100 millioner GB i størrelse
    • Folk bruker Google for å utføre over hundre milliarder søk hver måned
      • Det er over 40 000 søk per sekund
    • Google Nå:
      • Bruker et naturlig språkbrukergrensesnitt for å:
        • Svar på spørsmål
        • Gi anbefalinger
        • Utfør handlinger ved å delegere forespørsler til et sett med webtjenester
      • Er en intelligent personlig assistent, tilgjengelig:
        • Innenfor Google mobil-app
        • I Google Chrome nettleser
      • Kan levere proaktivt informasjon den forutsier basert på brukernes søkevaner
      • Lar folk bruke Now-kort for å få riktig informasjon til rett tid uten å måtte søke etter det
        • Den organiserer informasjon automatisk i enkle kort som vises akkurat når brukere trenger dem
        • Brukere får pendletrafikk før jobb, finner populære steder i nærheten, og får favorittlagets nåværende poengsum

De små motorene som kunne

Google har ikke mange konkurrenter for tiden, men her er to som prøver sitt beste, til tross for de enorme oddsene:

  • Duck Duck Go
    • Hevder å fjerne all spam som Google leverer i resultatene
    • Har et rent grensesnitt
    • Sporer ikke brukere
    • Har langt færre annonser enn Google
  • Bing
    • Microsofts søkemotor
    • Gir lignende resultater som Google
    • Har en mye mindre database med nettsider
    • Yahoo! bruker Bing for sin søkemotor

Mens de fleste tenker “Google” når de hører “søkemotor”, var det flere forskjellige motorer før Page og Brins webcrawler tok av. Selv om ikke mange bruker Veronica eller Lycos i dag, ville ikke internett være det det er uten dem.

kilder: searchenginehistory.com, sigir.org, csse.monash.edu.au, nlp.stanford.edu, seobythesea.com, groups.google.com, savetz.com, dummies.com, searchenginearchive.com, netlingo.com, searchnetworking. techtarget.com, whatis.techtarget.com, salientmarketing.com, learningthenet.com, ryanmacintyre.com, searchenginepeople.com, todayifoundout.com, thehistoryofseo.com, wiley.com, dictionary.reference.com, mashable.com, archive. wired.com, google.com

kilder

  • Historie om søkemotorer: Fra 1945 til Google Today
  • SMART-systemet – hentingsresultater og fremtidige planer (PDF)
  • Det smarte miljøet for henting av systemevaluering (PDF)
  • Scoring, Rerm-vekting og Vector Space Model
  • Relevant tilbakemelding og Pseudo Relevans tilbakemelding
  • Rocchio klassifisering
  • En Internet Archive Server-server
  • Artikkel av Kevin Savetz
  • Hva er FTP?
  • Før-nett-søkemotorer
  • The Lowdown on Archie, Gopher, Veronica og Jughead
  • Hva er Veronica?
  • Hva er Jughead?
  • Veronica, bestemoren til søkemotorer – 1993
  • Archie’s Pal, Jughead – 1993
  • Søker i databaser
  • En kort historie om begeistring
  • 7 søkemotorer Google utslettet
  • Excite hadde en sjanse til å kjøpe Google for $ 750 000, men avviste det
  • Kort historie om tidlige søkemotorer
  • En historie med søkemotorer
  • Kort historie om tidlige søkemotorer
  • Lykos – 1994
  • Alta Vista innen teknologi
  • Ask.com Reinvents seg selv med fokus på fellesskap Q&EN
  • Fødselen til Google
  • Slik fungerer fungerer
Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me