INTERNET<>
112004<><>

Pretraživanje

Pretraga ljudskog znanja

Iz novih dostignuća proističu novi problemi

Jedan od nedosanjanih snova jeste onaj o prebacivanju celokupnog ljudskog znanja u digitalni format, pri čemu bi čovečanstvo – putem Interneta – imalo neograničen pristup svim njegovim dostignućima i delima. Naučnici naziru trenutak kada će taj san tehnički moći da bude ostvaren, ali upozoravaju da će se paralelno s tim pojaviti nova mora – kako pretraživati tako ogromnu količinu informacija.

Iako su komercijalni pretraživači umnogome olakšali i optimizovali pristup željenim informacijama, a tehnologije za digitalno skladištenje podataka dovoljno su pojeftinile i uznapredovale da se gotovo svaki podatak može bez problema prebaciti u digitalni format, algoritmi alata za pretraživanje moraju da pretrpe dodatna poboljšanja kako bi od mnogo sadržaja sačinili upotrebljiv i validan sažetak (digest).

Veliki broj naučnika i istraživača bavi se upravo ovom oblašću – dizajniranjem pretraživača naredne generacije koji će korisnicima obezbediti brzu i uspešnu navigaciju kroz njihove lokalne diskove ili Web. Tako se na Univerzitetu Kalifornija sačinjava prototip pretraživača pod nazivom Flamenco, koji je specijalizovan za „češljanje” podataka koji su u vezi sa umetničkim delima i materijalnim spomenicima kulture. Kompanija Inxight kreirala je softver koji grafički predstavlja potencijalne veze između ljudi i institucija, prema tome gde su i u kom kontekstu pomenuti na Webu. Krajnjim korisnicima okrenuti su projekti poput onog koji vodi Ingenuity Software i koji je usmeren ka stvaranju alata za indeksiranje lokalnih sadržaja na diskovima, da bi se oni potom lakše pronalazili kroz interfejs sličan Googleovom.

Svoje ambiciozne planove za unapređivanje ove veoma bitne oblasti korišćenja uskladištenih digitalnih informacija ne kriju ni proizvođači operativnih sistema, od kojih – po prirodi stvari – mnogo toga zavisi. Tako kompanija Microsoft planira da u svom narednom Windows sistemu, čiji je kodni naziv Longhorn i čije se pojavljivanje na tržištu očekuje 2006–2007, značajno unapredi tehniku pretrage lokalnih sadržaja, što će korelirati s implementacijom budućeg pretraživačkog servisa ove kompanije čija se priroda drži u tajnosti. Apple Tiger, nova verzija operativnog sistema Mac OS X koja se očekuje sledeće godine, imaće ugrađen pretraživački mehanizam pod nazivom Spotlight koji će korisnicima Macintosh računara umnogome olakšati snalaženje u gomili informacija.

Jedan od najvećih aktivnih projekata koji se bave arhiviranjem digitalnih sadržaja jeste Internet Archive (www.archive.org) i cilj njegovih autora je da vremenom postane univerzalno skladište svega što je ljudski rod ikada objavio. Bruster Kel, jedan od rukovodilaca projekta, iznosi podatak da je u dosadašnjoj istoriji globalne civilizacije objavljeno oko 100 miliona knjiga, od kojih se 28 miliona nalazi u Kongresnoj biblioteci u Vašingtonu. Pošto se svaka knjiga može sažeti na oko 1 MB MS Word dokumenta, proizlazi da se cela ta biblioteka može konvertovati u digitalnu formu veličine oko 28 TB. Trenutna cena takve konverzije iznosi svega nekoliko stotina hiljada dolara, a procesi masovnog skeniranja nacionalnih bibliotečkih fondova već se uveliko odvijaju u Indiji i Kini.

Međutim, drama oko pronalaženja željenog ne odvija se samo na opštem, već i na individualnom, „desktop” planu. Upečatljiv primer dolazi nam od naučnika Gordona Bela koji u okviru projekta MyLifeBits koji vodi Microsoft Research pokušava da indeksira i sistematizuje sve informacije koje je ikada iskusio u svom životu – knjige, filmove, TV emisije, muziku i druge sadržaje. Do sada je Bel svoje kognitivno životno iskustvo uspeo da prevede u 44 GB digitalnih podataka.

Sistem grupisanja podataka po fajlovima, kakav znamo od početaka primene personalnih računara, vremenom će zastareti i biće zamenjen novim, u kojem će podaci biti tako označavani da će korisniku, na primer, biti neophodno da se seti samo dela nečijeg imena da bi potom pretraživač uspeo da locira dokumente i/ili slike povezane s tom osobom, a koji bi dalje bili logički povezani s drugim relevantnim podacima – razgovorima koje je korisnik obavio istog dana s drugima ili dokumentima koje je sačinio tog datuma.

Dušan KATILOVIĆ

 
Pretraživanje
Šta mislite o ovom tekstu?
Sve o PDV-u
Google SMS
e-zdravstvo
.yu
Gogotools
Šta sve putuje Internetom
„Odjava s liste” nije dobra ideja
Eh taj Zapad...
Ko s đavolom tikve sadi...
Bosanska prevara
Milion pesama za nedelju dana
GMail Drive

Procena je da na planeti postoji između dva i tri miliona audio-zapisa i da se uglavnom odnose na muziku. Internet Archive započeo je čuvanje digitalizovanih snimaka koncerata i trenutno ta baza sadrži oko 15.000 stavki. Filmskih ostvarenja ima između 100 i 200 hiljada i polovina njih potiče iz Indije. Ukupna produkcija svih televizijskih stanica u svetu iznosi oko 20 terabajta podataka mesečno, dok se i sam Web uvećava po istoj stopi. Od 1984. u svetu je izdato oko 50.000 softverskih aplikacija.
Home / Novi brojArhiva • Opšte temeInternetTest driveTest runPD kutakCeDetekaWWW vodič • Svet igara
Svet kompjutera Copyright © 1984-2018. Politika a.d. • RedakcijaKontaktSaradnjaOglasiPretplata • Help • English
SKWeb 3.22
Opšte teme
Internet
Test Drive
Test Run
PD kutak
CeDeteka
WWW vodič
Svet igara



Naslovna stranaPrethodni brojeviOpšte informacijeKontaktOglašavanjePomoćInfo in English

Svet kompjutera