Internetowe poszukiwania
Domowy komputer
Internet to podobno 4 miliardy dokumentów. A może 5… Nie jest tak naprawdę ważne, ile dokładnie, bo jest to wartość duża i zmienna. Ważne jest, jak w tej masie informacji sensownie się poruszać, czyli – jak znaleźć coś lub kogoś, bo podobno prawie wszystko i prawie wszystkich można.
Internet to z jednej strony jakby największa na świecie gra słów, a z drugiej ogromna liczba połączonych ze sobą w sieć tzw. serwerów, czyli mocnych komputerów zajmujących się przekazywaniem (serwowaniem) słownych próśb o dokumenty oraz odpowiedzi na nie. Tylko jedna firma – Google ma 200 tys. serwerów, a więc więcej niż zaledwie 30 lat temu było wszystkich komputerów na całej planecie, nie wspominając o ich mocy. Większość spełnia zadanie podobne do megakatalogów bibliotecznych, oferując adresy i gigantyczne kolekcje tzw. indeksów, czyli spisów stron i podstron wraz ze słowami kluczowymi.
Problem w tym, że większość internetowych poszukiwań jest co najmniej nieprecyzyjna i odbywa się często w wyjątkowo przez nas uproszczony, jeśli nie prymitywny sposób, z użyciem zaledwie kilku słów i oczywiście najczęściej tylko w jednym języku. Internet ma jednak tyle warstw, ile jest języków na świecie z oczywistą przewagą angielskiego, ale hiszpański, kantoński, mandaryński, hindi i inne nadganiają szybko.
50 procent wyszukiwań to zaledwie dwa-trzy słowa, 20 procent to jedno, a tylko 5 procent to więcej niż sześć.
Byłoby wspaniale, jeśli to jedno, dwa czy więcej słów byłyby celne i właściwe, ale najczęściej niestety tak nie jest i w rezultacie dostajemy albo ogromną liczbę linków, które są fizycznie nie do przejrzenia, albo w ogóle nie to, o co chodziło.
Przykłady:
• Bezskutecznie szukałem wytwórcy ładnych naklejek reklamowych, ale takich wypukłych, „plastycznych”, zatopionych w przejrzystym tworzywie, aż do czasu kiedy dowiedziałem się wreszcie, że nazywają się „domed stickers”. Słowo „domed” (sferyczne) było kluczem, bez tego zamek informacji pozostawał zamknięty. Pocztówki trójwymiarowe z kolei to „lenticular postcards” i tylko ta kombinacja słów jest dobra, inne nie.
• USA to kraj imigrantów. Na początku dla każdego najważniejsze pytania formalne to „kiedy dostanę zieloną kartę”, „jak długo czeka się na obywatelstwo” itd. Większość za odpowiedź po prostu płaci prawnikom. Oczywiście kontakt z nimi jest często nieodzowny. Ale przedtem magiczne słowa w internecie to „priority date”, „visa bulletin” lub „cutoff date”, a użycie zestawu co najmniej czterech z wymienionych pięciu słów to strzał w dziesiątkę, czyli po prostu link do strony Departamentu Stanu, gdzie podawane są daty spraw rozpatrywanych obecnie w różnych kategoriach wizowych: rodzinne, zawodowe itd. Tym biuletynem posługują się i wszyscy fachowcy imigracyjni, i wszystkie działy konsularne ambasad USA na całym świecie.
Dla serwerów i algorytmów wyszukiwarek słowa to ciągi liter i liczb, jak szyfry lub hasła otwierające zamknięte sejfy. Odpowiedź bazy danych jest na ogół tylko tak dobra, jak dobra była kwerenda zapytania.
Proste sposoby szukania:
• Zebranie jak największej liczby właściwych słów określających to, czego szukamy i próbowanie różnych ich zestawów.
• Jeśli rezulataty pod zakładką „Web” różnych wyszukiwarek dają za dużo lub nic, spróbujmy pod „Images”. Ta forma szukania jest zdecydowanie szybsza (i mniej skomercjalizowana). Rezultaty są łatwiejsze do oceny jednym rzutem oka, bo wynik to obrazki jak znaczki w klaserze, a nie mnóstwo linków tekstowych, które trzeba czytać.
• Liczba pojedyncza: „Greece travel” da ten sam efekt co „Greece travels”
• Różne słowa znaczeniowo identyczne: np. „Mumbai student hostel” i „Bombay student hostel” dadzą inne rezultaty, choć Mumbaj dotąd nazywał się Bombaj i chodzi o to samo miasto. Użycie „Bombaj” da rezultaty po polsku.
Używanie dużych i małych liter powoduje „case sensitivity” i zawężenie szukania do dokładnej pisowni słowa.
• Niektóre serwisy pozwalają na używanie tzw. operatorów logicznych, czyli nawiasów; and, or, not, near (to akurat wymóg, żeby słowa występowały obok siebie) dają precyzyjniejsze rezultaty. Użycie „or” wyselekcjonuje pliki zawierające jedno lub drugie słowo oraz oba wybrane słowa (np. „university OR college”). Użycie „and” zawęzi poszukiwania tylko do plików zawierających oba wybrane słowa (np. „poverty AND crime”). Użycie „not” wyeliminuje słowo niechciane, które może się pojawić w czasie poszukiwań (np. „cats NOT dogs”). Więcej na ten temat pod hasłem „Boolean Search”.
• Sprawdzenie, co kto sprzedaje na interesujący nas temat na aukcjach ebay. com, allegro. pl ebay. de, ebay. pl itd. Sprzedawcy czasem wkładają dużo pracy w opis, bo wiedzą, że to pomaga w sprzedaży. Można też pytać e-mailem.
• Użycie „+” tuż przed szukanym słowem (bez spacji) wymusza obecność tego słowa w identycznej pisowni. Użycie znaku „–” tuż przed słowem (bez spacji) eliminuje rezultaty zawierające to słowo. Bardzo przydatne w nadmiarze informacji. Np. na eBay-u szukamy aparatu Nikon 8800, ale przede wszystkim dostajemy lawinę rezultatów na gadżety, osprzęt do tego modelu. Użycie: „nikon 8800 –case –battery –bag –filter –charger –tripod –lens” eliminuje je.
• Przetłumaczenie słowa lub frazy na inny język, np. w serwisie Babel Fish Translation (www. altavista. com/) i poszukiwanie odpowiedników stron w innych językach.
Najpopularniejsze serwisy wyszukiwarek:
www.google.com
www.yahoo.com
www.msn.com
www.lycos.com/
www.altavista.com/
(z Babel Fish Translation)
www.ask.com
www.excite.com
http://www.webcrawler.com
Inne pokrewne serwisy:
www.researchbuzz.com/wp/ – opisy, a także linki do narzędzi Googla, np. przeszukiwanie dokumentów stanowych
http://hot-deals.org – prosty serwis informacyjny nt. okazji, wyprzedaży elektroniki, komputerów itp., a także dobry przewodnik nt. telewizorów HDTV.
http://www.wordtracker.com – serwis punktujący popularność słów i aktualnych poszukiwań wraz z sugestiami. Płatny, podstawowa/próbna wersja (bez limitu czasowego) jest darmowa. *
Artykuły z numeru:
NR 8 JESIEŃ 2006
- Bydgoszcz - Wojciech Kowalski
- Duet na cztery ręce - Agata Ostrowska-Galanis
- Internetowe poszukiwania - Mirosław Waluś
- Jesienne tango z kwiatami - Jolanta Wysocka
- Jesienny pomocnik, czyli... power blower - Aneta Sadowska
- Liberalizm i Red Sox - Katarzyna Zalewska
- Listopad... miesiąc chryzantem - Małgorzata Sulewska
- Malarstwo 'naiwne' - Czesław Karkowski
- Manewry na trudniejsze czasy - Tomasz Deptuła
- Małe mieszkanie z widokiem na wielki świat - Aneta Sadowska
- Mebel F. - Aneta Sadowska
- Na ostrzu noża - Ewa Sukiennik-Maliga
- Okruchy wspomnień... -
- Quhnia... rodem z Powiśla - Janusz M. Szlechta
- Rezydencje multimilionerów - Ewa Sukiennik-Maliga
- Spyker... Latający Holender - Marek Siodłoczek
- Strachy w Chicago - Danuta Peszyńska
- Zapach domu - Jan Latus
- Ze słońcem na dachu - Jolanta Wysocka
- Zielone oazy - Halina Niedzielska