211service.com
Ponořte se hlouběji do vyhledávání na webu
Jednou z nejžhavějších hranic ve vyhledávání na webu je hledání způsobů, jak zlepšit výsledky na základě preferencí hledajících. Už když se přihlásíte do Googlu, vyhledávač se snaží personalizovat výsledky tím, že doluje vaši historii vyhledávání: žákovi osmé třídy, který provedl mnoho hledání mořského života, může hledání delfínů poskytnout více výsledků pro zvíře než pro fotbalový tým.
Nyní Surf Canyon , startup se sídlem v Oaklandu, CA, přidává svůj vlastní směr personalizace. Jeho software, který lze stáhnout a nainstalovat do webových prohlížečů Firefox a Internet Explorer, vylepšuje jednotlivá vyhledávání ve velkých vyhledávačích tím, že vyhodnocuje, na které odkazy klikáte, a poté vám okamžitě poskytuje revidované výsledky vyhledávání – včetně tří webů, které se nějakým způsobem týkají web, na který jste klikli. Vynalezli jsme personalizaci v reálném čase, říká Mark Cramer, generální ředitel společnosti.
Například hledání termoelektrického chladiče Google pomocí Firefoxu s nainstalovaným Surf Canyon poskytuje 10 standardních výsledků. V mém případě se osmý výsledek od freescale.com, výrobce čipů, zdál slibný. Kliknul jsem na to, naskenoval stránku a pak stiskl tlačítko Zpět. Když jsem se následně podíval na stránku s výsledky, objevily se tři nové návrhy přímo pod výsledkem freescale.com. Surf Canyon povýšil tyto odkazy z předchozích 100 stránek výsledků, protože jeho algoritmus určil, že tato doporučení se týkají informací na freescale.com, včetně technických vysvětlení, jak fungují termoelektrické chladiče.
Zásadní je, že tyto nové výsledky jsou chytře vsunuty do výsledků vyhledávání, takže původní stránka s výsledky nevypadá drasticky odlišně, když uživatel přejde zpět. Cramer říká, že by uživatele odradilo, kdyby v původních výsledcích viděli odkaz, na který chtěli kliknout, ale když se vrátili k výsledkům, zjistili, že chybí. Doporučené výsledky se proto automaticky zobrazí pouze pod odkazem, na který jste klikli. Nechceme uživatele rušit, říká Cramer. [Surf Canyon je] speciálně navržen tak, aby byl co nejméně nápadný.
V zákulisí umožňuje personalizaci algoritmus. Algoritmus mimo jiné analyzuje, na které výsledky bylo kliknuto, které jsou ignorovány a kolik času uživatel stráví prohlížením stránky. Důležité je, říká Cramer, že algoritmus sémanticky dekonstruuje stránku, aby určil, co to znamená a jak podobná je ve výsledcích ostatním. Výsledky jsou kumulativní: po několika kliknutích může algoritmus určit, zda vás nejvíce zajímá fotoaparát Canon, zrcadlovka nebo konkrétně zrcadlovka Canon, říká Cramer.

Odhalené výsledky: Vyhledávání Google pro termoelektrický chladič vrací 10 standardních výsledků. Po kliknutí na první výsledek a následném kliknutí zpět na stránku s výsledky Surf Canyon zobrazí tři navrhované výsledky pod prvním.
Marti Hearst , profesor na School of Information na University of California v Berkeley, říká, že Surf Canyon uspěl v prezentaci přeuspořádaných odkazů jasným, užitečným a nenápadným způsobem. Nevyžaduje od lidí žádnou práci navíc, stejně jako WikiSearch od Googlu, což je funkce, která uživatelům umožňuje personalizovat své výsledky hlasováním nahoru nebo dolů.
Ve svých testovacích případech však Hearst zjistila, že přehodnocené výsledky algoritmu nebyly zcela užitečné. Tam, kde personalizace funguje, jsou dotazy nejednoznačné, říká, ale dotazy se v průběhu let stále prodlužují a mají tendenci poskytovat vodítka, která pomáhají motoru samo o sobě zpřehlednit výsledky. Navíc v Hearstových testech Surf Canyon zjistila, že pouze do určité míry rozpletla různé významy zkratky ACL (což by mohlo znamenat jak přední zkřížený vaz, tak Asociaci pro počítačovou lingvistiku): stále obsahoval smíšené výsledky, i když cítila že její klikací volby daly jasně najevo, že se zajímá o lingvistickou skupinu.
Cramer a jeho tým říkají, že dosáhli pozitivnějších výsledků. Ve studii, kterou provedli, se některým účastníkům zobrazila druhá stránka výsledků vyhledávání, která byla změněna podle algoritmu Surf Canyon, zatímco jiní viděli druhou stránku se standardními výsledky. Výzkumníci zjistili, že účastníci, kteří měli přístup k přeuspořádaným výsledkům, na ně klikali o 30 až 40 procent častěji.