211service.com
Otevření vyhledávání pro sémantické začátečníky
I když máte skvělý nápad na nový vyhledávač, není zdaleka snadné ho rozjet. Za prvé, nejlepší inženýrský talent sídlí ve společnostech velkých jmen. Ještě významnější je, že podle některých odhadů stojí stovky milionů dolarů nákup a údržba serverů potřebných k indexování webu jako celku.
Yahoo však nedávno zveřejnilo zdroj, který může nabídnout naději hledání inovátorů a podnikatelů. Nazývá se Build Your Own Search Service (BOSS) a umožňuje programátorům využívat index webu Yahoo – miliardy stránek, které jsou neustále aktualizovány – a tím odstraňuje možná největší překážku inovací ve vyhledávání. Otevřením svého indexu tisícům nezávislých programátorů a podnikatelů Yahoo doufá, že BOSS nastartuje projekty, na jejichž vymýšlení mu chybí čas, peníze a zdroje. Prabhakar Raghavan , vedoucí Yahoo Research a konzultační profesor na Stanfordské univerzitě, říká, že by to mohlo zahrnovat lepší způsoby vyhledávání videí nebo obrázků, nástroje, které používají sociální sítě k hodnocení výsledků vyhledávání, nebo sémantický vyhledávač, který se snaží porozumět obsahu webových stránek, spíše než jen soubor klíčových slov a odkazů.
Snažíme se prolomit překážky inovací, říká Raghavan, i když připouští, že BOSS má daleko k altruistickému podniku. Pokud se nový nástroj vyhledávače vytvořený pomocí indexu Yahoo stane populárním a potenciálně ziskovým, Yahoo si vyhrazuje právo umístit reklamy vedle jeho výsledků.
Doposud žádná stránka s BOSSem nebyla tak úspěšná. Řada startupů ale začíná své služby stavět na BOSS a z platformy těží zejména společnosti sémantického webu. Tyto společnosti vyvíjejí software pro zpracování pojmů a významů za účelem lepší organizace informací na webu.
Například, Hakia , společnost se sídlem v New Yorku, začala budovat sémantický vyhledávač v roce 2004. Její algoritmy využívají databázi pojmů – lidí, míst, objektů a dalších – k pochopení pojmů v dokumentech. Hakia také vytváří mapy spojující různé dokumenty, jako jsou webové stránky, na základě těchto konceptů, aby bylo možné pochopit jejich vzájemnou relevanci. Riza Berkan, generální ředitelka společnosti, říká, že zaměření na význam stránek, namísto prostého propojení mezi nimi, by mohlo poskytnout relevantnější výsledky vyhledávání a pomoci lidem najít obsah, o kterém ani nevěděli, že ho hledají.
Aby to však bylo možné dobře, musí mít Hakia přístup k co největšímu počtu webových stránek, a to je místo, kde se BOSS hodí. Pro daný dotaz používá Hakia index BOSS Yahoo k určení sady relevantních výsledků. Software Hakia poté určí, zda tyto stránky již byly analyzovány sémantickým softwarem společnosti. Pokud ne, budou zpracovány a výsledky budou uloženy na serverech Hakia. Stejně procházíme web, říká Berkan. Ale bez indexu Yahoo bychom byli pozadu na stránkách, které dnes lidé hledají. A čím populárnější stránky Hakia naskenuje, tím lepší bude její index.
Další sémantický start, tzv Cluuz , z kanadského Ontaria, postupuje trochu jinak. Když uživatel hledá pomocí Cluuz, uvidí výsledky Yahoo BOSS, ale jejich pořadí se změní podle vlastní sémantické vyhledávací technologie startupu. Když zadáte dotaz, říká Alex Zivkovic, technický ředitel společnosti Cluuz, předáme jej společnosti Yahoo BOSS a získáme zpět seznam výsledků... Poté motor Cluuz pro každou z těchto stránek analyzuje obsah, extrahuje entity – lidi, společnosti, telefonní čísla a podobné věci. Vysvětluje, že tyto koncepty jsou poté porovnány s koncepty na jiných stránkách a koncepty, které se objevují nejčastěji, jsou považovány za nejrelevantnější.
Namísto toho, abychom se dívali na stránky propojené na základě fyzických odkazů, díváme se na ně z hlediska toho, zda mluví o stejných pojmech, říká Zivkovic. To vede k jiné uživatelské zkušenosti, dodává. Například výrazy relevantní k vyhledávacímu dotazu jsou staženy z webu a zvýrazněny vpravo na stránce s výsledky. Hledání Kate Greene okamžitě vyvolá mou e-mailovou adresu na Recenze technologie , univerzitu, kterou jsem navštěvoval, a řadu lidí, se kterými jsem dělal rozhovory kvůli minulým příběhům. Cluuz navíc poskytuje další nástroje, které umožňují snadnou vizualizaci vazeb a vztahů mezi různými sémantickými koncepty.
I se silou indexu Yahoo za společností neexistuje žádná záruka, že Hakia nebo Cluuz budou úspěšní. Ale pokud se prosadí, mohlo by to pomoci Yahoo, které stále zaostává za Googlem, pokud jde o popularitu, znovu získat náskok. Základní filozofií [s BOSSem] je, že nebudeme schopni vymyslet všechno sami, říká Raghavan. Měli bychom tedy usnadnit inovace.