Scinet.cz » Internet, Kauzy, Kavárna, Komentáře

Seznam – najdu tam, co HLEDÁM? A také Kterak Microsoft znásilňuje Google a jeho výsledky vyhledávání

5.2. 2011, Oldřich Klimánek

Jedna lokální, spíše úsměvná historka o kreativitě v Seznamu, který si zaregistroval lidový rýpanec v opačném gardu. A druhý závažnější příběh o „inovaci“ v Microsoftu, který svůj vyhledávač Bing optimalizuje tak, že přebírá výsledky z Googlu.

Seznam, Google a tak

Poslední měsíc jsme si mohli všimnout webových a TV reklam na „novou komunikaci Seznam.cz“, jak firma prezentuje změny, které nasadila v novém roce. Pokud jste televizní reklamu viděli, dost možná vás něco zatahalo za uši. Místo „Seznam, najdu tam, co neznám,“ slyšíme „Seznam, najdu tam, co hledám.“ Nebylo by na tom nic zvláštního, a většina uživatelů neznalá reálií internetu minulých let na tom ani nic nenajde, kdyby ovšem toto heslíčko nebylo dlouhá léta používáno právě jako rýpanec do Seznamu, resp. do kvality jeho vyhledávače. Pamatujete?: „Seznam, najdu tam, co neznám. Google, najdu tam, co hledám.“

Google sám ve vtipu na svém českém několik let používal „Google, najdu tam, co hledám. ;)“ Viz jeden screenshot. Teď na tomtéž místě však slogan nenajdete. Google nebyl autorem tohoto sloganu a ani si jej nenechal registrovat. Neměl ani důvod. Spojení vzniklo prostě mezi lidmi, na internetu je používal kdekdo.

Léta běžela, až se stalo, že počátkem roku 2011 seznam oznámil „novou komunikaci“. Sešlo se pár chytrých hlav a přišli s originálním nápadem. „Seznam, najdu tam, co hledám.“ Zlidovělé spojení v opačném gardu bylo Seznamem zaregistrováno v květnu 2010. Google je již nepoužívá, což je vzhledem k registraci Seznamem pochopitelné.

Samozřejmě že „nový“ slogan Seznamu vzbudil mezi lidmi rozruch. Uživatelé, kteří se ve vlnách internetu pohybují roky, dobře věděli, že Seznam si osvojil něco, co nevymyslel. Z právního hlediska to však vymyslel, protože si slogan zaregistroval. Vědělo se a ví se, že věta „Google, najdu tam, co hledám“ se mezi lidmi používala dlouhé roky. A tak se začalo pátrat, kam až sahá historie celého spojení „Seznam, najdu tam, co neznám. Google, najdu tam, co hledám.“ Při hledání ve webových archivech se dostaneme do historie staré sedm let. Minimálně sedm let toto spojení kolovalo internetem. Ne že by to mělo nějakou rozhodující roli, ale ještě v roce 2009, před registrací sloganu Seznamem, například na Facebooku vznikla stejnojmenná skupina.

Seznam na novém sloganu nevidí nic špatného. Důvod je samozřejmě ten, že Google si heslo nezaregistroval.

„Registrace nového sloganu ‚Najdu tam, co hledám‘, která proběhla již na jaře roku 2010, vycházela z logiky celkového vývoje, kterým prošel internet a portál samotný od doby, kdy byl vymyšlen slogan původní,‘ uvádí PR oddělení Seznamu. „Internet byl tehdy neznámým prostředím a tomu také odpovídal slogan Seznam … najdu tam, co neznám. Nyní už je ale internet pro většinu lidí něčím, bez čeho by se neobešli. Stal se pro nás zdrojem všeho, co zrovna hledáme. Změna sloganu je proto jen reakce na internet současné doby,“ řekl Pavel Zima, generální ředitel Seznam.cz.

Jde o prkotinu. Pouhý slogan. Prkotina to je tak nevýznamná, že lidový rýpanec v obráceném pořadí si musel Seznam zaregistrovat a ještě dlouze a logicky vysvětlovat tento krok změnou vývoje na českém internetu.

Slova Pavla Zimy, že „změna sloganu je jen reakce na internet současné doby“ jsou však podstatná a hodně pravdivá: Google totiž v poslední době začal na českém trhu růst. Investuje do televizních reklam a jeho podíl roste. A stačí si vzpomenout na nedávné dění, kdy se objevily informace, že podíl vyhledávače Google předčil podíl vyhledávače Seznamu. To bylo záhy ze strany Seznamu vyvráceno slovy o špatné metodice měřáku atd.

A nechat lidi a Google, aby si ze Seznamu, jeho vyhledávače, dělali legraci v době, kdy podíl Seznamu klesá, nejde. Google slogan „Google, najdu tam, co hledám ;)“ stáhl. Nic to však pro něj neznamená. Seznam pouze zabránil tomu, aby se roky používané srovnání Seznamu a Googlu nadále nepoužívalo. Seznam bude vždy portálem pro masy, ale jeho vyhledávač nemůže uspokojit ty, kdo informace opravdu hledají.

Google vykraden: Bing.com

Daleko podstatnější problém, který se dotkl Googlu na citelnějším místě, souvisí ale s Microsoftem a jeho vyhledávačem Bing.

Google totiž zjistil, že Microsoft zneužívá výsledky Googlu pro svůj vyhledávač Bing.

Informace o tom se na veřejnost dostaly před pár dny. Ale Google oficiálně nic neřekl. Až 2. února.

Celý vtip je následující – Google si prostě udělal malý experiment, který odhalil, jak „inovativně“ Bing optimalizuje výsledky vyhledávání.

Lidé z Googlu si loni v létě všimli, že Bing například nedává žádné výsledky při zadání slova „torsorophy“, což je špatně napsané slovo „tarsorrhaphy“. Google ale vracel výsledky odpovídající správně napsanému slovu — a také překlepy opravil.

A Bing zanedlouho začal vracet stejné výsledky jako Google. Ale opravu slova nenabídl. „To bylo divné. Jak mohl Bing vracet naše nejvýše postavené výsledky bez správného zadání slova [tarsorrhaphy]? Kdyby Bing znal správné zadání slova, mohl vrátit několik dalších relevantních výsledků.“ Jenomže to se nestalo. Bing zobrazoval pouze výsledky, které se objevily na prvních místech ve výsledcích z Googlu.

A Google zbystřil. Dalším pozorováním bylo zjištěno, že v následujících měsících se odkazy, jež vracel vyhledávač Googlu, objevovaly i ve výsledcích Bingu. „V Bingu se stále častěji objevovaly URL odpovídající různým dotazům, těm populární, ale i vzácným a nezvyklým či špatně napsaným.“ To však není vše. „V Bingu se začaly objevovat i ty výsledky vyhledávání, které vznikly chybou našeho algoritmu.“

Míra toho, jak se výsledky z Googlu začaly objevovat na Bingu, byla čím dál větší. „Z hlediska statistiky tohle nešlo ignorovat.“ A tak Google udělal experiment.

Inženýři z Googlu vytvořili kolem stovky „syntetických dotazů“, u kterých je jasné, že je nemohl napsat člověk s tím, že by něco hledal. Příkladem je třeba řetězec hiybbprqag. K takovým řetězcům pak Google uměle přiřadil výsledky vyhledávání — reálnou, existující adresu opravdové webové stránky, která však s umělým dotazem neměla nic společného.

Po zadání nesmyslného textu tedy vyhledávač vracel odkaz na takovou webovou stránku, viz obrázek níže.

„Pak jsme dvaceti našim inženýrům dali laptopy s čerstvě nainstalovaným systémem Microsoft Windows, kde běžel Internet Explorer 8 s nainstalovaným Bing Toolbar (lišta Bing). Během instalace jsme povolili funkci IE8 „Navrhované weby“ a použili výchozí nastavení nástroje Bing Toolbar.“

Inženýři z Googlu poté na domovské stránce Googlu do vyhledávače zadávali syntetické dotazy. Google jim vrátil výsledky, na ty klikli. „Jaké to bylo překvapení, když za pár týdnů, co náš experiment běžel, se námi ručně vložené výsledky začaly objevovat ve výsledcích Bingu.“

Výsledky vidíte na obrázku níže. Bing vrátil na nesmyslný dotaz, na syntetický řetězec znaků, odkaz na tutéž stránku, kterou do výsledků svého vyhledávače ručně vložili zaměstnanci Googlu.

Aby měli v Googlu jistotu, použili více nesmyslných dotazů. Výsledek stejný. Neexistující řetězce Bing správně přiřadil webovým stránkám, které uměle do svého vyhledávače k těmto řetězcům přiřadil Google.

„Do vývoje hledacích algoritmů jsme investovali tisíce člověkohodin. To proto, že chceme, aby naši uživatelé dostali tu správnou odpověď pokaždé, když něco hledají. A to není snadné. Těšíme se, že budeme soutěžit s ryze novými vyhledávacími algoritmy — algoritmy postavenými na čisté inovaci, ne na recyklovaných výsledcích vyhledávání. Takže všem uživatelům, kteří hledají nejautentičtější a nejrelevantnější výsledky vyhledávání, můžeme jen vzkázat: navštivte raději přímo Google. A těm, kdo se nás ptají, co tím vším cílíme, odpovíme jednoduše: aby tyto praktiky ustaly.“

Tisková mluvčí Microsoftu médiím řekla následující: „Výsledky Googlu nekopírujeme.“

Oldřich Klimánek, Scinet.cz pro DSL.cz

Oldřich Klimánek

Provozovatel serveru Scinet.cz.


Komentáře (5) »

  • Jan Andrle napsal:

    Osobně nemám rád výroky typu „Seznam bude vždy portálem pro masy, ale jeho vyhledávač nemůže uspokojit ty, kdo informace opravdu hledají.“, protože ze skutečnosti vím, že důležité je, jak jsou dané informace hledány. Typickým důkazem je aféra řešená v diskuzi na Živě.cz. Diskutující hodnotil vyhledávání výrazu „cívka 16mm“ na Seznamu a Googlu, nutno říci, že hledal cívku do promítačky. Na Seznamu byl první odkaz na cívku na sváření, zatímco na Googlu byl první odkaz „správný“ -> tak tedy usoudil, že Google je lepší, nevadilo mu, že chudáci svářeči byli v Googlu až 6 místě. Přitom stačilo daný výraz upravit třeba takto: „cívka do promítačky 16mm“ a oba dva měli >>totožné<< výsledky. Osobně používám oba vyhledávače (když počítám Bing jako součást Seznamu) cca 10 let a netroufl bych si říci, který je obecně lepší. Každý indexuje jinak, používá priority jinak a používá jinou logiku vyhledávání, prostě každý ať si vyzkouší a používá ten, který mu vyhovuje.

    Co se týká aféry BingGoogle, autor by si měl o dané problematice něco přečíst (Živě.cz, cnet.com, myslí že i Lupa aj.). Microsoft totiž opravdu nekradl data tak, jak si asi představuje autor, totiž, že si někoho najali, aby hledal na Googlu a to poté využili v Bingu. Vše se totiž točí pouze kolem lištiček (toolbarů), které sbírají data o navštěvovaných stránkách (pokud si ji uživatel nainstaluje). Programátoři Googlu neudělali totiž nic jiného (což sami také později přiznali na svém evropském blogu), než že vytvořili nesmyslné odkazy (viz tento článek) a poté s nainstalovanou Bing lištičkou tyto odkazy týden navštěvovali -> lištička tyto data sbírala a posílala do Microsoftu a podle nějakého algoritmu byli nakonec tyto data přijaty i do vyhledávače Bing. Vyjádření Googlu ve smyslu, že máme používat rovnou jejich vyhledávač, je do nebe volající. Protože Google Toolbar nedělá nic jiného, než že také sbírá data a posílá je do Googlu! Navíc Google sbírá data také přes AdWords a lištičky jiných programů (a vetšinou se to neobtěžuje zdůraznit).

    Jinými slovy, aby byl nějaký vyhledávač opravdu dobrý potřebuje velké (opravdu) velké množství dat, tedy Google se zachoval opravdu hnusně, když se pokusil touto aférou naverbovat nové uživatele, zvláště, když on se v oblasti sbírání dat chová dost na hraně!

  • Oldřich Klimánek napsal:

    Pokud to u vás začíná a končí hledáním cívek, pak gratuluji. Seznam nedává odpovídající výsledky ani pro české weby, natož světové. Už jste někdy slyšel o týmu, který vyhledává weby a ručně je seřazuje podle vlastního zvážení relevance? To jen na okraj. Já vám Google nenutím, prokristapána. Klidně si přepínejte mezi 10 vyhledávači, ale jsou lidé, co chtějí výsledky a vystačí si s jedním vyhledávačem. Nemluvě o zahraničních výsledcích.

    Microsoft totiž opravdu nekradl data tak, jak si asi představuje autor, totiž, že si někoho najali, aby hledal na Googlu a to poté využili v Bingu.

    Můžete mi říct, kde v článku je tohle napsáno?

    Diskuse, kde čtenář autorovi něco doporučuje, ale sám není schopen chápat psaný text, mě nebaví.

    Ostatně zkusme si odpovědět na tuto otázku: pokud by „najatí“ lidé přebírali výsledky z Google ručně, mohl byste mně vysvětlit, jak by moli hledat neexistující řetězce jako hiybbprqag? Opravdu nesouhlasíte s tím, že jste nepochopil, co je v článku napsáno, resp. jste tam viděl, co jste vidět chtěl?

    Vyjádření Googlu ve smyslu, že máme používat rovnou jejich vyhledávač, je do nebe volající. Protože Google Toolbar nedělá nic jiného, než že také sbírá data a posílá je do Googlu!

    Takže ještě jednou: Bing Toolbar je produkt Microsoftu. Microsoft není Google. Bing Toolbar sbírá data z vyhledávání a prokliků lidí, kteří používají Google. Tyto výsledky pak používá sám. Takže Bing od Microsoft používá výsledky práce Googlu, jiné firmy. Google používá k řazení výsledky vyhledávání v rámci sebe sama. Google používá výsledky vlastní. Je vám ten rozdíl jasný, nebo potřebujete ještě jednou asistenci?

    Google se zachoval opravdu hnusně, když se pokusil touto aférou naverbovat nové uživatele

    Blbost nezná mezí, tohle je světlá výjimka, že diskutuji. Ano, jeden článek týmu Googlu psaný v angličtině je opravdu obrovská PR kampaň na nábor uživatelů. A Google je opravdu hnusný, když si dovolil pozastavit nad tím, že MS si bere jeho výsledky vyhledávání přes spyware Bing Toolbar.

  • Jan Andrle napsal:

    Prvně bych se rád omluvil autorovi za tento výrok, opravdu jsem si jeho článek pořádně nepřečetl a navíc jsem přeháněl.

    Microsoft totiž opravdu nekradl data tak, jak si asi představuje autor, totiž, že si někoho najali, aby hledal na Googlu a to poté využili v Bingu.

    to Oldřich Klimánek
    Vyhledávání u mně ani zdaleka nekončí u hledání cívky (mohl bych si také rýpnout že neumíte číst). Nevím kde jste četl, že seznam řadí výsledky ručně (autorem této myšlenky bude opravdu asi blbec), ale je to nesmysl. Zvláště pak při hledání v zahraničí, vždyť využívá Bing! Stojím si za výrokem, že bych si netroufl říci, který je globálně lepší.

    Takže ještě jednou: Bing Toolbar je produkt Microsoftu. Microsoft není Google. Bing Toolbar sbírá data z vyhledávání a prokliků lidí, kteří používají Google. Tyto výsledky pak používá sám. Takže Bing od Microsoft používá výsledky práce Googlu, jiné firmy. Google používá k řazení výsledky vyhledávání v rámci sebe sama. Google používá výsledky vlastní. Je vám ten rozdíl jasný, nebo potřebujete ještě jednou asistenci?

    To je pravda jen částečně, cílem obou toolbarů je sběr dat odevšad (tj. pokud jsem právě na Bingu s Google Toolbarem, pak Google toolbar také posílá data, teď jsem si to zkoušel) a co AdSence aj metody Googlu?

    Blbost nezná mezí, tohle je světlá výjimka, že diskutuji. Ano, jeden článek týmu Googlu psaný v angličtině je opravdu obrovská PR kampaň na nábor uživatelů.Pokud se nepletu, pak se nejednalo pouze o zveřejnění na blogu, ale také o brífink pro tisk, to jsem kritizoval.

  • Oldřich Klimánek napsal:

    Vyhledávání u mně ani zdaleka nekončí u hledání cívky (mohl bych si také rýpnout že neumíte číst).

    Vybral jste si jeden hloupý příklad s cívkou a nazval to aférou. Vtipný příklad, vtipná odpověď.

    Stojím si za výrokem, že bych si netroufl říci, který je globálně lepší.

    To není tvrzení. Tvrzení by bylo „Seznam/Google/Bing je lepší“. Ale OK: Samozřejmě že pod pojmem „být lepší“ každý vidí něco jiného. Nevím, v jakém oboru se pohybujete a co hledáte. Je mně to jedno. Každopádně, že Seznam je a bude pro masy, které se na internetu nevyznají, je pravda. Pro mnohé Internet = Seznam.cz. S tím nikdo nic nenadělá ani dělat nemusí.

    Nevím kde jste četl, že seznam řadí výsledky ručně (autorem této myšlenky bude opravdu asi blbec), ale je to nesmysl.

    Ach, opravdu, ale opravdu tohle nemá smysl. Znáte někoho v Seznamu? Nebo někoho, kdo tam dělal? Pokud ne, zkuste si třeba vygooglit (:-)) „Seznam.cz kalibrace výsledků“. Nebo se přímo podívejte zde: http://kalibrace.seznam.cz/login?url=/calibration Tam se hlásí zaměstnanci a brigádníci Seznamu a upravují výsledky. Proč se chcete hádat o něčem, o čem nemáte páru?

    To je pravda jen částečně, cílem obou toolbarů je sběr dat odevšad (tj. pokud jsem právě na Bingu s Google Toolbarem, pak Google toolbar také posílá data, teď jsem si to zkoušel) a co AdSence aj metody Googlu?

    Já vážně nemám chuť se zabývat takto triviálními fakty. Nechápete rozdíl mezi sběrem uživatelských dat (jak by asi mohl vyhledávač jinak dávat relevantní výsledky uživatelům?) a dat z konkurenčního vyhledávače.

  • Oldřich Klimánek napsal:

    Nevím kde jste četl, že seznam řadí výsledky ručně (autorem této myšlenky bude opravdu asi blbec), ale je to nesmysl.

    Ještě jedna věc. Nevím, který „blbec“ to vymyslel, jak říkáte, ale tady máte zprávu přímo ze Seznamu, kdybyste mně nevěřil.

    > ———— Původní zpráva ————
    > Od: Dušan Janovský
    > Předmět: Re: http://kalibrace.seznam.cz/?
    > Datum: 23.2.2010 21:13:43
    > —————————————-
    > Dobrý večer,
    >
    > na doméně http://kalibrace.seznam.cz nám (tedy Seznamu) běží tak zvané
    > kalibrační rozhraní. Do něj mají přístup někteří zaměstnanci a hlavně
    > brigádníci, kteří nám hodnotí výsledky. Kalibrování vypadá tak, že
    > brigádník dostane dotaz a potom nějakou stránku, která se na daný
    > dotaz našla, načež svým lidským mozkem oboduje, nakolik je k danému
    > dotazu stránka relevantní. Nasbíraná data používáme k měření kvality
    > našeho vyhledávače, jeho vývojových verzí a k optimalizaci vah. Jak
    > tam už máme tisíce dotazů, je to strašně užitečná věc, protože to
    > umožňuje objektivní porovnávání verzí algoritmů.


VLOŽIT KOMENTÁŘ