HTTPS na Google působí potíže webové analytice

V nedávné době Google začal zkoušet provozovat vyhledávání přes zabezpečené spojení HTTPS (zdroj: blog Google, PC World, CNN). Ať již jsou důvody jakékoliv (mluví se o přirozeném kroku k větší ochraně přenášených dat, ale také o rozumné cestě, jak ubezpečit čínské občany, že mohou vyhledávat i bez strachu z vládní perzekuce), určitě se s podobnými zabezpečeními budeme čím dál více setkávat.

Důvod, proč o tom čtete zrovna na Dlouhém chvostu je jednoduchý – HTTPS působí potíže webové analytice.

Komunikace přes HTTPS totiž blokuje údaje o Refererovi, tedy o údaji o zdroji požadavku. Vychází to ze specifikace RFC 2616, kde se píše:

„Clients SHOULD NOT include a Referer header field in a (non-secure) HTTP request if the referring page was transferred with a secure protocol.“

Praktické dopady

Na hlavičce Referer silně závisí analytické nástroje. Když si teď vyhledáváte na Seznamu frázi domácí pekárny, po prokliku na nějaký z výsledků vyhledávání váš požadavek na web bude vypadat jako na obrázku níže a bude obsahovat hlavičku:

Referer: http://search.seznam.cz/searchScreen?…

Google by to vypadalo takto:

Referer: http://www.google.cz/search?…

HTTP Referer

Bezpečené vyhledávání

Když však použijeme bezpečné vyhledávání u Google , tak se najednou hlavička Referer ztrácí:

1005-https-referer

Problém je, že z Refererů si analytické nástroje jako Google Analytics, Omniture či Yahoo! Web Analytics dokáží rozklíčovat zdroj návštěvníka. Tedy, že přišel z přirozeného vyhledávání na Google a použil frázi „domácí pekárny“. Bez refereru máte neidentifikovanou návštěvu – nejste schopni přesně říci, zda se vaše investice do PPC reklamy či SEO vrací.

Google Analytics např. umožňuje použít UTM parametry a označkovat si zdroj návštěvnosti vlastním stylem, ovšem tyto parametry nedokážete dostat do přirozeného vyhledávání.

Kdy může marketing ztížit bezpečnost?

Předpokládám, že Google přijde na způsob, jak alespoň některé údaje přenášet, protože kdyby se zabezpečený přenos rozšířil pro velké masy, najednou by Google Analytics utlumily svou schopnost poskytovat marketérům užitečná data o vyhledávání na Google a placených produktech Google AdWords. Marketingová nevole by pak mohla způsobit problémy akceptaci tohoto typu zabezpečení, Čína Nečína.

Budu rád, pokud mne opravíte, pokud jsem něco nenapsal dostatečně přesně (děkuji Petru Krčmářovi za nasměrování na informace o blokování referera, Přemku Žákovi za drobnou korekturu).

Zdá se mi to být velmi zajímavé téma, které se jeví dost technické, ale má zásadní dopady do obchodních otázek a internetového marketingu. Ještě raději a vděčný budu za jiné přínosné komentáře k tématu.

Aktualizace 25. května:

  • Phil Mui, Senior Product Manager služby Google Analytics, odkazoval na článek v The Register, kde se samozřejmě popisuje, že zabezpečení přes SSL ovlivňuje Google Analytics podobně jako jiné analytické systémy.
  • Avinash Kaushik, Analytics Evangelist v Google, na Twitteru potvrzuje, že PPC a SEO návštěvnost přes HTTPS bude v Google Analytics započtena jako přímé přístupy (direct).

9 komentářů u “HTTPS na Google působí potíže webové analytice

  1. No, jestli to potom nedopadne takhle:

    • Google řekne, že přirozené výsledky jsou jeho věc a stejně je nemáme co sledovat. Důležité je přece dělat kvalitní web :-)
    • Autotagging v adwords udělá z Google Analytics jediný web-analytický nástroj pro vyhodnocování PPC.

    Ale možná se pletu – ono https je taky o dost náročnější na výkon a objem dat, tak třeba to pro masové nasazení bude moc drahé.

  2. Pingback: 1. zprávy » Dlouhý chvost // HTTPS na Google působí potíže webové analytice

  3. …nebo začne Google podle nastavení ve webmaster central u prokliků z přirozených výsledků zapínat autotagging jako je tomu u placených reklam.

    Kdyby Google chtěl dostát svému heslu „don’t be evil“, udělá to tak, aby tagy mohly rozklíčovat i konkurenční analytické nástroje.

  4. Martinové, díky za komentáře. Zatím to vidím tak, že v Google jedni neví, co dělají druzí. Tedy, že to zatím asi nemají vyřešeno.

    Přidal jsem do článku dva tweety od vysokých papalášů služby Google Analytics.

  5. Případně je tu ještě radikálnější možnost:
    Po kliku na výsledek v SERPu si může ověřit, jestli web používá Analytics a „připíše čárku“ do správné kategorie sám (a direktu, který by se zapsal na webu přes JS, jednu ubere).
    Tím by vyřadil konkurenční analytické nástroje ze hry nadobro…
    Předpokládám ale, že na to snad Google nebude mít koule, mohlo by se to lehce otočit proti němu.

  6. Google si nemůže dovolit jít proti svým největším inzerentům v Google AdWords. A když se podíváte na The Forrester Wave™: Web Analytics, Q3 2009, zjistíte, že i Y!WA má dnes tržní podíl jako GA. Na stejné úrovni je pak Coremetrics, Omniture je větší. Unica a Webtrends naopak menší.

    GA má dnes – měřeno podle metodologie Forresteru – podíl na trhu cca 17 %.

  7. Pingback: Google oznámil lepší hodnocení https/SSL webů

  8. Vřele doporučuji přečíst článek Geek guide to Direct Traffic Analysis, kde se rozebírají různé situace, kdy se referer nepřenáší.

    Základní scénáře jsou:
    - Přenos probíhá při variantách HTTP->HTTP, HTTPS->HTTPS, HTTP->HTTPS.
    - Přenos neprobíhá při variantě HTTPS->HTTP.

    K tomu je samozřejmě několi výjimek. Michal Špaček mne na Twitteru upozornil, že web na HTTPS může přes meta tag <meta name="referrer" content="origin">, více viz Referrer Policy od W3C.

    Michal také upozornil na informaci z roku 2012, která přímo navazuje na původní téma článku: Google používá tento meta referrer. Jak víte, to neznamená, že nemění předávaný vyhledávací výraz z přirozeného vyhledávání na (not provided).

    Konkrétní příklad: tento meta referrer nemá implementován WordPress na svých hostovaných blozích. Takže když třeba sledujete návštěvnost z blogu na WordPress.com na parfums.cz, tak se vám návštěva bude tvářit jako zdroj (direct) (resp. bude tak atribuována, což znamená, že může získat přednost předchozí nepřímý zdroj návštěvníka).

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *