Nová verze javascriptového kódu Google analytics špatně zobrazovala české a další UTF8 znaky v seznamu klíčových slov zdrojů návštěvnosti. Problém se zdá být již zažehnán a od 15. ledna se znaky zobrazují, jak mají.
Update kódu
V prosinci 2007 Google ohlásil možnost využití nové verze měřícího kódu pro Google Analytics, přinášejícího určité kvantum nových funkcí a dalších výhod za cenu změny vloženého javascriptového útržku. Pro stránky, které analytiku používají sporadicky, není nutno upgradovat, neboť nejedná se o revoluční změnu a množství přidělané práce kvůli výměně kódu by mohlo převyšovat benefity získané. Ovšem i pokročilí uživatelé by si měli dáti pozor a nehrnout se do výměny ihned (Google pro uklidnění uvádí, že měření pomocí urchin.js bude k disposici minimálně rok po uvedení této nové verze). Změn není málo, prakticky každé sledování má teď drobné odlišnosti, a proto je třeba postupovat raději pomalu a s rozmyslem – opravdu není od věci udělat si (načrtnout, napsat, nakreslit, v hlavě pořádně vymyslet) postupový plán – tedy seznam stránek, které se mají měřit, akcí na stránkách, které se musí také započítat, komerčních transakcí a detailů nastavení reklamních kampaní.
Chybné zobrazování klíčových slov
Jedním z problémů nového měřícího kódu se zdálo být chybné zobrazování velké šíře znaků. Ačkoli (a to doufám, že se nepletu) Google pracuje s UTF8, které by v sobě mělo obsahovat celou škálu znaků přímo, ve statistikách Analytics se zobrazovaly trochu jiným zápisem, konkrétně např. místo znaku „ř“ ukazoval „%C3%B8“ apod. Problém se projevil na jednom z nejdůležitějších reportů, a to výpisu klíčových slov z vyhledávačů (Traffic Sources → Keywords; seznam frází, pomocí kterých příchozí návštěvníci web našli ve vyhledávačích). Zobrazovalo se tak např. „dlouh%c3%bd+chvost“ místo „dlouhý chvost“.
Chyba opravena
Problém byl zmíněn na diskusním fóru přímo pro Google Analytics a v českých podmínkách na fóru Webtrh. Zdá se však, že připomínky odeslané do společnosti zafungovaly a oprava se provedla, neboť všechna klíčová slova, která ještě do 14. ledna byla špatně napsána, je od 15. ledna 2008 psána již v pořádku.

Graf ukazuje porovnání výstupu pro dvě konkrétní klíčová slova, jedno zobrazeno enkódovaným zápisem (modré v pozadí) a druhé, vystihující přesně to samé, ovšem již v korektním záznamu (fialovou barvou). Měření bohužel proběhlo na mladém webu, takže data nejsou ještě příliš representativní, avšak lze spatřit, že zatímco utichla jedna fráze, ten samý den se začala objevovat druhá, které jsou však stejné až na druh UTF8 zápisu. Grafy pocházejí z Google Analytics, následné zpracování a barevný efekt je již vlastní úpravou.
Nejnovější verze nemusí být nejlepší
Pokud tedy nejsou sledované změny pouze krátkodobé, není třeba hledat alternativní cesty ke správnému zobrazení klíčových frází (např. postupem exportu výpisu a zpětným dekódovaním do již správného tvaru) a dá se soustředit na podstatné záležitosti zavádění nového měřícího kódu. Zároveň tento problém upozornil na to, že nemá cenu se střemhlavě vrhat do těch nejčerstvějších verzí měněných programů, neboť ještě nemusí být správně odladěné od chyb. Jistý konzervatismus ve webové analytice určitě musí být, neboť neustálé změny působící na měření návštěvnosti mohou vést k velmi značnému porušení konzistence nasbíraných dat.
Užitečné odkazy:
- Tracking code migration guide. Switching from urchin.js to ga.js. Příručka přímo od Google sloužící jako návod pro nasazení nového kódu. Jsou v ní popsány změny a výhodvy nového měření
- URL Encode tabulka. Jednoduchá tabulka UTF8 znaků a jejich transkripce do zápisu, který byl v Google Analytics použit.
- Google Analytics Custom Tracking. Velmi podrobně rozepsané detaily nového měřícího kódu
- Google Analytics v češtině. Oznámení české pobočky Google o prosincovém vypuštění změn. Bohužel se limitovali pouze na pěvení slávy české jazykové mutaci.
- Announcing new graphing tools, ga.js tracking, and six new languages. Zpráva na oficiálním blogu Google Analytics o změnách, funkcích a výhodách nového kódu.