Vysoká škola ekonomická v Praze

Fakulta informatiky a statistiky

Katedra informačních technologií

Studijní program: Aplikovaná informatika

Obor: Informační systémy a technologie

Customer Intelligence v prostředí elektronického obchodu

DIPLOMOVÁ PRÁCE

       Student     :      Jan Pavel

       Vedoucí     :      doc. Ing. Ota Novotný, Ph.D.

                                            Oponent   :       Ing. Miloš Maryška, Ph.D.

2012

Prohlášení

Prohlašuji, že jsem diplomovou práci zpracoval samostatně a že jsem uvedl všechny použité prameny a literaturu, ze které jsem čerpal.

V Praze dne 2. května 2012                                                                        ..................................

                                                                                                                              Jméno a příjmení studenta   

Poděkování

Chtěl bych zde poděkovat panu doc. Ing. Otovi Novotnému, Ph.D. za to, že mi umožnil zpracovat diplomovou práci na vlastní téma, za jeho investovaný čas do vedení této práce a za množství podnětných připomínek během jejího zpracování.

 

Abstrakt

Práce se zabývá metodami pro lepší poznání zákazníků internetového obchodu. Souhrnně se tato problematika označuje Customer Intelligence. Jedná se o prostředky, které mají za úkol zvýšení hodnoty jednotlivých zákazníků pro společnost. Základem je využití časem nahromaděných dat o klientech k získání potřebných informací.

Práce si klade za cíl vytvořit systém Customer Intelligence uzpůsobený potřebám společnosti. Pro internetového prodejce je nutné do systému zapojit také webovou analytiku.

V teoretické části je objasněno postavení a význam Customer Intelligence v rámci informačního systému podniku. Dále je zde probrána hodnota zákazníka. Je postupováno od základních způsobů stanovení hodnoty zákazníka, před jeho celoživotní hodnotu pro společnost až po možnosti skórování zákazníků.

Praktická část práce pojednává o prováděných analýzách zákaznických dat, jež jsou hlavními podklady pro realizaci Customer Intelligence řešení. Je vysvětleno, jak bude s těmito získanými informacemi nakládáno. V závěru je popsána technická realizace a problémy, které bylo nutné během implementace vyřešit.

Klíčová slova

Customer Intelligence, elektronické obchodování, hodnota zákazníka, skórování, webová analytika, Google Analytics

 

Abstract

Studies are focused on methods for better recognition of internet shop customers. General this method  is called Customer Intelligence. It contains means of increase of customers valuation for a society.  It is based on exploitation of accumulated data about customer which helps to get necessary information.

A main target of Studies is to create system of Customer Intelligence addapted to society needs. For internet seller it is necessary to include a web analytics into the system too.

In a theoretical part there is an explanation of attitude and significance of  Customer Intelligence in terms of informational company system. Furthermore there is taken a customer value. It is proceeded from basic means of customer valuation assesment via customers lifelong value for society to means of customer scoring 

A practical part of Studies  is devoted to performed analyses of customer data which are the main details for execution of Customer Intelligence. There is explained how this obtained information will be used.  In a conclusion there is descirbed  a technical realization and problems which had to be necessarily solved during the implementation.

Keywords

Customer Intelligence, e-commerce, customer value, scoring, web analytics, Google Analytics

Obsah

1        Úvod . 9

1.1          Téma práce . 9

1.2          Současný stav . 9

1.2.1           Rozšířenost CRM v podnicích . 9

1.3          Cíle práce . 11

1.4          Očekávané přínosy práce . 11

1.5          Omezení práce . 12

1.6          Určení práce . 12

1.7          Struktura práce . 12

2        Rešerše publikovaných prací 14

3        Postavení Customer Intelligence v informačním systému podniku . 16

3.1          Architektura podnikového informačního systému . 16

3.1.1           CRM ... 17

3.1.2           Webová analytika . 17

3.1.3           Customer Intelligence . 18

3.1.4           Zákaznická analytika . 20

3.2          Důležitost CI v organizaci 20

3.3          Prostředky k udržení zákazníka . 21

4        Hodnota zákazníka . 23

4.1          Vývoj činností provozovatele webových stránek . 23

4.2          Stanovení hodnoty zákazníka . 24

4.2.1           Hodnotová segmentace . 25

4.2.2           Rizikovost zákazníka . 26

4.3          Customer Lifetime Value . 26

4.3.1           Složení Customer Lifetime Value . 26

4.4          Skórování zákazníků . 28

4.4.1           Skóringový model 29

4.4.2           RFM skórování 30

4.4.3           Skórování zákazníků elektronického obchodu . 31

4.4.4           Využití zákaznického skóre . 33

4.5          Další metriky k lepšímu poznání zákazníka . 33

4.5.1           Průměrná hodnota objednávky . 33

4.5.2           Hodnota na návštěvu . 34

4.5.3           Jaké produkty si zákazník koupil 34

4.5.4           Jaké si zákazník prohlíží produkty . 34

4.5.5           Co zákazník vyhledává . 35

4.5.6           Tok návštěvníků . 35

4.5.7           Atribuční analýza . 36

5        Prováděné analýzy . 37

5.1          Seznámení se společností 37

5.2          RFM analýza . 37

5.2.1           Recency . 38

5.2.2           Frequency . 39

5.2.3           Monetary . 40

5.3          Určení Key Influencers . 44

5.3.1           Závisle proměnná . 44

5.3.2           Nezávisle proměnné . 45

5.3.3           Výsledky analýzy . 45

5.3.4           Závěr analýzy . 48

6        Uplatnění nových znalostí v e-shopu . 49

6.1          Potřeby internetového obchodu . 49

6.2          Cíle společnosti 49

6.3          Stanovení KPI 50

6.4          Prováděné změny v internetovém obchodě . 51

7        Realizace řešení 53

7.1          Problém unikátního návštěvníka . 53

7.2          Přiřazení návštěvníka webových stránek k CRM záznamu . 53

7.3          Google Analytics . 54

7.3.1           Základní informace o Google Analytics . 54

7.3.2           Technické řešení Google Analytics . 55

7.3.3           Vlastní proměnné v Google Analytics . 58

7.3.4           Problémy spojené s řešením s využitím Google Analytics . 59

7.3.5           Google Analytics API 60

7.4          Tvorba zákaznického skóre . 61

7.4.1           Skórovací funkce . 62

7.4.2           Skórovací modely . 62

7.5          Popis praktického řešení skórování 64

7.6          Význam zákaznického skóre . 65

7.7          Uživatelský report . 65

7.7.1           Google Chart Tools . 66

7.7.2           Ukázka uživatelského reportu . 66

8        Závěr . 68

8.1          Vyhodnocení cílů práce . 68

8.2          Identifikace dalších možností rozvoje . 69

Terminologický slovník . 70

Přehled bibliografických zdrojů . 72

Seznam obrázků . 77

Seznam tabulek . 77

Přílohy . 78

Příloha A: SQL dotazy pro tvorbu RFM analýzy . 78

Příloha B: SQL dotazy za účelem získání Key Influencers . 79

Příloha C: SQL dotazy pro RFM skóring . 81

Příloha D: SQL dotazy pro E-loyalty skóring . 83

 

1          Úvod

1.1        Téma práce

Soustředění se na zákazníka a jeho potřeby je jedním z hlavních směrů, kterým se ubírají moderní společnosti. Pro důkladné pochopení zákazníků je třeba nasazení systému, kterému se souhrnně říká Customer Intelligence (CI). Ten nám poskytne prostředky k poznávání chování spotřebitelů. Potřeba takovéhoto systému je zapříčiněna současným rozmanitým prodejním prostředím. Produkty či služby jsou prodávány prostřednictvím klasických kamenných poboček, Internetu, telefonních nabídek či dalšími méně rozšířenými prodejními kanály.

V důsledku tohoto multikanálového prostředí jsou roztříštěny i veškeré marketingové aktivity. V takových případech musí podnik alespoň na základní úrovni využívat CRM [1] systém. Nástroje pro řízení vztahů se zákazníky slouží hlavně pro uchovávání dat o zákaznících. Mají za úkol shromažďovat informace napříč prodejními kanály. Tato práce jde ale dále. Je třeba analyzovat nakumulovaná data v CRM a snažit se je zhodnotit na znalosti, na základě kterých je možné provést konkrétní akce pro zvýšení hodnoty jednotlivých zákazníků potažmo celého podniku.

Důvod výběru tohoto tématu je patrný z předchozích odstavců. V CI spatřuji budoucnost obchodování. Nyní implementace takového řešení může znamenat jistou konkurenční výhodu, ale zanedlouho se bude pravděpodobně jednat o nezbytnou součást podnikových informačních systémů.

1.2        Současný stav

Na trhu je dostupné nepřeberné množství CRM systémů. V lepším případě v nich mají podniky úplná homogenní data o zákaznících. Neuvědomují si, jakou sílu tato data mají, pokud se s nimi dále pracuje. Co je ale horší, že ve většině případů nejsou ani zdaleka úplná. Jako největší nedostatek spatřuji nepřítomnost komponent webové analytiky nebo možnost napojení na dostupné nástroje webové analytiky například prostřednictvím API [2] , které většina z nich nabízí.

Webová analytika je nedílnou součástí CI. Ve většině případů je ale realizována separátně a zabývá se hlavně agregovanými daty, kde nejsou rozlišováni jednotliví zákazníci. Důležité je integrovat data ze CRM s daty z webové analytiky a teprve jejich analýza dává hlubší smysl.

1.2.1         Rozšířenost CRM v podnicích

Podle průzkumů provozuje CRM systém značné procento komerčních organizací. Troufám si tvrdit, že část z těchto společností, provozuje CRM pouze jako určité skladiště kontaktních informací o zákaznících. Nevyužívá zdaleka jeho obrovského potenciálu. Největší síla CRM spočívá právě v informacích o zákaznících vydolovaných z CRM databáze.

Moje tvrzení dokládají i čísla zveřejněná Českým statistickým úřadem v rámci průzkumu Informační a komunikační technologie v podnikatelském sektoru zveřejňované každý rok. Graf na předchozím obrázku vyjadřuje procento podniků, které používaly softwarovou aplikaci (CRM) pro získávání, skladování a zpřístupňování informací o zákaznících pro potřeby firmy v letech 2009, 2010 a 2011. Jak se dalo předpokládat, je tato hodnota úměrná velikosti podniku. Trend v nasazování CRM do podniků je rostoucí, ale stoupá velmi pozvolna. To je v grafu dobře viditelné z křivky s názvem Celkem. Ta znázorňující procentuální zastoupení CRM systému ve všech společnostech bez ohledu na velikost organizace.

Obrázek 1: Procenta podniků používající CRM (Zdroj: [1], [2], [3])

Na grafu je patrná i další skutečnost a to: Podniky, které analyzovaly pomocí CRM softwarové aplikace data o zákaznících pro další využití. Ty jsou znázorněny světlejšími sloupci grafu. Tato informace je bohužel dostupná pouze pro rok 2009. Poté byl průzkum částečně zjednodušen. V tomto roce analyzovalo zákaznická data 10,3% malých, 25,4% středních a 36,9% velkých podniků. V celkovém součtu je to tedy 13,9% podniků. Podniků, které mají implementováno CRM je téměř 17,5%. Součástí průzkumu nebylo zjišťováno, do jaké míry jsou zákaznická data analyzována. Byl bych v tomto ohledu velmi opatrný. Nepochybně mají podniky v tomto směru ještě značné rezervy.

1.3        Cíle práce

Hlavním cílem práce je z dostupných systémů vytvořit CI řešení. Půjde o řešení pro internetový obchod. Bude zapojena webová analytika, pro doplnění dalších zajímavých dat o zákaznících. Kompletní systém by měl jeho uživateli nabídnout rychlé přehledy o konkrétních návštěvnících. Uvidí agregované údaje. Jejich hlavním představitelem je hodnota zákazníka. Bude zde ale i možnost zjištění ostatních důležitých informací. Například jaké si kupuje produkty, kolik času na webu tráví. V neposlední řadě nalezne, z kterých zdrojů návštěvnosti přichází, jak často a zda vůbec se konkrétní zákazník vrací atd. Z těchto informací si už bude moci udělat ucelený obraz o zákazníkově chování na e-shopu a podle toho k němu přistupovat.

Práce bude obsahovat část věnovanou analýzám pro zjištění informací, které bude možné využít pro marketingové kampaně. Půjde o segmentaci zákazníků pro jednoduché cílení marketingových akcí. Jmenovitě o behaviorální segmentaci, která rozděluje zákazníky do skupin na základě jejich chování. Díky tomu bude možné lépe cílit marketingové kampaně. V případě elektronického obchodu zejména e-mailing nebo telefonické oslovení.

Kompletní řešení bude poskytovat základ pro zákaznickou analytiku. Dávat volnost jeho uživateli k nalezení potřebných informací. Účelem zákaznické analytiky je především zvyšování hodnoty zákazníků.

Pro splnění těchto hlavních cílů je potřeba splnit také několik cílů dílčích:

·          Zhodnotit, co je třeba k vytvoření vlastního CI řešení.

·          Provést analýzy, které budou základem pro implementaci CI systému.

·          Zjistit technické možnosti dílčích systémů, ze kterých se bude skládat komplexní řešení.

·          Navrhnout a realizovat požadovaný systém na míru konkrétnímu internetovému obchodu.

·          Nasadit systém do reálného provozu.

1.4        Očekávané přínosy práce

Na tomto příkladu chci ukázat, že CI může být prospěšné i pro menší internetové společnosti a dopomoci jim k jejich růstu. Dokázat, že se nejedná pouze o výsadu těch největších e-shopů. Řešení, které bude realizováno, by mělo být pro podnik co nejdostupnější. Ať už se jedná o náklady na zavedení, tak jednoduchost jeho používání. Aby se k informacím dostali právě osoby, které je potřebují ke svému rozhodování, a nebylo pouze výsadou programátorů.

Dále spatřuji přínos hlavně pro konkrétní internetový obchod, na kterém bude realizována implementace. Může si vybudovat náskok před konkurencí. Doufám, že již poté nebude zbytečně vynakládat finanční prostředky na neefektivní reklamní kampaně a bude své marketingové aktivity směřovat efektivněji.

1.5        Omezení práce

Hlavní omezení práce spatřuji ve finanční nedostupnosti kompletních CI řešení. Bezesporu nějaká řešení existují, ale z dosavadní zkušenosti si dovolím tvrdit, že jejich pořizovací hodnota bude celkem vysoká a v některých případech zřejmě pro společnosti nerentabilní. S tímto problémem se budu muset popasovat nejvíce v části věnované analýze současných řešení CI. Není v mých možnostech se k těmto systémům fyzicky dostat, proto bude nutné se z velké části spoléhat na informace dostupné z Internetu nebo na zkušenosti uživatelů.

Naštěstí existují alespoň nástroje webové analytiky, které jsou poskytovány zcela zdarma, ať již formou open-source softwaru umístitelného na náš server nebo řešení provozované jako služba. Právě tyto nástroje budou v práci využívány.

1.6        Určení práce

Práce je určena především provozovatelům menších a středním internetovým obchodů, kteří se nebojí experimentovat. Obzvláště v případě, že nemají velké finanční prostředky, ale přesto chtějí poznat chování svých zákazníků. Je vhodná i pro vývojáře internetových obchodů. Rozhodně bych ji doporučil taktéž lidem, pracujícím v marketingu společností, jejichž hlavní pole působnosti je právě na Internetu.

Od čtenářů nejsou vyžadovány pokročilejší znalosti problematiky. Je ale dobré se alespoň trochu orientovat v oblasti elektronického obchodování a mít přinejmenším tušení, co znamenají zkratky jako CRM či BI.

1.7        Struktura práce

Práce bude strukturována do následujících stěžejních částí:

·      V první části, která bude čistě teoretická, se zaměřím na základní seznámení s problematiou. Zde bude podrobněji vymezena disciplína Customer Intelligence pro účely této práce. Budou vysvětleny také další důležité pojmy související s tématem. Probereme významnost CI v moderní společnosti.

·    Následující část bude věnována teoriie o hodnotě zákazníka. Vysvětlím několik přístupů ke stanovení hodnoty zákazníka. Následně se zaměřím na skórování zákazníků. Bude vybrán nejlepší možný skóring pro vyjádření hodnoty zákazníka pro e-shop.

·      Stanovení konkrétních potřeb pro tento e-shop. Tento oddíl bude věnován analýze požadavků e-shopu. Výsledkem této analýzy bude výběr řešení nejvíce vyhovujících této společnosti, popřípadě stanovení důležitých funkcionalit, jako podklad pro vytvoření řešení na míru.

·    V poslední praktické části bude vytvořeno skutečné řešení podle poznatků z předchozích kapitol. Bude implementováno skórování zákazníků a vytvořeny reporty ukazující chování zákazníků. Bude nezbytné stanovit metriky, podle kterých určíme důležitost zákazníka pro e-shop.

2          Rešerše publikovaných prací

V kapitole bude zhodnoceno několik převážně závěrečných prací na příbuzné téma. Velice stručně budou nastíněny obsahy těchto prací. Bude objasněn jejich přínos při tvorbě diplomové práce. Popřípadě vymezeno prolínání tématu s tématem této práce.

Při prvotním seznamování s tématem jsem nalezl jednu práci s téměř totožným názvem. Jde o práci Teppera z roku 2004 [4]. V úvodu práce jsou celkem srozumitelně vysvětleny některé základní termíny související s Customer Intelligece. Práce však není, v takto rychle se rozvíjejícím odvětví, úplně aktuální. V době ve které vznikala, byla velice špatná dostupnost nástrojů webové analytiky. Proto je značná část praktické částí pouze popisem vytěžování logů serveru k získání potřebných informací. Takový postup je v současnosti zbytečný. V mé práci se budu snažit navázat na teoretický základ. Praktickou část bude možné díky dostupným nástrojům posunout dále.

Mnoho prací na totožné téma jsem nenalezl. Není ani moc takových, které se zabývají Customer Intelligence potažmo analytickým CRM. Tento fakt mě poměrně překvapil. Když už se nějaká taková práce objeví, jedná se většinou o využití těchto technik v oboru velkých společnost. Typickým zástupcem je práce Nebřenského [5]. Tato práce se soustředí na obor bankovnictví. U takových společností je předpokládána implementace BI řešení a rozsáhlého CRM systému. Dopodrobna vysvětluje význam CRM v takových podnicích. Poznatky z práce Nebřenského nebylo možné využít při realizaci této práce.

S ohledem na obor internetového prodeje, na který se tato práce soustředí, bylo nezbytné se důkladně seznámit s odvětvím webové analytiky. Velice přínosná v tomto byla práce Jaška [6]. Práce je také zaměřená na elektronické obchodování. Teoretická část práce mi dopomohla k lepšímu utříbení dosavadních znalostí. V úvodu je popsána pozice webové analytiky v prostředí malých a středních společností. Při realizaci této práce budou využity také poznatky o dostupných nástrojích webové analytiky.

Hradcová se ve své práci soustředí hlavně na marketingový pohled při použití webové analytiky [7]. Vůbec neřeší technickou realizaci. Snaží se stanovit, co je dobré sledovat pro ohodnocení úspěšnosti webu. Mimo to bych vyzdvihl kapitolu o komunikaci internetového obchodu. Jsou zmíněny různé formy marketingové komunikace s názornými příklady.

Poněkud jiným způsobem se zaměřil na toto téma Hnízdil [8]. V úvodu se autor zabývá webovou analytikou. V práci je zajímavá část, kde se zaměřuje na propojení webové analytiky a Business Intelligence za účelem nějaké akce vyvolané zákazníkovým chováním. V práci je tato integrace označována jako Web Intelligence. Bohužel praktická část spočívá pouze v uvedení několik příkladů možného využití v bankovní praxi. Příklady jsou dozajista zajímavé, ale nejsou použitelné pro účely této práce.

Při samotné realizaci bude nutné poznat funkcionalitu nástrojů webové analytiky trochu podrobněji. Základní funkce jsou shodné pro většinu dnešních nástrojů. Proto bych zde zmínil práci Čecha, který se zabývá nástrojem Google Analytics [9]. Práce obsahuje základní možnosti nastavení tohoto analytického nástroje. Popisuje i jeho další rozšířené možnosti. Navíc dost podrobně ukazuje práci s nástrojem. Praktická část toto všechno prezentuje na konkrétním příkladu.

Značná část mé diplomové práce se bude zabývat hodnotou zákazníka a skórováním. Většina nalezených prací jde velice dopodrobna. To je pro mé účely zbytečné. Při pronikání do tématu mi velice pomohla práce Machalové [10]. Práce se zabývá hodnotou zákazníka a různými možnostmi využití této znalosti k vyšší profitabilitě společnosti.

V oblasti skórování nemám téměř žádné znalosti. Bylo nutné přečíst více materiálů, abych se v tomto odvětví zorientoval. Z každého zdroje jsem si vzal pouze malou část, takže nemá cenu je zde jmenovat. Se skórováním zákazníků elektronického obchodu jsem se setkal v odborném článku z periodika International Journal of Electronic Business Management [11]. Nejedná se o nijak rozsáhlý článek, avšak zmíněné myšlenky v něm jsou celkem zajímavé. Budou jistě velkou inspirací při vytváření konkrétních skóringových modelů.  

3          Postavení Customer Intelligence v informačním systému podniku

V úvodní kapitole bude objasněno, kam spadají disciplíny CI a webové analytiky v rámci IS podniku. Současně budou vysvětleny některé důležité pojmy související s tématem práce. Disciplíny budou vymezeny pro účely této práce. Má to prostý důvod. Některé z těchto disciplín mají řadu definic, navíc i výrobci softwaru si některé pojmy definují odlišně. Na závěr kapitoly se zaměřím na důležitost CI řešení v organizaci.

3.1        Architektura podnikového informačního systému

Vynořilo se nemálo nových populárních slovních spojení souvisejících s tématem této práce. Jejich významy se v mnohém překrývají. Pro jednodušší pochopení důležitých pojmů jsem hned z počátku zařadil globální model IS podniku. Tento model vychází z publikace Business inteligence: jak využít bohatství ve vašich datech [12]. Upravil jsem ho pro potřeby této práce. Doplnil jsem součásti IS, které bezprostředně souvisí s tématem. Na první pohled je jasné, že na něm chci prezentovat zvláště pojmy webová analytika a Customer Intelligence. Dále je v modelu řada dalších zkratek a slovních spojení. Nemá cenu je zde probírat všechny. Některé jsou notoricky známé. Jiné se tématu dotýkají pouze velice okrajově.

Obrázek 2: Postavení webové analytiky a CI v rámci IS organizace (Zdroj: [12])

3.1.1         CRM

Jedná se o Customer Relationship Management. Do češtiny je toto slovní spojení nejčastěji překládáno jako řízení vztahů se zákazníky. Jeho úkolem je shromažďování, zpracování a využití informací o zákaznících společnosti. Firma tak může lépe poznat své zákazníky, porozumět jejich potřebám. Poskytuje základ pro komunikaci mezi firmou a jejími zákazníky. Podstatou CRM je poskytnout na základě nahromaděných dat zákazníkům lepší služby.

Z modelu je patrné, že existence CRM je pro společnost klíčová. Data obsažená v tomto systému jsou využívána napříč téměř celou organizací. Je podstatné si uvědomit, že v případě CRM systémů jsou daleko důležitější data než samotný software.

3.1.2         Webová analytika

Anglický originál web analytics se překládá jako analýza provozu webu, analýza webu, analýza webu ze statistik návštěvnosti nebo analýza návštěvnosti. Ve skutečnosti se jedná o měření, sběr, sledování a vyhodnocování internetových dat za účelem porozumění a optimalizace webu [13].

Webová analytika poskytuje dva důležité typy informací:

·         zjišťuje, co se na webových stránkách děje,

·   snaží se rozpoznat, jaké úpravy stránek pomohou k tomu, aby byla webová stránka efektivnější.

Webová analytika slouží k pochopení chování návštěvníků na webu. Je základem strategie pro internetový marketing [14]. Z analýzy návštěvnosti webových stránek mají společnosti možnost se dovědět, co zákazníka zajímá, aniž by si cokoli objednal [15].

Začlenění webové analytiky v rámci IS organizace je trochu složitější. Z modelu na obrázku 1 můžeme vyčíst, že data z webové analytiky jsou zdrojovými daty pro Business Intelligence i CRM systémy. Ve skutečnosti je tato situace ještě trochu složitější. Data z webové analytiky zpracovaná těmito systémy využívá například marketingové oddělení i některá další oddělení.

Obor webové analytiky je na vzestupu. Podniky si uvědomují neustále rostoucí moc Internetu. Webové stránky společností jsou nezbytností. Důležitá je také jejich kvalita. Webová analytika může dopomoci ke zvyšování kvality webových stránek a celkovému komfortu jejich návštěvníka. Tato práce se ale zabývá spíš druhou výše jmenovanou úlohou webové analytiky - co se na webových stránkách děje. Přesněji řečeno, co na stránkách dělají návštěvníci a potažmo zákazníci.

3.1.3         Customer Intelligence

Toto slovní spojení bych si troufl označit za buzzword [3] . Podle mého názoru tak trochu využívá popularity pojmu Business Intelligence. Ve skutečnosti jde o něco, co zde již dříve bylo, jen pod jiným názvem: analytické CRM [17]. CI zahrnuje již agregovaná data o zákaznících a následnou aplikaci znalostí o zákazníkovi. CI tedy využívá zákaznická data ze CRM a jiných systémů, například ERP nebo elektronického obchodování a následně uplatňuje principy a technologie Business Intelligence.

Z Business Intellignece vyplývají i další pojmy a zkratky používané v CI jako jsou například CDW (Customer Data Warehouse), Staging Area, Customer ODS atd. Pro toho, komu není jejich význam ihned patrný, doporučuji podívat se na pojmy používané v Business Intelligence, ty se částečně překrývají. Někdy je CI chápáno jako určitá podmnožina Business Intelligence.

V této práci, jak již z  obrázku 1 vyplývá, je CI chápáno jako část CRM. Jsou využívána data z CRM a ta jsou dále zpracovávána. Je důležité, aby v CRM bylo co největší množství nahromaděných informací o zákaznících. Měl by být kladen důraz na to, aby celá společnost měla stejná zákaznická data.

Zde se dostáváme k tomu, proč na tomto modelu zasahuje webová analytika do Business Intelligence i CRM. Webová analytika je významným zdrojem dat o zákaznících. Pokud budeme chtít integrovat webovou analytiku do CRM, bude zajisté dobré, ukládat data do Customer Data Warehouse, abychom měli co nejvíce podkladů pro výše zmíněné činnosti. Z takto uchovaných dat je možné vytvářet reporty, analýzy a také je využít jako základ pro data mining.

Problémem nynějších středních nebo spíše velkých společností je roztříštěnost informací o zákaznících v různých odděleních společnosti. Tyto organizace mají oddělení internetového marketingu, které má na starosti webové stránky společnosti a v poslední době také sociální sítě. Pod takové oddělení spadá i disciplína webové analytiky, ta je v hojné míře outsourcována. Pracovníci oddělení využívají již hotových reportů a analýz. Dále zpravidla existuje tým přímého marketingu, který využívá záznamy ze CRM. Navíc je zde ještě oddělení zabývající se reklamou, propagací a marketingovou komunikací obecně. Tyto tři týmy fungují samostatně a navzájem spolu nekomunikují nebo velmi omezeně. Přitom ve skutečnosti využívají podobná data, ale každý je má z jiných zdrojů.  Z těchto důvodů jsou data většinou nepřesná a neúplná. Tím se dostáváme k první velké výhodě CI a tou je sjednocení dat o zákaznících. Za předpokladu, že je v rámci CI implementován CDW, budou na jednom místě například informace: co konkrétní uživatel dělal na webových stránkách, kvůli čemu volal na technickou podporu, jaké má zřízené produkty a pomocí jakého kanálu atd.

Obrázek 3: Spojení dat z webu s CRM daty (Zdroj: [18])

Důležité je, aby CI řešení bylo multikanálové. Jednoduše řečeno, aby v něm byly informace o zákaznících z co nejvíce různých zdrojů. Dnes nejvíce uplatňované je již zmíněné spojení klasických zákaznických databází s daty z webu. Jedná se o přiřazení chování zákazníků na webu k jejich záznamům v CRM databázi. To je názorně naznačeno na obrázku 3. Integrace webové analytiky a CRM nám umožní lépe poznat naše zákazníky. Můžeme si tak vytvořit ucelený obrázek o konkrétních zákaznících.

Bylo zde již zmíněno několik možných využití analýzy zákaznických dat. Možností se nabízí daleko více:

·          měření hodnoty zákazníka,

·          analýza spokojenosti zákazníků,

·          analýza a predikce ztráty zákazníků,

·          segmentace zákazníků,

·          analýza zákazníků,

·          vyhodnocení dodavatelů,

·          hodnocení rizikovosti,

·          vyhodnocení kampaní,

·          hodnocení zájemců,

·          analýza posloupnosti nákupů,

·          modelování tendencí k dalšímu nákupu,

·          analýza kanálů,

·          analýza zisku / příjmů,

·          měření kontribuce partnerů,

·          optimalizace pracovníků [19].


3.1.4         Zákaznická analytika

Posledním pojmem, který zde bude objasněn, je zákaznická analytika. Jedná se o nejdůležitější součást CI. Zákaznická analytika pracuje s daty stávajících zákazníků. Cílem zákaznické analytiky je vždy zvyšovat hodnotu zákazníků.

Nejdůležitější metrikou je hodnota zákazníka [20]. Této metrice bude ještě věnováno v práci dostatek prostoru.

3.2        Důležitost CI v organizaci

Stále větší orientace na zákazníka je nepřehlédnutelná napříč obory. Produkt je velmi důležitý, avšak v dnešní době vysoké nabídky není zdaleka jediným bodem zájmu úspěšných společností. Firmy se stále více soustředí na zákazníka. Hlavní slovo v takových společnostech má marketingové oddělení, to se větší měrou zajímá o samotné zákazníky. Výrobci a prodejci se začínají orientovat na to, co si trh žádá. Nové produkty jsou šity na míru zákazníkům. Jsou to výrobky, které jim vyřeší problémy, usnadní práci nebo přinesou jiný užitek.

Pro marketing již zcela neplatí 4P: product (výrobek), price (cena), place (umístění) a promotion (propagace). Nyní jsou uváděna spíše 4C: customer total cost (náklady), customer value (hodnota), convenience (komfort) a communication (komunikace). Z tohoto důvodu je i velký vývoj CRM a všeho, co s ním souvisí [21].

Je tedy patrné, že společnost by v dnešní době měla mít implementované CI. Poznatky ze zákaznické analytiky může využít výrobní společnost k návrhu nových produktů. Využijí je i společnosti, které se neorientují na výrobu. Lepší poznání konkrétních zákazníků povede k efektivnějším marketingovým akcím. Cílený marketing v důsledku vede i k lepší image společnosti. Neustálé obtěžování lidí nevyžádanými e-maily a letáky se všeobecnou nabídkou bezesporu některé jedince irituje. Tento neduh vidím jako největší problém velkých obchodních řetězců, ať už se jedná o firmy s kamennými prodejnami nebo působícími na Internetu. Nejspíše se tato situace co nejdříve změní, nasvědčují tomu různé členské karty a rozmach webové analytiky.

Pokud se tak nestane, je CI a potažmo zákaznická analytika velkou šancí pro malé a středně velké firmy. Ty mají šanci se zařadit mezi tzv. early adopters [4] . Získají náskok před konkurencí a ukážou velkým společnostem, že jde dělat business s menšími finančními náklady a efektivněji. Díky podobným inovacím vyrostlo již nemálo společností. Mezi ty nejvýznamnější na poli internetových obchodů bych jistě zařadil původně knihkupectví, dnes již společnost působící ve více odvětvích, Amazon.

3.3        Prostředky k udržení zákazníka

Přestože si to někteří provozovatelé e-shopů stále neuvědomují, tak udržení stávajícího zákazníka může v některých případech stát menší finanční prostředky než snaha o získání zákazníka nového. Internetové obchody vynakládají nemalé finanční prostředky na SEO [5] , PPC [6] a další nástroje pro přilákání nových klientů. Tato část je bezesporu velice důležitá, ale stálo by také za zvážení nebo spíše vypočtení, zda se nevyplatí investovat i do práce se stávajícími zákazníky. Budovat si jistou loajalitu zákazníků. Jedná se o dlouhodobý proces, který může přinést zajímavé výsledky.

Rozhodne-li se e-shop pro orientace na co nejvyšší retenci zákazníků, zůstává stále otázkou, jak nového návštěvníka přimět k tomu, aby se do e-shopu ještě někdy vrátil a pokud možno se stal jeho pravidelným zákazníkem. Jedná se o soustavnou činnost, při níž jsou nezbytná relevantní data o vlastních klientech. Ta není možné získat pouze za pomoci webové analytiky, ale je třeba využít CRM a ostatní interní zdroje, pokud jsou nějaké takové ve společnosti implementovány [25].

Pro budování loajality zákazníků je nejdůležitější udržet s ním kontakt. Čím osobnější tento kontakt bude, tím lépe. Nejdůležitější je komunikace se zákazníkem. Forem komunikace je celá řada, avšak nejběžnější je e-mailing. Správný e-mailing není tak jednoduchý, jak by se na první pohled mohlo zdát. Je třeba si dát pozor, aby takový e-mail nevyhodnotil zákazník jako spam. To by mělo na budování značky internetového obchodu opačný vliv.

Ze statistik vyplývá, že v on-line sféře je up-selling 20 krát účinnější než cross-selling [26]. Krásným příkladem up-sellingu je snaha, prodat zákazníkovi vyšší řadu produktu nebo nový model, pokud víme, že jeho výrobek, který u nás před časem nakoupil, je již zastaralý. V českých internetových obchodech je něco takového velmi ojedinělé.

S touto praktikou jsem se setkal pouze u prodejce kontaktních čoček. Těsně před tím, než jsem stihl kontaktní čočky spotřebovat, přišel e-mail se stejnou objednávkou, jakou jsem provedl naposledy. V tomto e-mailu pouze stačí kliknout na odkaz a je uskutečněna nová objednávka bez jakéhokoli dalšího vyplňování kontaktních údajů a dalších podobných rutinních činností. Proč se obtěžovat s hledáním levnějšího zboží zdlouhavým objednáváním, když to může být tak jednoduché. K přechodu k jinému prodejci nemá zákazník sebemenší důvod. Jediné, co si takový prodejce musí oproti běžné objednávce uchovat ve svém systému je, na jakou dobu byly kontaktní čočky objednané. Pokud se jedná o půlroční, stačí za pět měsíců odeslat zmíněný e-mail. Na tomto příkladu je vidět, že i jednoduchá myšlenka a ne příliš náročná realizace může znamenat pro prodejce konkurenční výhodu.

Z uvedeného příkladu je zřejmé, že ne vždy jsou pro up-selling nutné složité segmentace zákazníků a kvalitní CRM. Je možné cílit i na jednoho konkrétního zákazníka. Málokdy je situace takto jednoduchá, proto je dobré využít složitějších CI systémů. Pojem targeting, je mezi marketéry stále více skloňován. Masová reklama například v televizi, rozhlase nebo tisku je velmi finančně náročná. Cílit na konkrétní segmenty je nepoměrně levnější a daleko efektivnější. K dobrému zacílení reklamy jsou využívány hlavně low-cost komunikační kanály, jakými je e-mail a poslední době velmi oblíbená sociální média.

Ze zveřejňovaných přehledů velkých e-shopů je patrné, že hojně využívané nepersonalizované newslettery vždy zvýší jejich prodeje [27]. Podle některých zdrojů e-mail tvoří 20 až 40 procent obratu retailu. To platí za předpokladu, že ostatní faktory se nezmění. Tedy že media mix je vyrovnaný [27]. Otázkou zůstává, o kolik procent se obrat zvýší při používání cílených nabídek. Když uživateli podle jeho chování vybereme produkty, které by ho mohli zajímat, ušetříme mu tím práci a čas. On bude mít o důvod více, zachovat přízeň tomuto e-shopu.

 

4          Hodnota zákazníka

Následující kapitola se bude věnovat problematice stanovování hodnoty zákazníka a skórování zákazníků. Nejprve bude vysvětleno, k čemu je dobré určení hodnoty zákazníka. Bude probráno několik metrik, které nám napoví, jak moc je pro nás daný klient přínosný. Určování hodnoty zákazníka a především skórování u elektronického obchodu má určitá specifika, oproti klasickému stanovení hodnoty zákazníka například v bankovním sektoru. Proto bude v této kapitole kladen důraz hlavně na tato specifika.

4.1        Vývoj činností provozovatele webových stránek

Před tím, než se pustím do výkladu samotné problematiky hodnoty zákazníka a ostatních souvisejících skutečností, pokusím se nastínit, jak toto téma souvisí s provozováním internetového obchodu.

Provozovatel e-shopu musí provést řadu dílčích kroků, aby jeho web prosperoval. Tyto kroky jednoduchým způsobem objasňuje následující obrázek. Jsou na něm naznačeny samotné cíle, které je nezbytné pro úspěch dosáhnout a aktivity potřebné k jeho uskutečnění.

Obrázek 4: Evolution path (Zdroj: [28])

Ze všeho nejdříve je zapotřebí dostat na webové stránky e-shopu co nejvíce návštěvníků. Bez návštěvnosti je web naprosto nepoužitelný, protože teprve z návštěvníků se mohou stát zákazníci. Toho se docílí optimalizací pro vyhledávače. To je možné dále doplnit různými formami reklamy, ať už se jedná o internetovou reklamu (PPC, bannery) nebo jiná média (TV, rádio, tisk).

Dalším stupněm je zvýšení konverzního poměru. K dosažení tohoto cíle je třeba se snažit vytvořit web, co nejlépe použitelný pro návštěvníky. Jedním z nejčastěji zmiňovaných příkladů bývá optimalizace objednávkového formuláře. Je velká škoda, když zákazník již vloží požadované zboží do nákupního košíku a my ho ztratíme někde na cestě k dokončení objednávky. Taková skutečnost může být někdy způsobena opravdovou banalitou. Například špatně definovaný formát požadovaného údaje (telefon, PSČ apod.). Další snahou může být zvyšování důvěryhodnosti internetového obchodu. Často využívaným prostředkem při zvyšování míry konverze je A/B testování.

Na samotném vrcholu je zvyšování hodnoty zákazníka. K realizaci tohoto záměru je zapotřebí optimalizovat marketingové činnosti společnosti. Jako příklady těchto činností zde máme komunikaci, důvěryhodnost, cross-selling, up-selling, cílenou reklamu, znovu oslovení stávajících zákazníků. Existují mnohé další.

4.2        Stanovení hodnoty zákazníka

Při stanovování hodnoty zákazníka není určen pouze jeden přístup. Nejpoužívanějším z nich je, vypočtení hodnoty na základě jeho útraty. Hodnotu zákazníka pak spočteme součtem marží ze všech produktů, které klient nakoupil. Dále je třeba od této částky odečíst náklady spojené se získáním a udržením zákazníka [29]. V případě elektronického obchodu většinou nezná prodejce přesné množství vynaložených finančních prostředků na jednotlivé zákazníky. Je tedy zpravidla volen přístup, kdy se náklady na reklamu rozdělí mezi všechny zákazníky.

Občas je pojem hodnota zákazníka chápána trochu šířeji. V takovém případě se tento ukazatel skládá kromě výše zmíněných i z dalších dílčích metrik. Ty se v každé společnosti liší. Účelem je, aby vypočtená suma co nejlépe vystihovala skutečnou hodnotu zákazníka.

Určení hodnoty zákazníka se zásadně liší u malých a velkých společností. Lépe řečeno u společností s malým počtem zákazníků a těmi, které mají zákazníků mnoho.  Existují společnosti s několika málo klienty, které výborně znají každého z nich a můžou tak nabídnout personalizovaný přístup bez složitých segmentací [30].

V kontrastu s těmito společnostmi jsou ale velké korporace s tisíci zákazníky, které mají úlohu personalizovaného přístupu daleko složitější. Přistupovat ke každému klientovi individuálně je v tomto případě skoro nemožné. Takový přístup by byl velmi nákladný. Je třeba zákazníky segmentovat na základě určitých kritérií. Zajímavé výsledky nám poskytne právě použití hodnoty zákazníka.

Při stanovování hodnoty klienta je obyčejně kromě aktuální hodnoty zákazníka odhadována i jeho budoucí hodnota. Na základě určení současné a budoucí hodnoty zákazníka můžeme zvolit individuálnější přístup ke klientovi. Není ojedinělý příklad, kdy 10 % nejlepších zákazníků tvoří přes 40 % zisku a naopak posledních 40 % zákazníků tvoří podíl na zisku menší než 10 % [30].

Mezi veřejností je celkem rozšířeno tzv. Paretovo pravidlo 80/20. Podle tohoto pravidla je 80 % výstupů výsledkem 20 % vstupů. Teorie se vztahuje na práci, na studium apod. V našem případě se toto pravidlo dá tedy vyložit tak, že 20 % klientů tvoří 80 % obratu [31]. Kdo by tedy nechtěl vědět, kdo je oněch 20% nejprofitabilnějších zákazníků? Pokud budeme mít správně určenou hodnotu zákazníka, určení těchto zákazníků, je již jednoduché.

4.2.1         Hodnotová segmentace

Následující obrázek velice zjednodušeně vymezuje čtyři základní segmenty našich zákazníků určených na základě stanovených hodnot zákazníka. Dále je v matici heslovitě naznačen doporučený přístup k těmto zákaznickým segmentům. Zákazníci po celou dobu samozřejmě nezůstávají „zaškatulkováni“ stále ve stejném segmentu. Velmi často mezi segmenty migrují. Vyplatí se také sledovat, v jakých směrech klienti migrují a snažit se v nich najít nějaké zákonitosti. Úkolem společnosti je, aby měla co nejvíce klientů v ziskových segmentech. Tomu se musí bezesporu nějakým způsobem dopomoci. Každá skupina zákazníků si zaslouží jiný přístup, zaslouží si jinou péči a formu komunikace.

Obrázek 5: Hodnotová segmentace (Zdroj: [32])

Individuální přístup na základě těchto zákaznických skupin může zvýšit společnosti zisk, ale navíc ušetřit náklady. Když to přeženu, tak s některými zákazníky již nemá velký smysl se zabývat. Pracovníci se tak mohou soustředit na důkladnou péči o profitabilní klienty.

4.2.2         Rizikovost zákazníka

V literatuře je hodnota a potenciál zákazníka doplňován ještě o rizikovost zákazníka. Ta v případě internetového obchodu nehraje velkou roli. Platební morálka je zajištěna odpovídajícími platebními metodami e-shopů. Vesměs jsou produkty zasílány po zaplacení nebo na dobírku. Jediné úskalí může nastat v případě vrácení zboží do 14 dnů bez udání důvodů, na což má každý zákazník ze zákona právo. Vrácené zboží má povětšinou poničený obal a již ho není možné prodat za plnou cenu. Internetovému obchodu tak vzniká jistá škoda. Započítávat ji do hodnoty hrazené zákazníkem by asi nebylo úplně správné, snad jenom v případě, že se takto zákazník zachová opakovaně.

4.3        Customer Lifetime Value

Samotná hodnota zákazníka je zavádějící. Pro lepší srovnání důležitosti jednotlivých zákazníků je vhodné ji vztáhnout k délce vztahu se zákazníkem. Získáme tak například roční nebo celoživotní hodnotu. Nyní se budu věnovat právě celoživotní hodnotě zákazníka. V originále označovanou za Customer Lifetime Value. Jedná se o marketingovou veličinu, která má za úkol vyjádřit hodnotu zákazníka za celou dobu trvání vztahu zákazníka se společností. Stanovení Customer Lifetime Value je obdobné jako určení hodnoty zákazníka popsané v úvodu této kapitoly.

4.3.1         Složení Customer Lifetime Value

CLV je možné spočítat téměř pro každý typ společnosti. Základní veličiny při jeho výpočtu, které jsou společné všem:

·          doba trvání,

·          časové období,

·          příjem,

·          náklady,

·          diskontní sazba.

Dále jsou některé závislé na odvětví podnikání:

·          míra obnovování,

·          míra doporučení,

·          rizikový faktor [33].

V následujících několika odstavcích budou tyto komponenty CLV blíže vysvětleny. Bude nahlíženo na problematiku z hlediska provozovatelů internetových obchodů.

Doba trvání vyjadřuje délku vztahu se zákazníkem. Je asi celkem jasné, že jde o klíčový ukazatel. Existuje více přístupů k jejímu určení. V případě internetového obchodu se tedy snažíme počítat jeho hodnotu od prvního navštívení webu, pokud je to možné. Máme možnost vidět například, jak dlouho zákazník navštěvoval e-shop před prvním nákupem, kolikrát webové stránky navštívil a jakou dobu zde strávil. Pokud to technologie neumožňuje, tak je možné začít CLV počítat od prvního nákupu.

Časové období je vlastně doba přírůstkového měření. V případě B2B [7] je to obvykle 1 rok. V případě e-shopu bych doporučoval, mít časové období mnohem kratší, přírůstky vytvářet pokud možno každý den. Postačit by měly i týdenní přírůstky. Maximálně bych volil provádění měsíčních inkrementací, pokud se jedná o větší e-shop, kde by časté provádění inkrementací zbytečně zatěžovalo server. To by mohlo mít za následek zpomalení systému internetového obchodu.

Příjem vyjadřuje marži z celkové útraty zákazníka, jak již bylo zmíněno výše. U systémů pro internetové obchody jsem se ještě nesetkal s možností vložení hodnoty marže ke konkrétnímu produktu. Implementace takové funkcionality by byla velmi jednoduchá a prodejcům by ulehčila mnoho práce při dalších výpočtech. 

Náklady byly také zmíněny již při vysvětlování obecné hodnoty zákazníka. Základní členění nákladů může být následující:

·          marketingové náklady,

·          přímé náklady.

Marketingové náklady na jednotlivé zákazníky e-shopu je složité odhadnou a takřka nemožné je spočítat. Proto se pro zjednodušení v některých případech tyto náklady sečtou pro celý e-shop a následně vydělí počtem zákazníků. Přímé náklady tvoří například poštovné, vrácení zboží nebo reklamace.

Diskontní sazba slouží k převodu budoucí hodnoty hotovostních toků na jejich hodnotu současnou pomocí tzv. diskontování [35]. Tento pojem je již ale velmi vzdálený samotnému tématu práce, proto nemá cenu se o něm vice rozepisovat.

Míra obnovování je pravděpodobnost obnovení a zachování výrobků jednotlivých zákazníků. K hodnotě zákazníka přičteme tedy cenu možného dalšího nákupu. Tuto hodnotu by měli sledovat hlavně internetové obchody se spotřebním zbožím. Hlídat si přibližnou životnost těchto výrobků a v případě jejího vypršení nabídnou zákazníkovi zboží nové. Pro obchody prodávající produkty s předpokládanou mnohaletou životností postrádá tato hodnota hlubšího smyslu.

Míra doporučení je zdrojem tzv. inkrementálních příjmů. Jde o případné doplňkové produkty k již zakoupenému zboží zákazníka. Pro lepší pochopení uvedu jednoduchý příklad. Pokud si zákazník koupí fotoaparát s výměnnými objektivy (zrcadlovku), má prodejce velkou šanci, že si v budoucnu objedná také nový objektiv s lepšími parametry. Úkolem prodejce je podnikat veškeré marketingové snahy, aby tak zákazník opravdu učinil.

Rizikový faktor byl již vysvětlen v kapitole 3.1.2.

4.4        Skórování zákazníků

Cílem stanovování hodnoty zákazníka je co nejpřesněji určit částku, kterou vydělala společnost díky jednomu konkrétnímu zákazníkovi. Někdy je tato částka ještě obohacena o možné budoucí příjmy ze zákazníka. To všechno stále neposkytuje úplně přesnou představu o celkovém přínosu zákazníka pro společnost. Odhadovat potenciál zákazníka pouze na základě informací o nákupech je možné, avšak v případě internetového obchodu se nabízí nemálo dalších ukazatelů, které nám o zákazníkovu budoucím chování napoví mnohem víc.

Pro lepší poznání zákazníků je zapotřebí se oprostit od principu přepočítávat vše na peníze. Pomůže nám skórování zákazníků. Jde o proces, kdy se složité vztahy v datech zobecňují. Zjednodušeně jde o jakési bodování zákazníka na základě některých metrik. Tyto metriky se liší v každém odvětví. Podstatně se liší také váha těchto dílčích metrik. Stanovení vah je složitý proces, který vyžaduje dostatek zkušeností a informací o společnosti.

Způsob, jakým stanovujeme skóre, se označuje skóring. Jde o určité kvantitativní vyjádření. Používá se zejména pro porovnání a rozhodování. V praxi se nejčastěji setkáváme s kreditním skórem. To se velmi často používá v bankovním sektoru, například při poskytování úvěrů. Vyjadřuje schopnost klienta dostát svým závazkům. Snaží se predikovat, zda zákazník bude schopen splácet úvěr a potažmo zda se společnosti vyplatí mu úvěr poskytovat. V internetovém obchodě postačí pouze bodové ohodnocení profitability zákazníka. Popřípadě je možné identifikovat možné příležitosti pro cross-selling. Může se stát, že včasným nabídnutím dalšího produktu zabráníme zákazníkovu přechodu ke konkurenci.

Jak již bylo několikrát zmíněno, je ve vztahu se zákazníkem důležitá komunikace. Někteří zákazníci si zaslouží osobnější přístup. U většiny e-shopů je ke všem zákazníkům přistupováno stejně. Netvrdím, že je to špatně, spíše naopak. Společnost to ale stojí nemalé finanční prostředky. Díky vypočtenému skóre bude možné na první pohled určit, o jak důležitého zákazníka se jedná. Navíc nebude tato informace zabarvena osobním pohledem některých pracovníků. Jak se lidově říká, bude všem měřeno stejným metrem. Metriky a jejich váhy jsou pro všechny zákazníky stejné.

Druhy skóringu:

·     aplikační skóring, který se používá při schvalování žádostí o produkt či službu u nových klientů společnosti,

·    behaviorální skóring (popř. performance skóring), který slouží pro hodnocení současných klientů [36].

4.4.1         Skóringový model

Chceme-li získat jednorozměrné skóre je nejdůležitější skóringový nebo také skórovací model. Pro vytváření modelu se vesměs používá statistických algoritmů. Nejpoužívanějšími jsou:

·          logistické regrese,

·          rozhodovací stromy,

·          neuronové sítě.

Skóringový model umožňuje sestavit skóre kartu pro všechny proměnné, které do modelu vstupují. Skóre karta má několik možných překladů. Někdy se označuje jako skóringová karta, skórovací karta nebo skórovací funkce. Jedná se o způsob kvantifikace jednotlivých proměnných. Pro příklad uvedu kategorizaci proměnné věk. V internetovém obchodě se s takovou proměnnou ve většině případů nesetkáme, ale výborně vystihuje danou problematiku.

Tabulka 1: Princip sestavení skóre karty (Zdroj: [36])

Kategorie

Skóre

méně než 25 let

-20

25 – 35 let

0

35 – 45 let

20

45 – 55 let

30

55 – 56 let

10

65 let a více

-10

Jak je vidět, ne vždy jsou proměnné tak jednoduché, aby skóre bylo přímo úměrné jejich výši. Tato tabulka dokumentuje bodování podle věku. Takto nějak jsou bodováni uchazeči o úvěr. Skóre má samozřejmě každá bankovní instituce nastavena jinak. Skórovací modely jsou nastaveny podle cílů společnosti a většina organizací si je snaží uchovat v tajnosti. Dobře nastavený skóringový model je konkurenční výhodou.

Ne vždy je nutné tvořit ruční kategorizaci proměnných. Hojně se využívá rozdělení hodnot do kvantilů. Tyto kvantily jsou pak logicky převáděny na výše skóre. Podmínkou je, že se musí jednat o hodnoty, u kterých jejich výše vyjadřuje jejich hodnotu. O tom, že tomu vždy tak není, jsme se mohli přesvědčit na předchozím příkladu.

Vytvoření kvalitního skóringového modelu vyžaduje hodně úsilí. Jedná se o kontinuální proces. Model je třeba stále zdokonalovat. Je nezbytné měřit úspěšnost nasazeného skóringu a vyhodnocovat jej. Nabytá zjištění pak implementovat do modelu.

4.4.2         RFM skórování

Skórování zákazníků je většinou tvořeno na míru konkrétním potřebám. Existují i metody, které jsou obecně známé a hojně využívané. Mezi ty můžeme zařadit RFM skórování. RFM skórování tak trochu navazuje na CLV. Lépe však vyjadřuje chování zákazníků. RFM skóre je behaviorální trojrozměrné skóre získané agregací transakčních dat. [37] Přesněji řečeno se jedná o agregaci transakčních dat o nákupech. Z těchto dat lze jednoduše určit tři základní složky RFM skórování. Zkratka je počátečními písmeny následujících slov:

·          Recency - aktuálnost,

·          Frequency - četnost,

·          Monetary – finanční ohodnocení.

Recency je možné vyložit jako dobu, která uplynula od posledního nákupu zákazníka. Udává se zpravidla ve dnech. Může být vztažena k dnešnímu datu nebo jakémukoli předem zvolenému dni. Vycházíme tedy z předpokladu, že zákazníci, kteří kupovali nedávno, budou mít vyšší zájem o nové produkty.

Frequency vyjadřuje počet nákupů zákazníka ve sledovaném období. V tomto případě vycházíme z toho, že zákazníci, kteří kupují často, budou mít větší zájem o novou nabídku.

Monetary je celková finanční částka utracená za všechny nákupy zákazníka ve sledovaném období. Předpokládáme, že zákazníci kupující ve vysokých objemech, mají vyšší zájem [37].

Úskalím při skórování zákazníků je stanovit požadované bodové ohodnocení. To samozřejmě není možné jednoduchou agregací transakčních dat. Tou u RMF skórování získáme naše tři požadované hodnoty. Pro výpočet jednorozměrného skóre je zapotřebí modelování. Teprve s jeho pomocí je možné vytvořit skórovací model. Ten z RFM skóre spočte jednorozměrné skóre úměrné hodnotě zákazníka. Povětšinou je skórovací model tvořen na základě historických dat. V tomto případě by pro k jeho vypočtení bylo možné využít logistické regrese.

4.4.3         Skórování zákazníků elektronického obchodu

RFM skórování, vytvořené z dat o nákupech, je možné vzít jako dobrý základ, na který je možné nabalit další metriky. Dalšími daty mohou být například hodnoty získané za pomoci z webové analytiky, sociodemografické ukazatele, data z výzkumů spokojenosti zákazníků, popřípadě textové poznámky operátorů v call centru.

Bylo zmíněno základní pojetí RFM skórování. Tyto základní prvky je možná použít i na jiná transakční data, než jsou data o prodejích. V případě e-shopu můžeme využít transakční data o požadavcích návštěvníků z webového serveru. Ty je možné vydolovat z logů serveru nebo v dnešní době získat mnohem jednodušším způsobem, kterým je použití nástrojů webové analytiky. 

Při analýze záznamů z webového serveru můžeme jako monetary využít celkovou dobu strávenou prohlížením portálu. Frequency bude značit počet zobrazených stránek popřípadě četnost zákazníkových návštěv. Recency bude vystupovat jako doba od poslední návštěvy. Pro provozovatele internetového obchodu nejužitečnější výsledky dozajista poskytne kombinace těchto dvou výše zmíněných skórování.

Nyní se na tyto metriky webové analytiky zaměříme trochu podrobněji.

4.4.3.1        Délka návštěvy

Délka návštěvy je ekvivalentem ke kvalitě návštěvy. Zákazník, který na webu stráví hodně času, má zřejmě zájem o nabízené produkty nebo společnost jako takovou. Platí to alespoň za předpokladu, že je web dobře navržen a návštěvník pouze nebloudí a složitě nehledá potřebné informace. Tomu by nasvědčoval průběh návštěv ostatních zákazníků. Odhalení takové skutečnosti je úkolem webového analytika.

Nyní je třeba vysvětlit pojem, který s délkou návštěvy úzce souvisí, je jím míra opuštění. Ta určuje počet jednostránkových návštěv. Je většinou vyjádřena v procentech všech návštěv. Bohužel dosavadní technologie neumožňují určit dálku této návštěvy. Je to způsobeno principem měření. Délka návštěvy se měří pomocí času návštěvníka mezi návštěvami jednotlivých stránek našeho webu. Takže pokud návštěvník odejde hned z první stránky, není možné tuto dobu stanovit. Může nastat tedy několik situací, které nejsme schopni rozlišit:

·          Návštěvník hledal, co potřeboval a po pročtení informací po nějakém čase odešel.

·     Návštěvník našel, co hledal, ale nabídka ho nenadchla, proto se rozhodl hledat zboží u konkurence.

·          Návštěvník byl zklamán z toho, co viděl a ihned opustil web.

Z principu měření plyne i další skutečnost. Délka návštěv je vždy kratší než skutečná. To je však stejné pro všechny návštěvníky, proto se tento fakt většinou vůbec neuvažuje.

Pro určení skóre zákazníka použijeme délku všech návštěv od první návštěvy zákazníka nebo délku návštěv za určité námi stanovené časové období. Webová analytika nám ale nabízí i další související metriky. Například ty neagregované, jako jsou délka jednotlivých návštěv, délka první návštěvy a délka poslední návštěvy. Nebo nabízí zástupce agregované metriky, kterou je průměrná délka návštěvy.

4.4.3.2        Hloubka návštěvy

Tato metrika doplňuje potřebné znalosti k předchozí metrice délka návštěvy. Počet zobrazených stránek za všechny návštěvy nám poskytne větší představu o chování zákazníka na webových stránkách. Lidé pohybující se po webových stránkách mají rádi rychlé informace, proto pokud něco ihned nenajdou, přesunou se na jinou stránku webu. Rychlost, s jakou se zákazníci pohybují po našem webu, napoví hodně.

Obdobně jako v předchozím případě, i zde je možné sledovat počet zobrazených stránek za jednu konkrétní návštěvu.

4.4.3.3        Aktuálnost zákazníka

Tato metrika ukazuje, jak dlouhá doba uplynula mezi současnou a poslední návštěvou internetového obchodu [15]. Čím kratší je tento časový interval, tím lépe pro provozovatele e-shopu. Znamená to zájem o novinky společnosti nebo průběh rozhodovacího procesu při nákupu zákazníka. Málokterý návštěvník nakoupí zboží při první návštěvě webu.

4.4.3.4        Věrnost zákazníka

Metrika věrnost zákazníka je pro nás velice důležitá. Celé snahy CI mají za cíl co nejvyšší loajalitu zákazníků. Díky této metrice se může společnost přesvědčit o tom, jak se jí to daří. Ukazuje nám, jak často návštěvník potažmo zákazník navštěvoval naše stránky. Logicky je třeba vztáhnout ji k nějakému časovému období jako předchozí metriky. Pokud nemá společnost stanovený žádný skórovací model, může začít tím, že se bude rozhodovat na základě této metriky.

4.4.4         Využití zákaznického skóre

Hlavní podstatou zákaznického skóre je urychlení rozhodování. Na základě jednoho čísla vidíme, jak hodně je zákazník pro společnost důležitý, komu bychom se měli věnovat více a komu méně. Uvedu jeden příklad z praxe. Nejedná se zrovna o případ z retailu, ale jde o praktiky mobilních operátorů.

Už jsem se ve svém okolí setkal několikrát s informací o praktikách mobilních operátorů, pokud chcete vypovědět smlouvu. Když zákazník mobilního operátora zavolá na zákaznickou linku s tímto požadavkem, je někdy mile překvapen nabídkou na míru s výraznou slevou. Díky tomu u poskytovatele mobilních služeb setrvá. Operátor se tak může zachovat právě díky znalosti přibližné ceny klienta a představy možných ušlých zisků při přechodu zákazníka k jinému poskytovateli telekomunikačních služeb.

Něco takového by nešlo realizovat bez zákaznického skóre. Pracovník na zákaznické lince si nemůže jen tak z hlavy vymyslet výhodný tarif na míru zákazníkovi. Systém mu na základě vypočteného skóre a dalších transakčních dat o službách klienta určí možnosti, kterými má za úkol udržet klienta u této společnosti.

Podobné praktiky jsou realizovány i v jiných odvětvích. Je to způsobeno hojným rozšiřováním data miningových systémů. Řada možných využití skórování již byla v práci zmíněna, protože se jedná o pomůcku k dlouhodobému udržení zákazníka.

4.5        Další metriky k lepšímu poznání zákazníka

Nejenom na základě jediné agregované metriky, kterou je zákaznické skóre, není možné provádět dobrá rozhodnutí. Je řada dalších zajímavých ukazatelů, které nám mohou pomoc. Na některé z nich jistě stojí za to se podívat. Nejdříve zmíním ty, které je možné vyčíslit z dat o nákupech.

4.5.1         Průměrná hodnota objednávky

Bezesporu je dobré vědět, zda zákazník provádí časté velké a drahé objednávky nebo jde o zákazníka, který v našem obchodě utrácí jen velmi málo. To je opět zajímavé číslo pro marketéry. Zákazníkům s vysokou průměrnou hodnotou objednávky se vyplatí nabídnout nějakou slevu nebo věnovat malý dárek.

4.5.2         Hodnota na návštěvu

Hodnota na návštěvu doplňuje předchozí metriku, vyčísluje nám hodnotu objednaného zboží na jednu návštěvu zákazníka. Pro dobré pochopení uvedu konkrétní příklad. Provedl-li zákazník deset návštěv a z toho dvakrát nakoupil zboží dohromady v hodnotě 1 tisíc Kč, vychází nám hodnota na návštěvu 100 Kč. K čemu nám je takové zjištění dobré? Víme-li, že hodnota na návštěvu je vysoká, ale zákazník náš web moc nenavštěvuje, bude naším cílem, tohoto zákazníka dostat na webové stránky obchodu co nejčastěji. Opatření jde logicky aplikovat i opačně.

4.5.3         Jaké produkty si zákazník koupil

Bezesporu je dobré vědět, zda si zákazník objednává drahé produkty, levné produkty nebo je výběr nahodilý. Úplně jiný rozměr dostává metrika, pokud ji vztáhneme přímo na kategorii e-shopu. Když zákazník nakupuje většinou nejdražší produkty v kategorii, znamená to, že si rád zaplatí kvalitní zboží nebo dokonce, že má rád luxusní produkty. Mít co nejvíce takových klientů je snem nejednoho obchodníka. Zde je vidět, že jejich odhalení není zas tak složité.

Zdali se jedná o velkého odběratele s mnoha objednávkami, může obchodník zjistit analýzou nákupního košíku. Ta nám napoví, jaké typy produktů si zákazník kupuje současně. Většinou je tato praktika realizována napříč všemi objednávkami všech zákazníků e-shopu, protože je zapotřebí velké množství dat, aby výsledky dávaly hlubší smysl.

Nyní přichází řada na data, která není možné vyčíst z transakčních dat o nákupech zákazníků. Je na ně zapotřebí zpracování logů serveru nebo využití nástrojů webové analytiky. Nejedná se o metriky s konkrétními čísly. Jde o data, která si vyžadují podrobnou analýzu, abychom mohli na základě zjištěných informací personalizovaně přistupovat k našim konkrétním klientům. Z tohoto faktu vyplývá, že se jimi má cenu zabývat pouze u našich nejcennějších zákazníků.

4.5.4         Jaké si zákazník prohlíží produkty

První věcí je, jaké stránky internetového obchodu si zákazník prohlíží. Nás bude asi nejvíce zajímat, stánky jakých produktů navštívil. Z toho má prodejce možnost zaznamenat, o jaký druh produktů má zákazník zájem. Ty pak může umístit do e-mailového newsletteru, který bude zákazníkovi „ušitý na míru“. Jak již bylo vícekrát zmíněno, taková e-mailová kampaň bude mít bezesporu vyšší konverzní poměr.  

4.5.5         Co zákazník vyhledává

Koho by nezajímalo, co zákazník vyhledává? Návštěvník webových stránek generuje dva druhy vyhledávání:

·     vyhledávání pomocí internetového vyhledávače (Google, Seznam), díky kterému se návštěvník dostal na webové stránky,

·          interní vyhledávání na webových stránkách.

Klíčové slovo, které návštěvník zadal do internetového vyhledávače, je velmi zajímavá informace. Této znalosti se hojně využívá pro zlepšení SEO optimalizace. Pro důkladnější poznání zákazníka nám to mnoho neposlouží.

Zato informace z interního vyhledávání nám mohou napovědět víc než kompletní seznam stránek produktů, které uživatel navštívil. Poví nám, o co přesně má uživatel zájem. Při vyhledávání na webu mohou nastat různé situace. Buď návštěvník nalezne, co hledá, nebo se tak nestane. My ale máme toto vyhledávání uloženo v našem nástroji webové analytiky nebo ještě lépe v CRM systému. Můžeme tak velice pružně reagovat.

4.5.6         Tok návštěvníků

Moderní nástroje webové analytiky umožňují sledovat přesné cesty návštěvníků. Vidíme:

·          jakými stránkami návštěvník prochází a v jakém pořadí,

·          jaká stránka byla jeho vstupní stránkou,

·          z jaké stránky návštěvník web opustil.

Takové informace jsou zajímavé hlavně z hlediska vylepšování uživatelské přívětivosti webu. Poslední stránka návštěvy může napovědět něco více. Záleží na tom, o jaký typ stránky se zrovna jedná. Opustí-li zákazník náš web z nějaké stránky produktu, znamená to, že se nemůže rozhodnout nebo ho něco na produktu zklamalo. Může se jednat o cenu, vzhled atd. Máme možnost zákazníka kontaktovat osobně a zkusit ho přesvědčit, aby si produkt zakoupil nebo mu nabídnout alternativu, která mu bude vyhovovat více.

4.5.7         Atribuční analýza

Atribuční analýza se zajímá o jednotlivé zdroje, z jakých návštěvník přichází při jednotlivých návštěvách. Těmi základními zdroji jsou:

·          organic – návštěvy z vyhledávačů,

·          referral – návštěvy z odkazujících stránek,

·          cpc – návštěvy z placených vyhledávání (PPC),

·          direct – přímá návštěvnost (napsání adresy do adresního řádku webového prohlížeče)

Pomocí atribuční analýzy se snažíme určit některé zákonitosti posloupnosti zdrojů před samotnou konverzí. Díky tomu je pak možné stanovit přesnější hodnotu finančních prostředků vynaložených na prodej produktu nebo optimalizovat reklamní kampaně.


 

5        Prováděné analýzy

Před samotnou realizací CI systému je třeba provést analýzy dostupných dat. Ty nám napomohou upřesnit potřeby internetového obchodu. Touto kapitolou se dostáváme k praktické části této diplomové práce. Proto se v úvodu jen velmi stručně seznámíme s internetovým obchodem, na kterém probíhá samotná realizace. Obsahem této kapitoly tedy bude RFM analýza a určení Key Influencers. Tyto analýzy samotné je možné zařadit do metod CI. Takže nám pomohou lépe poznat zákazníky e-shopu. Výsledky pak budou použity při tvorbě skóringových modelů a samotných reportů pro zaměstnance.

5.1        Seznámení se společností

Provozovatel internetového obchodu má velké obavy, aby informací obsažených v této práci nevyužila konkurence, proto si zde nikde nepřeje být jmenován. Nepřeje si ani zveřejňovat příliš konkrétní informace o společnosti, aby nebyl znám obor, ve kterém společnost podniká. Z těchto důvodů jsou zde pouze obecné údaje. Pro realizaci to žádná překážka není.

Internetový obchod provozuje česká společnost. Její hlavní činností je výroba zboží, které nabízí mimo jiné i na tomto e-shopu. Nejedná se tedy o model nákup a prodej, který je standardní u většiny e-shopů. Podnik zaměstnává několik desítek zaměstnanců, avšak naprostá většina pracuje ve výrobě. Společnost se snaží prodávat zboží i jinými distribučními kanály. Většina výrobků jde do zahraničí. Na e-shop není ve firmě kladen moc velký důraz.

Internetový obchod je provozován již poměrně dlouhou dobu. Na novém systému funguje více jak tři roky. Poskytovaná data jsou tak od doby nasazení tohoto systému, na kterém jsem se sám podílel. Návštěvnost internetového obchodu není nikterak vysoká. Jde o méně jak tři tisíce návštěv za měsíc.

5.2            RFM analýza

Podstata RFM skórování již byla vysvětlena v teoretické části práce. Pro připomenutí je třeba zmínit tři základní složky:

Nyní se podíváme na tyto hodnoty pro náš konkrétní internetový obchod. Zároveň budou zmíněna možná marketingová doporučení. Nejprve je nutné si lépe popsat samotné získání všech tří složek z dostupných dat e-shopu. Ten je provozován na běžném webovém hostingu. Pro ukládání dat je použita transakční databáze MySQL. Díky tomu bylo možné R, F a M složky získat pomocí klasického SQL dotazu.

S ohledem na to, že internetový obchod nabízí poměrně specifické zboží a díky tomu není návštěvnost ani konverzní poměr nikterak vysoký, bylo vybráno nejdelší možné období, abychom měli pro analýzu dostatek potřebných dat. Ta jsou tedy od 1. 1. 2009 do 31. 12. 2011 včetně. Hodnota recency je tedy vztahována právě k 31. 12. 2011. Může tedy nabývat maximální hodnoty 1095 dní.

Pro lepší představu byly vydolované informace převedeny do co nejpřehlednější formy. Tou je dle mého názoru v tomto případě grafické znázornění četností jednotlivých hodnot nebo rozmezí hodnot. Jedná se tedy o histogramy R, F a M. Z těchto histogramů jsou patrné některé skutečnosti, které budou rozebrány níže. Budeme se snažit zjistit, zda se prodejce při svém počínání nedopouští nějakých zbytečných chyb, díky kterým přichází o zisky. Následně bude velmi stručně vysvětleno, co je třeba udělat proto, aby se provozovatel konkrétního internetového obchodu těmto chybám příště vyvaroval.

5.2.1        Recency

Složky tedy vezmeme pěkně popořadě. Na prvním histogramu je znázorněn počet zákazníků v závislosti na době od posledního nákupu. Ten je pro přehlednost vyjádřen v měsících.

Obrázek 6 : Histogram recency

Z grafu je patrné, že největší procento zákazníků nakoupilo v internetovém obchodě před méně než čtyřmi měsíci. To je celkem příznivé zjištění. Je to zřejmě způsobeno tím, že značná část prodávaného zboží je určena pro výrobu dalších produktů. Takže se zde v hojné míře objevuje pravidelný nákup po nedlouhých intervalech. Na takové tvrzení nám však pouze tento graf nestačí. Uvidíme, zda to bude potvrzeno nebo vyvráceno v dalším histogramu.

Bohužel je ale také vidět, že velká část zákazníků nenakoupila v obchodě již více jak dva roky. Ani takoví zákazníci nemusí být pro e-shop obchodně mrtví, pouze jim musí být věnován jiný přístup. Doporučuji tedy obchodníkovi zkusit tyto zákazníky oslovit s nějakou výhodnou nabídkou, dokud na e-shop nezapomenou úplně. Cílem takové marketingové snahy je, nějakým nenásilným a pro zákazníka přínosným způsobem se připomenout.

5.2.2        Frequency

Četnost nákupů nám ukáže věrnost stálých zákazníků. Je to ukazatel, který mnoho provozovatelů internetových obchodů opomíjí, přestože je velice důležitý. Frekvence nakupování má pro tento e-shop značný význam, jak již bylo zmíněno. Hodně zákazníků je ve vztahu B2B, takže provádějí opakované nákupy. Takoví klienti jsou pro e-shop výhodní. Představují potenciál stálého příjmu s poměrně nízkými náklady. Představu o přibližném počtu těchto klientů si vytvoříme díky následujícímu grafu na obrázku 6. Znázorňuje množství zákazníků v závislosti na počtu uskutečněných nákupů.

Obrázek 7 : Histogram frequency

Jaká je tedy situace ve skutečnosti? V tomto případě bych se nebál použít slovo žalostná. Podle četností je jasné, že obchod má problémy s retencí zákazníků. Naprostá většina zákazníků nakoupila na e-shopu pouze jednou. Je třeba se zaměřit na udržení zákazníků. Možná východiska byla vyjmenována již v teoretické části práce.

Histogram nám ale poskytuje ještě jednu velmi zajímavou informaci. Na konci jeho vodorovné osy jsou totiž k vidění zákazníci, kteří nakoupili na e-shopu více než dvacetkrát. Ti by si zasloužili daleko vyšší pozornost. Je třeba si je udržet. Ztráta tak věrných zákazníků by byla pro e-shop velkou ranou. Je třeba se snažit eliminovat veškeré důvody k jejich odchodu. Nebál bych se využít osobního přístupu pro navázání důvěrnějšího vztahu se zákazníkem.

Pro osobnější přístup je třeba tyto zákazníky lépe poznat. My se nyní na ně podíváme podrobněji:

Tabulka 2: Nejvěrnější zákazníci

recency

frequency

monetary

156

29

34 513,89

110

27

56 469,30

117

26

92 180,90

Z tabulky vidíme, že utracené částky nejsou nikterak malé. Významně se však liší. Je bezesporu dobré přihlížet i k průměrné hodnotě objednávky. Tabulka nám ale nabízí daleko důležitější informace, jedná se o dobu od posledního nákupu pro tyto konkrétní zákazníky. U všech je to více jak sto dní. To je podle dosavadního trendu celkem vysoké číslo. V tomto případě bych pro připomenutí použil právě osobní kontakt ať již přímo fyzický nebo i za pomocí telefonátu nebo e-mailu.

5.2.3        Monetary

Finanční ukazatele jsou pro většinu společností ty nejdůležitější. Na následujících grafech je zobrazena závislost počtu zákazníků na celkové útratě konkrétních zákazníků. Graf se tvarem velice blíží předešlému, ale extrém je zde ještě větší. Proto jsem ho pro lepší názornost rozdělil na dva samostatné histogramy. Jeden zobrazuje počty zákazníků s útratou pod 10 tisíc Kč a ten následující nad 10 tisíc Kč. V tomto ohledu je třeba upozornit na rozdílná měřítka na ose zobrazující počet zákazníků

Ani v tomto případě z  grafů na obrázku 8 a 9. neplynou moc pozitivní zjištění pro provozovatele e-shopu. Vidíme, že naprostá většina zákazníků utratilo za předchozí tři roky částku do 10 tisíc Kč. Při prohlédnutí histogramu na obrázku 8 je vidět, že velká část zákazníků utratila méně než 500 Kč. Obchod nabízí spousty levného zboží, ale to je většinou objednáváno ve větších objemech. Cílem obchodníka je tyto objemy maximalizovat. K tomu by dopomohlo doporučování souvisejícího nebo podobného zboží na webových stránkách e-shopu. Za tímto účelem by jistě stálo za zkoušku provést analýzu nákupních košíků.

Obrázek 8 : Histogram monetary (do 10 tisíc Kč)

Obrázek 9 : Histogram monetary (nad 10 tisíc Kč)


Tento poslední histogram vyznívá pro společnost poněkud lépe. Dost klientů má útratu v rozmezí 10 až 20 tisíc Kč. Velmi příjemným zjištěním je, že ochod má několik klientů s útratou vyšší než 100 tisíc Kč. Ty bych opět zařadil do kategorie zákazníků, kteří si zaslouží daleko osobnější přístup. Podíváme se na ně trochu podrobněji v následující tabulce:

Tabulka 3: Zákazníci s nejvyšší útratou

recency

frequency

monetary

13

9

384 816,00

83

5

154 085,20

9

6

111 628,30

208

6

100 574,60

Další čísla nevypadají také vůbec špatně. Poslední nákup zákazníci provedli v nedávné době. Navíc průměrná hodnota objednávky je velice vysoká v porovnání s nejvěrnějšími zákazníky.

RFM segmentace

Pro účely segmentace jsem opět využil grafické znázornění R, F, M dat. Jedná se o bodový graf, kde je vyjádřena závislost frekvence nakupování na době od posledního nákupu. V grafu jsou ale vyjádřeny i další dvě veličiny:

·          Počet zákazníků v tomto segmentu je vyjádřen velikostí bodů.

·          Celkovou útratu zákazníků v tomto segmentu znázorňuje barva bodů, kde barevná škála je následující:

o    zelená – nejnižší,

o    žlutá – střední,

o    červená – nejvyšší.

Pro sestrojení tohoto grafu bylo třeba si rozdělit recency a frequency na několik částí. Není ale řečeno, že jednotlivé body musí být jednotlivými segmenty. Segmenty si můžeme zvolit libovolně veliké.

Obrázek 10: RFM bodový graf

Z grafu jsou očividné některé skutečnosti, které jsme již vyčetli z předchozích histogramů. První segment se nabízejí všichni zákazníci, kteří nakoupili pouze jednou. Tento segment se budeme snažit přesvědčit, aby se na web vrátili a nakoupili znovu.

Druhý segment, který bych si z tohoto grafu vzal, je ten poměrně velký červený bod na druhé straně. Ten znamená zákazníky s více jak pěti nákupy a dobou od posledního nákupu nižší než 200 dní. Ti tvoří téměř 38% obratu internetového obchodu. Individuální přístup k těmto zákazníkům se společnosti jistě vyplatí.

Pokud narazíme na nějaký takový zajímavý segment návštěvníků, jako v tomto případě, je dobré se také snažit tento segment lépe poznat. Například shlédnout zdroje návštěvnosti. Na tyto zdroje je pak možné se více zaměřit, vynakládat vyšší finanční prostředky na ještě lepší využití těchto zdrojů nebo jinak rozvíjet související aktivity.

Možná někoho zarazí, že v histogramech nejsou zákazníci bez nákupu. V e-shopu je zaregistrováno několik zákazníků, kteří neprovedli žádný nákup. Ve skutečnosti jich je téměř 300. To by se velice projevilo na výsledcích. Já však tyto zákazníky beru pouze jako návštěvníky stránek, v této analýze je vůbec neuvažuji. Nechci tím říct, že pro provozovatele e-shopu nepředstavují jistý potenciál, avšak vyžadují úplně jiný přístup.

5.3        Určení Key Influencers

RFM skóring a potažmo RFM analýza jsou založeny na základě nejlepších zkušeností. Jedná se o veličinu, která vystihuje hodnotu zákazníka lépe než jeho samotná útrata. Jde však o metodu obecnou, aplikovatelnou v jakémkoli odvětví. Vyspělé společnosti používají daleko sofistikovanější systémy skóringování zákazníků. Nejčastěji se jedná o skórování na základě historických dat. To již bylo popsáno úvodu kapitoly 4.4.

Vzal jsem tedy zajímavá historická data o zákaznících. Pokusím se zjistit, zda jsou v nich některé zákonitosti, které by mi napomohli k tvorbě důmyslnějšího skóringu, šitého přímo na míru tomuto e-shopu. V prvním kroku si tedy musíme ujasnit, jaká data máme k dispozici a jakým způsobem je možné je získat.

Je veliká škoda, že musím vycházet pouze z transakčních dat v e-shopu. To znamená co nejlépe využít data o objednávkách, aby nám napověděla něco dalšího o našich zákaznících. Až bude dostatečné množství nasbíraných dat z webové analytiky, je možné tento použitý postup aplikovat i na tato data. Nejspíše nám naznačí další skutečnosti, na základě kterých bude možné upravit dosavadní skóringové modely.

Prvním krokem je analýza klíčových ovlivňovatelů. Key Influencers jsou hlavní složky, které mají vliv na zákazníkovo rozhodnutí. K jejich určení si nejprve musíme získaná data převést do požadovaného tvaru a následně určit, která proměnná bude závislá a která naopak nezávislá. Z těch nezávislých by nám pak za pomoci analýzy měli vyjít klíčoví ovlivňovatelé. U zjištěných influencerů bude i významnost jejich vlivu na závisle proměnnou.

5.3.1         Závisle proměnná

Nejtěžší je určit, co má vliv na význam zákazníka pro společnost. Rozhodl jsem se určit, co působí na zákazníkovo rozhodnutí, nakoupit podruhé. Závislá proměnná je skutečnost, že si zákazník objednal podruhé, nebože si neobjednal podruhé. Takže je nutné vytvořit dotaz, který při skutečnosti, že:

·          zákazník nakoupil pouze jednou, poskytne hodnotu 0,

·          pokud nakoupil minimálně dvakrát, je tato hodnota rovna 1.

5.3.2         Nezávisle proměnné

Nezávisle proměnné jsou data o první objednávce zákazníka. Mají za cíl určit, zda zákazníkovo chování při první objednávce má nějaký vliv na jeho další nakupování. Zvolil jsem tedy následující údaje:

·          čas do první objednávky,

·          cena objednávky,

·          počet různých druhů produktů objednávky,

·          celkový počet zakoupených produktů,

·          kalendářní měsíc objednávky,

·          čtvrtletí,

·          zvolený jazyk,

·          země.

Čas do první objednávky je počet dnů, které uplynuly mezi registrací zákazníka v e-shopu a jeho prvním nákupem. Pokud se tedy návštěvník registroval při provádění nákupu, je tato hodnota rovna 0. Cena objednávky je uváděna bez poštovného, balného a také bez DPH. Byla by tak velmi zkreslena místem dodání, protože e-shop zasílá zboží i do zahraničí.

Do analýzy jsem také zvolil dva příbuzné údaje. Počet různých druhů produktů objednávky jsou jednotlivé výrobky nezávislé na objednaném množství. Množství je zohledněno až v dalším údaji, kterým je celkový počet zakoupených produktů. V některých případech se tyto hodnoty od sebe diametrálně liší. Jsou totiž zákazníci, kteří si od jednoho výrobku zakoupí stovky kusů. V tomto je asi e-shop trochu výjimkou. Je to způsobeno charakterem nabízeného zboží.

Následující dva údaje spolu také souvisí. Kalendářní měsíc objednávky je podmnožinou čtvrtletí. V důsledku ale může každý z nich mít na další chování zákazníků jiný vliv.

Internetový obchod nabízí možnost volby mezi třemi jazyky. V nabídce je čeština, angličtina a němčina. Proto jsem do dat pro analýzu zahrnul i uživatelem zvolený jazyk. Zřejmě tedy bude jazyk korespondovat se zemí, kam si zákazník nechal zásilku se zbožím zaslat. Pravidlem to být rozhodně nemusí.

5.3.3         Výsledky analýzy

Databázový systém MySQL není určený pro analytické úlohy. Vzal jsem tedy data a jejich další zpracování jsem jako v případě předchozí analýzy prováděl Microsoft Excelu. Tentokrát mi však on samotný nestačil. Určení klíčových ovlivňovatelů je jednou z data miningových metod. Rozhodl jsem se proto využít doplněk Microsoft® SQL Server® 2012 Data Mining Add-ins for Microsoft® Office® 2010. Tento doplněk je navázán na Microsoft® SQL Server. Přesněji řečeno využívá jeho komponentu Analysis Services.

Zvolil jsem tedy nejjednodušší možnou cestu a provedl analýzu klíčových ovlivňovatelů s těmito výsledky:

Obrázek 11: Key Influencers

Na obrázku vidíme tři hlavní ovlivňovatele. Záměrně jsem ponechal názvy v diagramu stejné, jako jsou ve zdrojové tabulce. Lépe se tak můžeme zorientovat v kódu SQL dotazů, které jsou v přílohách této práce. Pro jistotu významy ještě připomenu. Skutečnost, zda si zákazník objedná podruhé je vyjádřena pomocí count_order. Ovlivňovatelé jsou pouze přeloženi do angličtiny. Jsou to tedy: počet produktů, jazyk a cena.

Nyní se ještě podíváme na váhy jednotlivých ovlivňovatelů:

Tabulka 4: Key Influencersa jejich významnost

Tabulka si opět zaslouží krátké vysvětlení. Zákazníci, kteří při první objednávce nakoupili v rozmezí 64 – 108 různých produktů provedli později i další objednávku. Naopak zákazníci, kteří si napoprvé objednali méně než 22 produktů, velice často již druhý nákup neprovedou. Podobně jsou zákazníci rozděleni i podle ceny, avšak pravděpodobnost je již nižší. Toto zjištění by se dalo zevšeobecnit. Pokud je první objednávka velká, je vysoká pravděpodobnost, že se zákazník na e-shop vrátí, aby si objednal další zboží.

Nakonec je tu také jistá pravděpodobnost možného druhého nákupu ovlivněná jazykem webových stránek, který si zákazník zvolil. Číslo 2 v tomto přehledu znamená angličtinu. Ještě tedy pro úplnost doplním, že 1 značí češtinu a 3 němčinu.

Pouze na základě těchto zjištěných informací není možné stanovovat nějaký další skóringový model. Je třeba se podívat na data ještě z druhé strany. Podobně jako v předchozí analýze se podíváme na četnosti jednotlivých údajů. Využijeme pro to přehled, který nám nabízí samotný Excel:

Tabulka 5: Četnosti jednotlivých hodnot

Z tabulky je možné vyčíst, že požadovaných 64 – 108 různých produktů v objednávce mělo pouze 30 zákazníků. Naopak méně než 22 produktů mělovíce jak 400 zákazníků. S cenou je to obdobné. Takže tyto veličiny se nám do skóringového modelu moc nehodí. Klientů, kteří prohlíží webové stránky obchodu v angličtině je 124. To není tak špatný výsledek. Přesto považuji celkem za zbytečné zohledňovat tuto skutečnost při skóringu zákazníků, protože význam tohoto influencera není tak vysoký.

5.3.3.1        Země doručení objednávky

Trochu pozornosti si vliv jazykové mutace stránek přece jenom zaslouží. Provozovatelé e-shopu věnují hodně pozornosti SEO optimalizaci. Ta je zaměřena hlavně na české zákazníky. Ti tvoří přes 73 % celkové návštěvnosti. Číslo u češtiny na předchozí tabulce je trochu jiné. Tento rozdíl tvoří slovenští zákazníci, kteří nepochybně prohlíží stránky v češtině. Co je ale podstatné, že 27 % zákazníků, jsou zákazníci zahraniční.

Procentuální zastoupení jednotlivých zemí, které mají zákazníci uvedené u adresy doručení, je znázorněno na následujícím grafu:

Obrázek 12: Zastoupení zemí zákazníků (mimo ČR)

Protože v úvodu práce bylo řečeno, že práce má být zaměřena i marketingově, doporučil bych provozovateli zaměřit se více na zahraniční zákazníky. Z analýzy je vidět, že se jedná o klienty s nesporným potenciálem. Například registrace národních domén trhů, na které by se chtěl management společnosti dále zaměřit, by byl jistě vhodným krokem. To s sebou nese samozřejmě spoustu dalších starostí a vynakládání dalších prostředků na rozšíření SEO aktivit.

5.3.4         Závěr analýzy

Je veliká škoda, že analýza klíčových ovlivňovatelů neposkytla více informací. Bohužel je asi stále málo dostupných dat, na které by bylo možné aplikovat data miningové metody. Doporučuji tedy za nějaký čas opět provést obdobnou analýzu. Vše potřebné je připravené. Databáze obsahuje potřebné pohledy, funkce a nové tabulky. Takže není nic jednoduššího, než data nově vyexportovat a znovu analyzovat.

6          Uplatnění nových znalostí v e-shopu

Provedené analýzy nám poskytly nové informace, které budou nyní využity v následující kapitole. Ta bude zaměřena na potřeby internetového obchodu a jeho cíle. Z těch budeme moci dále určit KPI a další nutné požadavky na vytvářený systém. Délka kapitoly v žádném případě nevypovídá o její důležitosti. Ačkoli se jedná o poměrně krátkou kapitolu, je nezbytná pro kvalitní implementaci řešení na míru.

6.1        Potřeby internetového obchodu

Nejprve je nutné se zaměřit na skutečnosti, které je nezbytné bezpodmínečně změnit, aby si e-shop upevnil své místo na trhu. Nejvýznamnější je potřeba zaměřit se více na zákazníky. Jedná se o fakt, kterým se zabývá většina této práce. Nutnost navázat důvěrnější vztah se zákazníkem. Nabírání nových zákazníků není možné do nekonečna. Zvláště u takto specifického druhu produktů, které nabízí tento obchod, dříve nebo později bude trh nových zákazníků vyčerpán.

Toho si je vědom i provozovatel e-shopu, proto se rozhodl podniknout nezbytné kroky k vytvoření řešení, které mu s tímto problémem alespoň částečně pomůže. První krok je tedy jasný. Musí své zákazníky lépe poznat. Nemá však finanční prostředky na to, aby mohl stále dokola provádět nové analýzy k důkladnému poznávání svých klientů. Na základě znalostí z předchozích analýz a dosavadního provozu e-shopu bude pro jednotlivé zákazníky vytvořen report.

Nejedná se o žádnou banální úpravu. Jde o kompletní změnu přístupu, proto ji bude doprovázet řada dílčích činností. Zajímavé bude pozorovat, jakých výsledků bude dosaženo. Je třeba si uvědomit, že se jedná o dlouhodobou záležitost. Jednoznačně neponese tato transformace plody ihned.

6.2        Cíle společnosti

Z analýz v předchozí kapitole 5, společnost vyvodila cíle, kterých chce nyní dosáhnout pro její další růst. Bylo odhaleno několik velice profitabilních zákazníků. Z tohoto důvodu chce společnost zapracovat na osobní komunikaci. To s sebou nese nutnost zákazníky lépe poznat, k čemuž snad napomůže řešení, které vznikne v průběhu této práce.

Dále se chce společnost zaměřit hlavně na zákazníky s vysokou četností nakupování. Budu se tedy snažit tuto skutečnost zohlednit při skóringu. Zákazníky s malou četností nakupování se snažit k opakované objednávce přesvědčit. To si ostatně klade za cíl většina internetových obchodů, avšak naplňování tohoto cíle není realizováno moc kvalitně. Dle mého názoru je cestou k úspěchu personalizace marketingového sdělení. To jsem ostatně již několikrát v práci zmiňoval. Snad i k tomu částečně dopomůže vytvořené CI řešení.

V neposlední řadě by se chtěla společnost více zaměřit na zahraniční klienty. Doposud byly vesměs všechny marketingové aktivity směřovány na české zákazníky. Pro zahraniční zákazníky byly vytvořeny dvě jazykové mutace stránek a tím snahy končí. Právě zahraniční klienti jsou ti, kteří provádí objemné a hodnotné objednávky. Jaké další aktivity budou v dohledné době realizovány, ještě není rozhodnuto.  

Provozovatel e-shopu chce poodhalit profil zákazníků, kteří provádí drahé objednávky. Tento cíl je dlouhodobější. Je třeba nejdříve nasbírat potřebné množství dat. Ta se sbírají v prostředí Google Analytics. Kód vkládaný na stránky byl poupraven. Nyní je nutné nějakou dobu čekat, než bude dostatek dat k analýze. Tyto analýzy tedy nebudou již součástí této práce.

6.3        Stanovení KPI

Zkratka KPI je z anglického Key Performance Indicator. U nás se můžeme setkat s překladem: klíčový ukazatel výkonnosti. Jedná se o důležité metriky vycházející z cílů společnosti. Tyto metriky vypovídají o aktivitách společnosti spojených s dosažením stanovených cílů. Podle dosahovaných hodnot management společnosti vidí, zda jsou cíle naplňovány, do jaké míry jsou uskutečňovány. Pokud sledované metriky nedosahují požadovaných hodnot, má vedení možnost přijmout patřičná opatření.

Stanovení klíčových ukazatelů výkonosti pro celý internetový obchod z části napoví i metriky, které bude dobré sledovat u jednotlivých zákazníků. KPI budou tvořeny s ohledem na aktuální stav e-shopu. Na to budou využity některé již zjištěné poznatky a další informace získané z nástroje Google Analytics.

Pro analyzovaný e-shop byl doposavad hlavním KPI návštěvnost. To bylo ostatně vidět i z výsledků RFM analýzy. Důraz byl kladen převážně na SEO optimalizaci. To dokládají i metriky webové analytiky. Jsou brány za stejné období jako předchozí analýza, to znamená od 1. 1. 2009 do 31. 12. 2011:

·          procento nových návštěv: 59,02 %,

·          míra okamžitého opuštění: 31,54 %,

·          konverzní poměr elektronického obchodu : 1,44 %.

Takové chování mělo za následek zmiňované problémy s retencí. Honba za novými návštěvníky byla tedy úspěšná jen z části. Podle hodnoty míry okamžitého opuštění je možné konstatovat, že i SEO optimalizace by mohla být zlepšena. Toto velké procento návštěvníků totiž nenašlo, co si představovalo. Výše konverzního poměru souvisí s předchozími metrikami, proto její hodnota není překvapující.

Co je třeba zlepšit na e-shopu, již bylo řečeno v předchozích kapitolách. Proto si dovolím nyní pouze vyjmenovat KPI, která pomohou monitorovat, jak je těchto cílů dosahováno:

·          průměrná hodnota objednávky,

·          četnost nakupování,

·          konverzní poměr,

·          podíl jednostránkových návštěv na celkovém počtu návštěv,

·          procentní podíl nových a vracejících se zákazníků.

6.4        Prováděné změny v internetovém obchodě

Již máme všechny potřebné informace k tomu, abychom stanovili požadavky na systém, který nám má pomoci k poznání zákazníků. Hlavní důraz je tedy kladen na reporty dat o jednotlivých zákaznících. Samotný systém internetového obchodu obsahuje základní informace o zákazníkovi:

·          kontaktní informace,

·          statistiky prodeje – celková útrata, průměrná útrata na nákup,

·          informace o jednotlivých objednávkách,

·          obsah neodeslaného nákupního košíku,

·          seznam přání,

·          informace o odběru e-mailového zpravodaje.

Nejedná se tedy o moc komplexní CRM systém. Jeho funkce jsou pouze základní. Do této sekce v administraci obchodu bude ke každému zákazníkovi doplněn zmiňovaný report. Zaměstnanci obchodu budou mít všechny potřebné informace na jednom místě a ihned, jak se lidově říká, „po ruce“. Tyto reporty budou aktualizovány každý den v době, kdy není systém internetového obchodu moc vytížen. 

Dominantním prvkem na reportu bude zákaznické skóre. Je jasné, že zaměstnanec nemá čas zdlouhavě z reportů analyzovat, jak profitabilní zákazník je. Vypočtené skóre provede práci za něho. Skóre zákazníka je vypočítáváno z analýz a cílů společnosti. Přesný vzorec bude popsán v následující kapitole.

V informacích o uživateli absolutně chybí data z webové analytiky. Ta by měla být v co nejsrozumitelnější podobě zobrazena v reportech. Nemá cenu zde vypisovat vše. Pokud bude mít společnost potřebu poznat zákazníka dopodrobna, může si data zobrazit přímo v nástroji webové analytiky. Ty ostatně mají své reporty na velice slušné úrovni. Bylo by zbytečné je bezhlavě kopírovat do systému obchodu.

V e-shopu jsou již z  minulosti nastavena nějaká pravidla, na základě kterých jsou zákazníci manuálně přiřazování do zákaznických skupin. Podle této uživatelské skupiny jsou pak zákazníkům nastavovány procentuální slevy. Tento postup mi nepřijde úplně šťastný. Doporučoval bych vytvořit skupiny nové na základě prováděných analýz nebo alespoň zákaznického skóre. Bylo by vhodné se více zamyslet nad možnými marketingovými aktivitami zaměřenými na jednotlivé klientské skupiny. Když už máme rozděleny zákazníky do segmentů podle jejich profitability a částečně i podle chování, bylo by škoda těchto segmentů nevyužít.

7          Realizace řešení

V následující části se budu věnovat popisu implementace požadovaného řešení. Nebudu se do hloubky zabývat technickou částí, spíše bude kladen důraz na možná úskalí při realizaci projektu. Jedná se hlavně o schopnosti vybraných nástrojů. Jedná se o nástroje dostupné zdarma, proto je pochopitelné, že nedokážou to, co drahá robustní řešení. 

7.1        Problém unikátního návštěvníka

Ve webové analytice je asi nejdůležitější metrikou unikátní návštěvník. Je poměrně složité takovéhoto návštěvníka určit a do budoucna to bude nejspíše stále složitější. Čím je to způsobeno? Je to způsobeno možnými zařízeními, přes která lidé přistupují na web. Takových zařízení stále přibývá. Může se tak nastat situace, že jediný uživatel navštíví sledovaný web z počítače v práci a následně ten samý den třeba ještě z počítače doma. Za měsíc ale stejný člověk navštíví naše webové stránky pomocí chytrého telefonu. Mimo to má velké množství lidí notebook, tablet PC atd. Je takřka nemožné, pokud se uživatel vždy nepřihlásí do našeho systému (např. e-shoupu), určit, že se jedná o stejnou osobu.

Situace se může ještě více zkomplikovat, pokud počítač doma používá více členů rodiny. Stane se tedy, že na stejnou stránku přistupuje z jednoho zařízení více uživatelů. Každý se bude trochu jinak chovat a následně to zkreslí další výsledky například behaviorálních segmentací. Tomu se zřejmě nedá zabránit, pokud budeme využívat pouze dat z webové analytiky.

Zde je popsáno, jak je těžké stanovit unikátního návštěvníka. Například Google Analytics se tato metrika rozšířila více až v nové verzi. Stanovení unikátního návštěvníka je pouze polovina práce. Další věc je přiřazení unikátního návštěvníka k záznamu z CRM systému.

7.2        Přiřazení návštěvníka webových stránek k CRM záznamu

Když na naše stránky přijde nový návštěvník, můžeme o něm v nástrojích webové analytiky zjistit nejrůznější údaje. Ať už se jedná o místo, odkud se připojuje, jeho operační systém, webový prohlížeč, rozlišení obrazovky a mnoho dalších údajů. V pokročilých nástrojích zjistíme například i IP adresu a přesnou cestu, jakou procházel stránky, které navštívil. Stále je to pro nás anonymní uživatel. Nikde nevidíme jeho jméno ani další osobní údaje. Abychom mohli s určitostí říci, že se jedná o konkrétního zákazníka, který u nás již v minulosti nakoupil, provedl nějakou transakci nebo se alespoň registroval, je nutné jeho přihlášení. Pak už můžeme data o něm sjednotit. Pokusím se popsat, jak taková věc probíhá.

V  Google Analytics se pro to využívají vlastní proměnné. Samotné řešení za použití Google Analytics bude ještě zmíněno.

Pokročilé nástroje umožňují sledovat celou cestu návštěvníka stránkami. Díky tomu je spárování se CRM ještě zajímavější. Nástroj SiteCatalyst každému návštěvníkovi přiřadí uživatelské ID. To je ukládáno do cookies. Na tomto principu fungují vlastně všechny nástroje webové analytiky. Pouze ty pokročilejší nám nabízí jednoduché spárování s identifikátorem v CRM.

Co se týká Yahoo Web Analytics jsou uživatelé na Internetu docela skoupí. Konzultantské společnosti si asi rády nechávají informace pro sebe, takže nevím, jak přesně probíhá přiřazování návštěvníka webových stránek k jeho CRM záznamu, ale s největší pravděpodobností půjde o stejný princip jako v případě řešení SiteCatalyst.

7.3        Google Analytics

Pro realizaci mého řešení Customer Intelligence v internetovém obchodě jsem si vybral nejrozšířenější nástroj webové analytiky Google Analytics. Důvody výběru bych shrnul do následujících několika bodů:

·          řešení je dostupné zdarma,

·          rychlý vývoj,

·          uživatelská základna.

Tento nejrozšířenější nástroj ačkoli je zdarma, je poměrně silný. Co je na něm nejsympatičtější, je jeho rychlé vylepšování. Postupně přibývají nové a nové funkce. Je možné, že časem dožene drahá komerční řešení. Jeho nespornou výhodou je obrovská uživatelská základna, která generuje mnoho návodů na lepší využití tohoto nástroje. Bohužel nabízí pouze agregovaná data, takže není možné sledovat přesně pohyb uživatele na webových stránkách.

7.3.1         Základní informace o Google Analytics

Služby Google Analytics jako samotná vznikla v březnu roku 2005. To společnost Google koupila softwarovou společnost Urchin Software Corporation. Ta provozovala a vyvíjela stejnojmenný analytický nástroj Urchin. Před tím, než společnost odkoupil Google, jednalo se o poměrně finančně náročný nástroj. Google však na podzim téhož roku ho uvolnil k bezplatnému použití. Původně bylo možné vytvoření účtu pouze na základě pozvánky od již registrovaného uživatele. Od podzimu 2006 přestal omezovat nové registrace [38].

Společnost Google tak transformovala produkt na veřejný a bezplatný online nástroj pro webovou analytiku. Dlouhou dobu nabízela společnost Google dva odlišné produkty postavené na základech Urchinu – Urchin a Google Analytics.  V nedávné době k  nim přibyl další s názvem Google Analytics Premium.

Urchin je placený software, který je nutné si nainstalovat na svůj server. O správu a aktualizace se stará sama společnost. Data o návštěvnosti jsou tak uložena na serverech společnosti a nejsou přenášena prostřednictvím Internetu. Společnosti je nasazují například pro sledování intranetu nebo stránek s choulostivými daty. To mohou být například různé webové aplikace pro internet banking apod.

Google Analytics je bezplatný nástroj provozovaný formou SaaS [8] . Jak již bylo řečeno, právě tento produkt je využíván k realizaci požadovaného CI systému.

Google Analytics Premium je placenou verzí Analytics určenou pro velké firmy. Tato verze nabízí oproti bezplatným Google Analytics důležité garance, velmi pokročilé analytické funkce a dedikovanou podporu [40].

7.3.2         Technické řešení Google Analytics

Pro sběr dat je ve webové analytice využíváno převážně těchto několik způsobů:

·          analýza logů serveru,

·          značkování stránek,

·          odposlouchávání paketů,

·          web beacons [9] ,

·          reverzní proxy [42].

Analýza logů serveru je založena na shromažďování dat na straně serveru. Využívá ho například produkt AWStats nebo již zde zmíněný Urchin. Software Urchin je hybridní a využívá také částečně značkování stránek. Technologie odposlouchávání paketů je možné realizovat kupříkladu na routeru, kde je možné rozpoznat veškeré požadavky uživatelů. Ve webové analytice se tato metoda a metoda reverzního proxy využívá jen velmi zřídka. Musí se jednat o velice specifický příklad, kde není možné využít jiného řešení.

Google Analytics používá, jako velké procento ostatních vyspělých nástrojů webové analytiky, sběr dat na straně klienta. To znamená značkování stránek. Postup při shromažďování uživatelských dat je celkem složitý proces. Celý je znázorněn na následujícím obrázku.


Obrázek 13: Princip sběru dat Google Analytics (Zdroj: [42])


Do HTML kódu každé webové stránky je třeba vložit blok napsaný v jazyce JavaScript. Nyní bude vysvětleno, bod po bodu, co se vlastně děje při načítání stránky s vloženým měřícím kódem:

1.        Uživatel vznese požadavek na webovou stránku.

2.        Webový prohlížeč si vyžádá požadované soubory z webového serveru.

3.        Požadované soubory jsou webovým serverem poslány do prohlížeče.

4.        Následně prohlížeč vykreslí webové stránky.

5.        Při vykreslování stránky narazí webový prohlížeč na JS kód vložený do stránky. Ten volá JS soubor ga.js uložený na serveru Google Analytics a vykoná ho.

6.        Server pro sledování návštěvníků vrátí zpět jedno pixelový obrázek __utm.gif, který je načten prohlížečem.

7.        S vykreslením tohoto obrázku jsou poslány sledovacímu serveru uživatelská data pro sběr požadovaných informací formou parametrů.

8.        Aby byla posílaná data kompletní, je třeba nastavit nebo obnovit cookies [10] uložená v prohlížeči.

9.        Následně se pošlou uživatelská data na webový server.

10.    Posledním krokem je samotný reporting agregovaných dat o návštěvnících.

Je ještě třeba říci, že vyjmenované body 7, 8 a 9 probíhají současně. Dříve se sledovací kód GATC [11] vkládal na konec stránky (před </body>). Před vykonáním tohoto kódu tedy byla načtena celá stránka. Mohl nastat problém, že kvůli chybě v JS v obsahu stránky již nedošlo k vykonání tohoto kódu. Nejnovější verze sledovacího kódu se vkládá do hlavičky stránky před ukončovací tag </head>. JavaScriptový kód je tak vykonán ještě před načtením celé stránky.

7.3.2.1        Parametry posílané na sledovací server

Nyní se podíváme blíže na bod 7. To znamená, že si v krátkosti popíšeme parametry, které jsou odesílány na server. Jsou to všechna důležitá data, která jsou na serveru dále zpracována. Požadavek na zobrazení obrázku v našem konkrétním případě vypadá takto:

http://www.google-analytics.com/__utm.gif?utmwv=5.2.4d&utms=4&utmn=602417809&utmhn=www.koralky-glass4u.cz&utme=8(customer*customerName)9(817*Jan%20Pavel)11(1*1)&utmcs=UTF-8&utmsr=1280x800&utmvp=1263x377&utmsc=32-bit&utmul=cs&utmje=1&utmfl=11.1%20r102&utmdt=Kor%C3%A1lky%20%7C%20koralky-glass4u.cz&utmhid=644622502&utmr=0&utmp=%2F&utmac=UA-2940523-26&utmcc=__utma%3D174472248.1843523628.1331131723.1331799816.1332612034.4%3B%2B__utmz%3D174472248.1331131723.1.1.utmcsr%3D(direct)%7Cutmccn%3D(direct)%7Cutmcmd%3D(none)%3B&utmu=DQCAAAAAAAAAAAAAAAAAg~

Tabulka 6: Přehled nejdůležitějších předávaných parametrů (Zdroj: [44])

Parametr

Popis parametru

Příklad

utmac

ID účtu

utmac=UA-1234567-12

utmcc

obsah souborů cookies

utmcc=__utma…

utmcs

kódování textu nastavené v prohlížeči

utmcs=UTF-8

utmdt

titulek stránky

utmdt=Title

utmfl

verze Flash

utmfl=9.0%20r159

utmhn

doména požadavku

utmhn=domena.cz

utmje

podpora Javy

utmje=1

utmn

náhodné číslo generované pro každý požadavek, slouží k prevenci požadavků uložených v cache paměti

utmn=2033220601

utmp

adresa načtené stránky

utmp=/index.html

utmr

odkazující zdroj

utmr=http://domena.cz/index.html?var=1

utmsc

barevná hloubka obrazovky

utmsc=24-bit

utmsr

rozlišení obrazovky

utmsr=1280x800

utmt

speciální proměnná použitá pro události nebo transakce

utmt=zakaznik

utmul

jazyk nastavený v prohlížeči

utmul=en-us

utme

rozšířitelné parametry

Hodnota je zakódována. Používá se na události a vlastní proměnné.

Parametrů je ještě celá řada. Jejich kompletní výčet je na stránkách Google Code. Poslední věc, kterou je v tomto ohledu potřeba zmínit, jsou uživatelská cookies zasílané s požadavkem. Ty jsou velice důležité, protože se používají k identifikaci návštěvníka a uchování některých dalších informací o relaci.

Tabulka 7: Přehled nejdůležitějších cookies

Cookie

Popis cookie

Příklad

__utma

unikátní ID návštěvníka

__utma=174472248.1843523628.1331131723.1331799816.1332612034.4

__utmcsr

obsahují informaci o způsobu, jakým se uživatel dostal na stránku

utmcsr=(direct)

Když známe princip zasílání dat a význam jednotlivých parametrů, nabízí se jedno zajímavé řešení. Může totiž nastat situace, kdy nám nebudou funkce Google Analytics stačit. Je možné přistoupit k poněkud náročnějšímu řešení- odchytávat si jednotlivé požadavky, parsovat je a ukládat do interní databáze. Nad ní pak provádět data mining popřípadě další operace.

7.3.3         Vlastní proměnné v Google Analytics

Jedná se poměrně jednoduchou věc s obrovským potenciálem. Je na každém, jak tuto proměnou využije. Jednoduše si „označkujeme“ návštěvníka webových stránek. Když se uživatel registruje například do e-shopu, zadá o sobě různé informace. Díky tomu můžeme označit, že se jedná o ženu nebo muže apod. Ovšem do uživatelské proměnné je možné zadat například i uživatelské jméno nebo jiný identifikátor osoby a ten pak spárovat s identifikátorem ze CRM [45], díky další velmi zajímavé funkci Pokročilé segmenty si můžeme pak zobrazit statistiky pouze takto označených návštěvníků. Když tedy použijeme jako vlastní proměnou jméno a příjmení osoby může sledovat konkrétní osoby přímo v prostředí Google Analytics. Na to ale pozor, neboť jméno a příjmení nejsou zdaleka jednoznačné identifikátory. Bude praktičtější si ukládat do uživatelské proměnné ID zákazníka a data spárovat v našem CRM nástroji.

Do uživatelské proměnné si tedy uložíme ID zákazníka z našeho internetového obchodu. Při prvním poslání této uživatelské proměnné se spáruje s jednoznačným identifikátorem cookie __utma. Od té doby již není nutné vkládat do GATC uživatelskou proměnnou. Google Analytics bude přiřazovat uživatelské ID k __utma automaticky.

V požadavku uvedeného výše jsou uživatelské proměnné schovány zde:

utme=8(customer*customerName)9(817*Jan%20Pavel)11(1*1)

Vidíme dvě uživatelské proměnné:

·          customer = 817 (jednoznačný identifikátor přihlášeného zákazníka)

·          customerName = Jan Pavel

Jediné co je třeba udělat, aby se tato data odesílala, je rozšířit GATC o následující kód:

_gaq.push(['_setCustomVar', 1, 'customer', '817', 1]);
_gaq.push(['_setCustomVar', 2, 'customerName', 'Jan Pavel', 1]);

V případě starého kódu vkládaného na konec stránky, jsou to následující dva řádky:

pageTracker._setCustomVar(1, "customer", "817", 1);
pageTracker._setCustomVar(2, "customerName", "Jan Pavel", 1);

7.3.4         Problémy spojené s řešením s využitím Google Analytics

Je až s podivem, kolik toho tento bezplatný nástroj zvládá. Bohužel, jako ostatně žádný nástroj webové analytiky, není všemocný. Hlavním problémem jsou agregovaná data. V této bezplatné verzi není možné se žádným způsobem dostat k jednotlivým záznamům. Na druhou stranu je ale třeba poznamenat, že data jsou agregována podle velkého množství dimenzí. Navíc nyní přibývají nové funkce jako například tok návštěvníků. Zde je možné, za použití pokročilých segmentů, vyčíst opravdu hodně informací o našich zákaznících.

Výpočty agregací samozřejmě zaberou nějaký čas, proto jsou data reportů ve webovém rozhraní služby zobrazována s určitým časovým odstupem. Tento fakt byl znatelný hlavně v minulosti, kdy byla zobrazována data až druhý den. Nyní se tento interval velmi zkrátil. Pro potřeby realizace této práce však bohatě postačí i data stará jeden den.

Největší úskalí pro realizaci této práce souvisí se spárováním vlastní proměnné a jednoznačným identifikátorem uloženým v cookie. Data o jednotlivých zákaznících dostáváme až od doby po definování vlastní proměnné. Velmi často by se hodilo vidět data zpětně, což není možné. Je to nejspíše také způsobeno agregací dat. To má za následek, že například nemůžeme zjistit původní zdroj návštěvy zákazníka, kolikrát navštívil obchod před prvním nákupem, nebo kolik strávil na webu času, než se odhodlal k první objednávce. Máme možnost ho sledovat až od doby jeho registrace nebo provedení prvního nákupu.

Poslední věc, v které vidím trochu obtíž, je fakt, že Google garantuje data stará maximálně dva roky. Ve skutečnosti je situace mnohem optimističtější. Z vlastní zkušenosti vím, že jsou zobrazována i data mnohem starší. Společnost Google se tím snaží vyhnout možným problémům a přenáší tak alespoň částečně zodpovědnost na provozovatele webových stránek. Je to pochopitelné, protože se jedná o obrovská kvanta dat, která by tak zbytečně shromažďoval.

7.3.5         Google Analytics API

Abychom byli schopni zobrazovat data z webové analytiky v našich reportech, je nutné je nejdříve nějak získat. V tomto případě jsou stahována pomocí Google Analytics API a následně ukládána do SQL databáze. Tento způsob jsem zvolil z několika důvodů:

·          rychlost,

·          spolehlivost,

·          práce s daty.

Rychlost načítání reportů o zákaznících by tak měla být mnohem vyšší. Dotaz do databáze na místním serveru zabere jen zlomek času oproti dotazu na servery Google Analytics. Při dotazování na servery poskytovatele služby se musí nejdříve navázat spojení s tímto vzdáleným serverem. Následně je nutné pomocí API dotazu vybrat požadovaná data. Ta jsou selektována z ohromného množství dalších dat na serveru. Z vlastní zkušenosti mohu říct, že tento dotaz může trvat i několik vteřin. To by bylo při zobrazování každého reportu neúnosné.

Benefitem tohoto řešení je i spolehlivost. Nestává se to často, ale služba může být z nějakého důvodu nedostupná. Ať už se jedná o chybu na přenosové cestě nebo u poskytovatele služby. V takovém případě by se zaměstnanci e-shopu nezobrazil žádný report s daty pocházejících z Google Analytics. Jestliže je při malém vytížení serveru načteme do SQL databáze, budou informace zobrazeny. Jediné, co se může stát, že tyto informace nebudou úplně aktuální. Právě kvůli zmiňovanému výpadku při načítání dat do databáze.

V neposlední řadě je předností tohoto řešení jednoduchá práce s daty. Když už jednou máme data v databázi, můžeme nad nimi provádět veškeré SQL dotazy. Spojovat je s ostatními tabulkami v e-shopu, agregovat apod.

7.3.5.1        Vytváření dotazu Google Analytics API

E-shop je provozován na PHP serveru, proto i načítání dat do databáze ze služby Google Analytics je realizováno v tomto skriptovacím jazyce. Napojení je velice jednoduché. Stačí si stáhnout PHP knihovnu, uložit na server a následně tento soubor s knihovnou GAPI připojit k požadovanému skriptu.

Výborným pomocníkem při tvoření dotazu je nástroj Data Feed Query Explorer na stejnojmenné webové stránce [46]. Zde si můžeme „naklikat“ požadované dimenze, metriky a další důležité informace a ihned je ukázán výstup.

Takto vytvořený dotaz již pak stačí pouze vložit do PHP skriptu. Podobně jako je vidět na následujícím kódu:


$ga = new gapi('email','password');    // Login

$ga->requestReportData(
    12345678,                              // Ids
    array('customVarValue1','date'),   // Dimensions
    array('visits'),                      // Metrics
    'visits',                              // Sort by 'visits' in descending order
    '',                                     // Filters
    '2012-01-03',                         // Start Date
    '',                                     // End Date
    1,                                      // Start Index
    1000                                    // Max results
);

V kódu jsou záměrně ponechány i komentáře, abychom měli představu, co který řádek znamená. Ze všeho nejdříve je nutné se přihlásit ke svému Google Analytics účtu. Poté vybereme ID požadovaného profilu pro náš web. Následuje výčet dimenzí a metrik. Na dalším řádku je nadefinováno, podle čeho se mají data na výstupu řadit. Pak si nově můžeme také nadefinovat filtry. Nastavíme, od kdy do kdy mají být vypisovaná data. Na posledních řádcích již pouze definujeme od kolikátého výsledku a kolik přesně jich má dotaz vrátit.

Zde uvedený příklad vypisuje uživatelskou proměnnou číslo jedna, kterou je v našem případě ID zákazníka. Další dimenzí je datum. Metrikou je počet návštěv, takže dostáváme pro jednotlivé zákazníky počty návštěv v konkrétní dny. Data jsou vypisována od března 2012. Dříve by to nedávalo smysl, protože ve sledovacím kódu GA nebyly nastaveny uživatelské proměnné. Konečné datum není nastaveno, takže je automaticky brán den, kdy je dotaz vytvořen.

7.4        Tvorba zákaznického skóre

Původním záměrem bylo vytvoření jednotného zákaznického skóre. Při realizaci byla zjištěna vlastnost Google Analytics, popsaná v kapitole 7.3.4. Jde o fakt, že Google Analytics po spárování uživatelské proměnné a jednoznačné cookie identifikující zákazníka, neposkytuje data zpětně. Bohužel se k jednoznačnému identifikátoru není možné v nástroji nijak dostat, nabízí pouze agregovaná data.  Takže spárování mimo nástroj také není možné.

Díky této skutečnosti jsem byl nucen prvotní plán trochu poupravit. Při výpočtu skóre měly být použity, jak metriky pocházející z transakčních dat e-shopu, tak metriky webové analytiky. S ohledem na to, že za dobu sbírání dat s nastavenými uživatelskými proměnnými nebylo nashromážděno dostatek dat, informace z Google Analytics jsou u malé hrstky zákazníků. Rozhodl jsem se realizovat dvě dílčí skóre:

·          RFM skóre,

·          E-loyalty skóre.

O RFM skóre toho v práci bylo již napsáno dost. Složení tohoto skóre je jasné. Otázkou zůstává skórovací funkce a skórovací model, pomocí kterých stanovíme jednorozměrné RFM skóre. E-loyalty skóre má za úkol co nejlépe vyjádřit věrnost zákazníků. Bude vycházet pouze z dat, získaných pomocí nástroje Google Analytics. Zde bude třeba kromě skórovacího modelu stanovit také metriky, které budou do modelu vstupovat.

7.4.1         Skórovací funkce

Princip bodování je založen na automatické kategorizaci jednotlivých složek, vstupujících do výpočtu požadovaného skóre. Není prováděná ruční kategorizace, jako v případě vytváření RFM segmentů při prováděné analýze. Řešením je rozdělení hodnot do kvantilů. V tomto případě jsou zvoleny decily. To znamená, že jsou seřazené hodnoty rozděleny do 10 stejně velkých skupin. Každá obsahuje 10 % hodnot. Každému decilu je pak přiřazeno bodové ohodnocení. To znamená, že skóre pro jednotlivé složky může nabývat hodnot 1 až 10. Tento způsob má výhodu v tom, že je možné ho provést pro všechny složky stejně.

Ne všechny hodnoty lze jednoduše rozdělit do kvantilů. Při řešení tohoto konkrétního skóringu jsem narazil na problém s hodnotami četnosti nakupování (frequency). Jelikož velké procento zákazníků nakoupilo pouze jednou, byly výsledky velice zkreslené. Zákazníci s jedním nákupem totiž měli bodové ohodnocení 1 až 4. Záleželo pouze na pořadí, v jakém byli vypisování SQL serverem. S ohledem na tuto skutečnost jsem se rozhodl přiřazovat bodové ohodnocení shodné s počtem provedených nákupů. Samozřejmě je nutné zachovat rozsah hodnot shodný s ostatními složkami, to znamená 1 až 10. Z tohoto důvodu byly hodnoty vyšší než 10 ohodnoceny skórem 10.

7.4.2         Skórovací modely

Když máme kvantifikované jednotlivé složky, je třeba rozhodnout, jakým způsobem získat celková skóre. Vzhledem k tomu, že nám jde pouze o stanovení čísla vyjadřujícího hodnotu a loajalitu zákazníků, není třeba stanovovat žádné složité podmínky pro rozhodovací stromy na rozčlenění zákazníků. Musíme stanovit váhy jednotlivých složek.

Váhy budou stanoveny na základě dosavadních zjištění a vymezených KPI obchodu. Velice by pomohla i data z webové analytiky, ale ta jsou pouze pro celý e-shop. Pro jednotlivé zákazníky bude dostatek dat pro analýzu až za nějakou dobu. Bylo by dobré pak skórovací modely poupravit podle zjištěných skutečností. Úpravy podle potřeb společnosti se ostatně předpokládá u každého správného skóringového modelu.

7.4.2.1        Model pro RFM skórování

RFM skóre je koncipováno tak, aby vypovídalo o hodnotě zákazníka při stejných vahách všech složek. Náš e-shop si dává za cíl zvýšit počet opakovaných nákupů. Proto pro nás bude mít vyšší hodnotu zákazník, který často nakupuje. Rozhodl jsem se tedy poupravit váhy bodových ohodnocení:

·          recency  – 30 %,

·          frequency – 40 %,

·          monetary – 30 %.

Výsledné skóre pak bude vypadat takto:

Je třeba si dát pozor na hodnotu recency. Při stanovování bodového ohodnocení je nutné si uvědomit, že zde znamená nižší hodnota lepší výsledek. Proto tedy ve vzorci odčítáme od 10. Dále je ve vzorci obsažen přepočet na stobodovou stupnici. Skóre tak může nabývat hodnot 0 až 100, přičemž 100 bodů dosáhne zákazník v případě, že ve všech třech složkách je mezi 10 % nejvýše postavenými hodnotami.

7.4.2.2        E-loyalty skóre

Skóre vyjadřující loajalitu zákazníků bude také inspirováno RFM skórováním, jak již bylo naznačeno v teoretické části práce. Bude částečně upraveno. Použiji tedy tyto čtyři složky s následujícími vahami:

·          věrnost zákazníka – 30 %,

·          aktuálnost zákazníka – 20 %,

·          hloubka návštěvy – 25 %,

·          délka návštěvy – 25 %.

Věrnost zákazníka je zde nejdůležitější metrikou. Cílem e-shopu je, aby se na něj zákazníci častěji vraceli. Budou tak mít možnost shlédnout nové produkty, které zde často přibývají. Aktuálnost návštěvy není v tomto kontextu tak důležitá, protože někteří B2B zákazníci prostě navštěvují internetový obchod pravidelně ve stejných intervalech, které nemusí být zas až tak krátké. Hloubka návštěvy a délka návštěvy spolu poměrně úzce souvisí, proto mají také v modelu nastavenu stejnou váhu.

U aktuálnosti je ještě třeba zmínit fakt, že se jedná o obdobu hodnoty recency v předchozím modelu, proto je opět třeba odečíst její vypočtené skóre od 10. Váhy jsou opět nastaveny tak, aby výsledné skóre nabývalo maximální hodnoty 100 bodů.

7.5        Popis praktického řešení skórování

Systém elektronického obchodu je založen na open source řešení Magento. Jedná se o systém využívající nejrozšířenější konfigurace webového serveru. Běží na skriptovacím programovacím jazyku PHP a data jsou ukládána do databázového systému MySQL. Díky tomu může, přestože je poměrně náročný na systémové prostředky, být provozován na běžném webovém hostingu. Tyto technologie bohužel nejsou připravené na činnosti spojené s vytvářením CI systému.

Databázový server MySQL není navržen na analytické úlohy ani jednoduché možnosti reportingu. Systémy pro řízení báze dat od společností Oracle nebo Microsoft obsahují analytické funkce. Pro mé potřeby by byly velice užitečné funkce jako RANK, NTILE apod. Ty bohužel MySQL neobsahuje. Přesto jsem chtěl co největší část CI aplikace vytvořit právě na straně databázového serveru. Bylo proto nutné se s tímto problémem nějak vypořádat.

Od verze 5, obsahuje MySQL možnost tvorby uložených procedur. V originále označované jako stored procedure. Jedná se vlastně o schopnost vytvářet si v databázovém systému vlastní procedury a funkce. To mi umožnilo přesně to, co jsem potřeboval. Doplnil jsem chybějící funkce nad databází sám. Nejedná se samozřejmě o přesné ekvivalenty funkcí známých z pokročilých databázových systémů, ale plní svou úlohu. Sdílené procedury a funkce umožňují přenést většinu výpočetní logiky aplikace na databázový server a lépe tak škálovat výkon informačních systémů [47].

Zvolené řešení se může jevit jako zbytečně komplikované. Věřím, že skórování zákazníků díky němu bude rychlejší. Některé vytvořené funkce je možné si prohlédnout v přílohách této práce.

E-shop založený na Magentu mi způsobilo při implementaci skórování a vlastně i při mnoha dalších činnostech s databází další problém. Jeho vývoj je poměrně živelný. Internetový obchod je bohužel založen na starší verzi, ke které již není možné nalézt ER diagram [12] . Při práci jsem využíval diagramy jiných verzí, které se od použité struktury databáze trochu liší. Z toho důvodu bylo někdy nutné se snažit poznat strukturu pouze z vytvořených tabulek. To není nemožné, ale jedná se o velice zdlouhavý proces. Systém obsahuje přes 200 tabulek, proto některé dotazy byly velice dlouhé. Během tvorby jsem proto hojně využíval pohledů nad tabulkami. Dotazy mi pak připadají jednodušeji čitelné.

7.6        Význam zákaznického skóre

Výběr vhodného skóringu nebyl jednoduchý. Nakonec byl použit RFM skóring a jeho modifikace pro použití s daty pocházející z webové analytiky. Jedná se o ověřený model, který má vysokou vypovídací hodnotu.

Zvolená skóre vypovídají o významu zákazníka pro společnost. RFM skóre se snaží vystihnout jeho hodnotu a E-loyalty skóre má za cíl vypovídat o věrnosti zákazníka a částečně vztahu klienta ke společnosti.

Vybrané skóringy mají zjednodušit rozhodovaní při komunikaci se zákazníkem. Na základě bodové škály mají zaměstnanci společnosti možnost se rozhodnout, jak hodně se budou zákazníkovi věnovat. Záměrně nechci předepisovat přesná pravidla, jakými se mají zaměstnanci řídit. Přesně neznám dostupné kapacity společnosti. Je možné, že se tyto kapacity také budou v průběhu času měnit. Připomenu tedy jenom, že rozsah skóre je 0 – 100. Záleží proto na managementu, jaká pravidla na základě tohoto údaje stanoví.

Navíc jsem skóre doplnil ještě o pořadí zákazníka. Ti jsou tedy seřazeni podobně jako při vyhlašování výsledků sportovního závodu. Uvidí-li zaměstnanec technické podpory e-shopu, že zákazník je prvním, či druhým nejvýznamnějším zákazníkem z celkového počtu, měl by se mu snažit co nejlépe poradit s technickými problémy nebo pomoci s výběrem vhodného zboží. Společnost provozující internetový obchod není nikterak veliká. Ztráta takto významného zákazníka by měla pro společnost tohoto rozsahu nedozírné následky, protože tito klienti mají podíl na příjmech společnosti v řádu procent.

7.7        Uživatelský report

Vytvořit kvalitní report je poměrně složitá záležitost. Tento musí obsahovat všechna potřebná fakta a ukazatele. Zároveň by měl být přehledný a uživatelsky přívětivý. Měl by poskytnout požadované informace rychle a srozumitelným způsobem. Jednotliví pracovníci vyžadují různé reporty. Není dobré vytvářet souhrnné reporty pro celou společnost a předpokládat, že si každý pracovník sám vybere požadované informace.

Největším oříškem je zvolit správný kompromis mezi počtem dat na reportu a jeho přehledností. Mnohdy si za to mohou samotní zaměstnanci. Nyní mám na mysli manažery, kteří by nejraději věděli všechno, co se ve firmě děje. Diktují si stále nové ukazatele, které by chtěli mít na reportech, až se v nich nevyznají ani oni sami.

Vyplatí se tedy se před vytvářením reportu zamyslet, co a v jaké formě, zde vlastně chceme mít. V případě této práce se jedná o report, který vypovídá o jednom konkrétním zákazníkovi. Proto by měla být na první pohled viditelná skóre zákazníků. Samotné číslo nám mnoho neřekne, přestože víme, že jeho maximální hodnota je 100. Nabízí se tedy, zobrazit i srovnání s maximálním dosaženým skórem. Je-li podle výše skóre zákazník zařazen do určité kategorie, pak tato informace patří právě sem.

Dále budou na reportu dílčí metriky. Hlavně metriky webové analytiky, protože informace o objednávkách již každý internetový obchod má jako svou součást. I když o přehlednosti těchto informací by se dalo polemizovat.

7.7.1         Google Chart Tools

Pro grafické zobrazení výsledků v reportech jsem zvolil řešení Google Chart Tools. S tímto nástrojem je možné jednoduše vytvořit působivě vypadající grafy. Ty jsou generovány na základě krátkého javascriptového kódu. Toto řešení nabízí několik výhod:

·          několik druhů grafů,

·          grafy jsou přizpůsobitelné,

·          jsou generované za pomocí HTML5, SVG technologií,

·          nástroj je zcela zdarma,

·          nabízí možnost tvorby dashboardů,

·          grafy se mohou překreslovat v reálném čase [49].

7.7.2         Ukázka uživatelského reportu

Na obrázku 14 je zobrazen konkrétní uživatelský report. Jde o snímek obrazovky z nasazeného systému. Jsou zobrazena skutečná data jednoho ze zákazníků internetového obchodu. Citlivé informace jsou rozmazány, aby nedošlo k úniku soukromých údajů provozovatele obchodu. V reportu jsou všechny informace důkladně popsány, proto není třeba ho nějak složitě popisovat.

Obrázek 14: Report zákaznických dat


8          Závěr

Práce se zabývala prostředky pro poznání zákazníků souhrnně označovanými Customer Intelligence. Nebylo použito žádné specializované řešení z důvodů jeho finanční nedostupnosti. Pro analýzy byly využity běžné dostupné nástroje. Při programování realizovaného řešení na míru internetovému obchodu byly upřednostňovány volně dostupných služby. Díky tomu vznikl jednoduchý systém pro podporu rozhodování, který si může dovolit i společnost takto malého rozsahu.

8.1        Vyhodnocení cílů práce

Hlavním cílem práce bylo, z dostupných systémů vytvořit CI řešení, co nejlépe vyhovující potřebám konkrétní společnosti zabývající se internetovým prodejem.  Pro splnění tohoto cíle bylo nezbytné splnit také několik cílů dílčích:

·        Abych byl schopný definovat, co je třeba k vytvoření vlastního CI řešení, musel jsem nejdříve vymezit úlohu takového systému v organizaci. To jsem učinil v kapitole 3. Konkrétní funkčnost řešení jsem shrnul v kapitole 6. Je patrné, že stanovování požadavků bylo rozděleno na čistě teoretickou část a část vyžadující již konkrétní poznatky.

·     V kapitole 5 jsem provedl analýzy, které byly základem pro implementaci CI systému. RFM analýza poskytla cenné informace o některých zajímavých segmentech zákazníků podle jejich hodnoty. Key Influencers analýza nám nastínila, co má vliv na to, aby zákazník provedl druhou objednávku.

·    Technické možnosti dílčích systémů, ze kterých se skládá komplexní řešení, jsou popsány v úvodní části kapitoly 7. Jsou zde podrobně probrána technická omezení při samotné realizaci. Nejzávažnější problémy spojená s implementací nástroje Google Analytics jsou popsány v kapitole 7.3.4.

·      Realizace požadovaného systému na míru konkrétnímu internetovému obchodu je popsána ve zbývající části kapitoly 7.

·    Nasazení systému do reálného provozu je posledním dílčím cílem. Ten není v práci nijak důkladně popsán. Je pouze ukázán náhled tohoto systému.

Všechny vytyčené cíle práce byly splněny.


 

Tabulka 8: Shrnutí splnění dílčích cílů

Cíl

Naplnění cíle

potřeby k vytvoření vlastního CI řešení

kapitoly 3 a 6

provedení analýz

kapitola 5

technické možnosti dílčích systémů

kapitola 7 (úvodní část)

návrh a realizace systému

kapitola 7

nasazení systém do reálného provozu

kapitola 7.7

8.2        Identifikace dalších možností rozvoje

Další možný rozvoj spatřuji v důkladnějším zapojení webové analytiky při poznávání chování zákazníka. Jak bylo zmíněno, data o jednotlivých návštěvách zákazníků jsou známa až od změny měřícího kódu Google Analytics. V důsledku toho bylo těchto dat málo pro realizaci data miningových analýz. Bylo by proto zajímavé, se k tomuto projektu za nějaký čas vrátit a zkusit z dat vytěžit další cenné informace.

Co se týká rozvoje CI sytému, je možné jeho další použití díky tomu, že implementace byla realizována na open source systému internetového obchodu. Toto řešení je tvořené pro potřeby konkrétního internetového prodejce, proto je nutná jeho modifikace. Pokud se k tomuto někdo rozhodne, bude mít v mnohém ulehčenou práci. Při úpravách je možné využít zde popsané postupy jako návod.

Mám-li určit jak je možné navázat na mou diplomovou práci případnými dalšími pracemi, které by měli jít do více do hloubky. Doporučoval bych se soustředit na tvorbu sofistikovanějších skóringových modelů například za pomocí regresních metod. V tomto případě tedy nejspíše využití logistické regrese. Předem upozorňuji, že je na tyto praktiky třeba značného kvanta dat. Tudíž je potřeba nalézt e-shop většího rozsahu.

Terminologický slovník

Termín

Zkratka

Význam [zdroj]

Application Programming Interface

API

Programové rozhraní aplikací pro snadnější výměnu dat mezi aplikacemi. [vlastní definice autora]

Business Intelligence

BI

Sada procesů, aplikací a technologií, jejichž cílem je účinně a účelně podporovat rozhodovací procesy ve firmě. Podporují analytické a plánovací činnosti podniků a organizací a jsou postaveny na principech multidimenzionálních pohledů na podniková data. [50]

Business to Business

B2B

Obchodní vztahy a vzájemná komunikace mezi dvěma společnostmi. [34]

Buzzword

 

Jakýkoliv nový, radikální nebo revoluční termín, který vešel v obecnou laickou známost [16]

Cookies

 

Malé textové informace, které se dají uložit na počítači klienta. Z bezpečnostních důvodů je ukládání všech souborů na klientovi zakázáno, cookies jsou jedinou omezenou výjimkou. [43]

Customer Intelligence

CI

Proces sběru a analyzování informací o zákaznících, jejich vlastnostech a činnostech, sloužící k vybudování pevnějších a efektivnějších vztahů se zákazníky a ke zlepšení strategického rozhodování. [51]

Customer Relationship Management

CRM

Systém pro integraci a koordinaci marketingu, prodeje a zákaznického servisu v jednotný a ucelený přístup k péči o každého konkrétního zákazníka. [52]

Data Mining

 

Proces dolování a analýza dat za účelem získávání užitečných informací z velkých objemů dat. [vlastní definice autora]

Early adopters

 

Vizionáři a nadšení uživatelé nových technologií a produktů. Mají přehled a chápou hodnotu služby/produktu dříve než ji pochopí běžný uživatel. [22]

Enterprise Resource Planning

ERP

Informační systém společnosti, určený pro plánování podnikových zdrojů. [vlastní definice autora]

Entity Relationship diagramy

ERD

Diagram popisující statickou strukturu databáze. Pro popis toku dat a podobné věci slouží například některé podmnožiny UML. [48]

Google Analytics

GA

Služba webové analytiky od společnosti Google. [vlastní definice autora]

Google Analytics Tracking Code

GATC

JavaScriptový kód vkládaný do webové stránky pro možný sběr dat o návštěvnících. [vlastní definice autora]

Key Performance

KPI

Klíčové ukazatele výkonnosti [vlastní definice autora]

Pay Per Click

PPC

Model platby za internetovou reklamu spočívající v platbě za prokliky (resp. kliknutí na reklamu). [24]

Search Engine Optimization

SEO

Optimalizace pro internetové vyhledávače je řada operací, jejichž účelem je zlepšení pozic ve výsledcích vyhledávání ve fulltextových vyhledávačích. [23]

Software as a Service

SaaS

Poskytování softwaru formou služby. SaaS aplikace nejsou instalovány na lokálních serverech firmy nebo uživatele, ale běží na serverech poskytovatele služby. Uživatelé k nim přistupují přes Internet. [39]

Web beacons

 

Elektronické obrázky, které mohou být užity pro rozpoznání souborů cookies v počítači. Web beacons různými způsoby pomáhají měřit efektivitu stránek a reklam. [41]

Webová analytika

 

Měření, sběr, sledování a vyhodnocování internetových dat za účelem porozumění a optimalizace webu. [13]

 

 

Přehled bibliografických zdrojů

1.        SPILKOVÁ, Jana. Informační společnost: Informační a komunikační technologie v podnikatelském sektoru za rok 2009. In: Český statistický úřad[online]. Praha: Český statistický úřad, 8.2.2010 [cit. 2012-01-16]. Dostupné z: http://www.czso.cz/csu/2009edicniplan.nsf/t/C8003215A3/$File/970209.pdf

2.        SPILKOVÁ, Jana. Informační společnost: Informační a komunikační technologie v podnikatelském sektoru za rok 2010. In: Český statistický úřad[online]. Praha: Český statistický úřad, 8.12.2010 [cit. 2012-01-16]. Dostupné z: http://www.czso.cz/csu/2010edicniplan.nsf/t/45002BC1E6/$File/970210.pdf

3.        SPILKOVÁ, Jana. Informační společnost: Informační a komunikační technologie v podnikatelském sektoru za rok 2011. In: Český statistický úřad[online]. Praha: Český statistický úřad, 5.12.2011 [cit. 2012-01-16]. Dostupné z: http://www.czso.cz/csu/2011edicniplan.nsf/t/64004B3973/$File/970211.pdf

4.        TEPPER, Nikola. Customer Intelligence (v internetovém obchodu). Praha, 2004. Diplomová práce. Vysoká škola ekonomická v Praze, Fakulta informatiky a statistiky. Vedoucí práce doc. Ing. Jan Pour, CSc.

5.        NEBŘENSKÝ, Aleš. Analytické CRM v bankovnictví. Praha, 2008. Diplomová práce. Vysoká škola ekonomická v Praze, Fakulta informatiky a statistiky. Vedoucí práce doc. Ing. Jan Pour, CSc.

6.        JAŠEK, Pavel. Webová analytika v malých a středních firmách. Praha, 2011. Diplomová práce. Vysoká škola ekonomická v Praze, Fakulta informatiky a statistiky. Vedoucí práce doc. Ing. Ota Novotný, Ph.D.

7.        HRADCOVÁ, Monika. Obchodní úspěšnost eshopu a její hodnocení. Praha, 2009. Diplomová práce. Vysoká škola ekonomická v Praze, Fakulta podnikohospodářská. Vedoucí práce Ing. Libuše Kališová, CSc.

8.        HNÍZDIL, Jan. Praktické využití Web Intelligence. Praha, 2011. Diplomová práce. Vysoká škola ekonomická v Praze, Fakulta informatiky a statistiky. Vedoucí práce Ing. David Slánský, Ph.D.

9.        ČECH, Martin. Služba Google Analytics a její využití pro potřeby analýzy a optimalizace webových stránek. Brno, 2010. Diplomová práce. Masarykova univerzita, Filosofická fakulta, Ústav české literatury a knihovnictví. Vedoucí práce Mgr. Martin Krčál, DiS.

10.    MACHALOVÁ, Lucie. Hodnota zákazníka v letecké spolecnosti. Praha, 2006. Diplomová práce. Vysoká škola ekonomická v Praze, Fakulta mezinárodních vztahu. Vedoucí práce prof. Ing. Bohumil Král, CSc.

11.    CHIU, Chui-Yu, Zhi-Ping LIN, Po-Chia CHEN a I-Ting KUO. Applying RFM Model to Evaluate the E-loyalty for Information-based Website. International Journal of Electronic Business Management. 2009, roč. 7, č. 4, s. 278-285. ISSN 17282047.

12.    NOVOTNÝ, Ota; POUR, Jan; SLÁNSKÝ, David. Business inteligence : jak využít bohatství ve vašich datech. 1. vyd. Praha: Grada, 2005. 254 s. ISBN 80-247-1094-3.

13.    Webová analytika. In Wikipedia : the free encyclopedia [online]. St. Petersburg (Florida) : Wikipedia Foundation, 17. 9. 2009, last modified on 30. 4. 2011 [cit. 2012-01-16]. Dostupné z: http://cs.wikipedia.org/wiki/Webová_analytika.

14.    BURBY, Jason; ATCHISON, Shane. Actionable web analytics : using data to make smart busines decisions. Indianapolis : Wiley Publishing, 2007. 256 s. ISBN 978-0-470-12474-1.

15.    KAUSHIK, Avinash. Webová analytika 2.0: Kompletní průvodce analýzami návštěvnosti. Brno: Computer Press, a.s., 2011. ISBN 978-80-251-2964-7.

16.    Buzzword - co to znamená?. In: Monster.cz [online]. 2011 [cit. 2012-01-16]. Dostupné z: http://rady-a-tipy.monster.cz/profesni-vyvoj/leaders-voice/buzzword-co-to-znamená/article.aspx

17.    GÁLA, Libor; POUR, Jan; TOMAN, Prokop. Podniková informatika : Počítačové aplikace v podnikové a mezipodnikové praxi, technologie informačních systémů, řízení a rozvoj podnikové informatiky. Praha : Grada Publishing, 2006. 484 s. ISBN 80-247-1278-4.

18.    Web behavior boosts customer intelligence. In: CXO Europe: Business Technology News for C-level Executives [online]. 2012 [cit. 2012-01-17]. Dostupné z: http://www.cxo.eu.com/article/Web-behavior-boosts-customer-intelligence/

19.    DYCHÉ, Jill. The CRM Handbook: A Business Guide to Customer Relationship Management. Boston: Addison - Wesley Professional, 2002, 307 s. ISBN 0-201-73062-6.

20.    BRÁZDA, Jiří. Co je zákaznická analytika?. In: Optimics – měření a optimalizace webu [online]. 28.11.2011 [cit. 2012-01-17]. Dostupné z: http://www.optimics.cz/blog/t/zakaznicka-analytika

21.    CRM. In Wikipedia : the free encyclopedia [online]. St. Petersburg (Florida) : Wikipedia Foundation, 6. 6. 2006, last modified on 13. 8. 2010 [cit. 2012-01-15]. Dostupné z: http://cs.wikipedia.org/wiki/CRM.

22.    SZÖKE, Igor. Slovníček Lean(ého) Startupu - Early Adopters a Segmentace trhu. In: Leaný blog: Blog o lean, výuce, čtení a podnikání[online]. 2011-12-03 [cit. 2012-01-15]. Dostupné z: http://blog.igor.szoke.cz/2011/12/slovnicek-leaneho-startupu-early.html

23.    SEO optimalizace. StaWEBnice.com tvorba www stránek, copywriting a SEO [online]. 2011 [cit. 2012-02-29]. Dostupné z: http://www.stawebnice.com/seo

24.    Adaptic - Co je PPC. Adaptic - Webdesign, tvorba www [online]. © 2005–2012 [cit. 2012-02-29]. Dostupné z: http://www.adaptic.cz/znalosti/slovnicek/ppc/

25.    MORÁVEK, Daniel. Udržet zákazníka v e-shopu vyjde levněji, než si "pořizovat" nového. In: Podnikatel.cz: informace pro váš business a podnikání (zákony, daně, finance, státní správa) [online]. 14.3.2011 [cit. 2012-02-11]. Dostupné z: http://www.podnikatel.cz/clanky/opakovany-nakup-e-shop-rady-tipy/

26.    MOTH, David. Upselling is 20 times more effective than cross-selling online. In: Econsultancy: Become a smarter digital marketer[online]. 10.1.2012 [cit. 2012-02-13]. Dostupné z: http://econsultancy.com/uk/blog/8632-up-selling-is-20-times-more-effective-than-cross-selling-online?utm_medium=twitter&utm_source=twitterfeed

27.    BRÁZDA, Jiří. Email ve službách retence. OPTIMICS S.R.O. SlideShare: Upload & Share PowerPoint presentations and documents [online]. 30.11.2011 [cit. 2012-03-05]. Dostupné z: http://www.slideshare.net/optimics/email-ve-sluzbach-retence

28.    BRÁZDA, Jiří. Analytics + Optimization = Data-driven website. In: SlideShare: Upload & Share PowerPoint presentations and documents [online]. 24.9.2010 [cit. 2012-02-20]. Dostupné z: http://www.slideshare.net/optimics/analytics-optimization-data-driven-website

29.    Hodnota zákazníků: Analýzy a Data Mining. In: Data mining, Analýzy dat, Marketingové analýzy - Data Mind s.r.o. [online]. © 2009-2011 [cit. 2012-02-18]. Dostupné z: http://www.datamind.cz/hodnota-zakaznika.html

30.    LEJNAROVÁ, Šárka. Hodnota zákazníka. Adastra Czech [online]. 2009 [cit. 2012-03-05]. Dostupné z: http://www.adastra.cz/815_hodnota-zakaznika.aspx

31.    BEHÚN, Dalibor. Gary Bencivenga – Paretovo pravidlo 80/20. In: Proofreading.cz[online]. 9.7.2008 [cit. 2012-02-20]. Dostupné z: http://www.proofreading.cz/gary-bencivenga-paretovo-pravidlo-8020

32.    CHLEBOVSKÝ, Vít. CRM: řízení vztahů se zákazníky. Vyd. 1. Brno: Computer Press, 2005, 190 s. ISBN 80-251-0798-1.

33.    RUD, Olivia Parr. Data mining cookbook: modeling data for marketing, risk and customer relationship management. New York: Wiley, c2001, 367 s. ISBN 04-713-8564-6.

34.    B2B. In: Adaptic: Webdesign, tvorba www [online]. © 2005–2012 [cit. 2012-02-20]. Dostupné z: http://www.adaptic.cz/znalosti/slovnicek/b2b/

35.    SIEBER, Patrik. Analýza nákladů a přínosů. In: Strukturální fondy EU[online]. květen 2004 [cit. 2012-02-20]. Dostupné z: http://www.strukturalni-fondy.cz/Upload/Rizeni-fondu-EU/Metodika-zpracovani-Analyzy-nakladu-a-prinosu

36.    BÍNOVÁ, Dagmar. Aplikační skóring: nástroj pro hodnocení nových klientů. Business Intelligence Magazine [online]. 2009, č. 1, s. 2-6 [cit. 2012-03-20]. Dostupné z: http://www.adastra.cz/file.aspx?id=241

37.    HÁVA, Ondřej. RFM skórování. IT Systems. Brno: CCB s.r.o, 2008, č. 5, s. 2. ISSN 1802-002X. Dostupné z: http://www.acrea.cz/files/marketing/itsystems_052008.pdf

38.    What is Google Analytics – ivantage explains. In: SEO services, PPC management and Web analytics consulting by ivantage [online]. © 2012 [cit. 2012-03-10]. Dostupné z: http://www.ivantage.co.uk/web-analytics/what-is-google-analytics.htm

39.    KIMR, David. SaaS: kompletní outsourcing IS. In: Unicorn Systems: Stavíme moderní a rozsáhlé informační systémy [online]. 26.09.2011 [cit. 2012-03-20]. Dostupné z: http://www.unicornsystems.eu/cz/press/clanky/saas-kompletni-outsourcing-is.html

40.    JAŠEK, Pavel. Google spouští Analytics Premium. In: Dobrý web: Pomůžeme vám k úspěchu v online světě [online]. 29.9.2011 [cit. 2012-03-20]. Dostupné z: http://blog.dobryweb.cz/google-spousti-analytics-premium

41.    Bezpečnost při online obchodování. In: Dell Česká republika[online]. © 1999-2012 [cit. 2012-03-20]. Dostupné z: http://www1.euro.dell.com/content/topics/topic.aspx/emea/topics/footer/privacy?c=cz&l=cs&cs=czdhs1

42.    ZUMSTEIN, Darius. 10. Internationale Tagung Wirtschaftsinformatik, Zürich, 16.-18.02.2011: Functionality of Web Analytics. In: Information Systems [online]. University of Fribourg, 2011 [cit. 2012-03-20]. Dostupné z: http://diuf.unifr.ch/main/is/web_analytics

43.    JANKOVSKÝ, Dušan. Cookies. In: JANKOVSKÝ, Dušan. Jak psát web, návod na html stránky [online]. 2012 [cit. 2012-03-20]. ISSN: 1801-0458. Dostupné z: http://www.jakpsatweb.cz/enc/cookies.html

44.    Troubleshooting the Tracking Code. In: Google Code [online]. 2012 [cit. 2012-03-20]. Dostupné z: http://code.google.com/intl/cs/apis/analytics/docs/tracking/gaTrackingTroubleshooting.html

45.    GRECO, Adam. Web Analytics Demystified [online]. 2010-05-10 [cit. 2011-05-05]. CRM Integration #1 – Passing Web Analytics Data to CRM. Dostupné z WWW: http://adam.webanalyticsdemystified.com/2010/05/10/crm-integration-passing-web-analytics-data-to-crm/

46.    Data Feed Query Explorer. GOOGLE INC. Google Code [online]. 2012 [cit. 2012-04-10]. Dostupné z: http://code.google.com/intl/cs-CZ/apis/analytics/docs/gdata/gdataExplorer.html

47.    ŠUSTEK, Martin. Uložené procedury a triggery v MySQL. In: Martin Šustek: Jenom slova nestačí [online]. 25.4.2008 [cit. 2012-04-01]. Dostupné z: http://www.martin-sustek.cz/ulozene-procedury-a-triggery-v-mysql/

48.    ŽÁK, Karel. Modelování databází. In: Root.cz: informace nejen ze světa Linuxu [online]. 3.4.2002 [cit. 2012-04-01]. Dostupné z: http://www.root.cz/clanky/modelovani-databazi/

49.    Google Chart Tools. GOOGLE, Inc. Google Developers [online]. 2012 [cit. 2012-04-11]. Dostupné z: https://developers.google.com/chart/

50.    NOVOTNÝ, Ota a kol. Digitální cesta k prosperitě. Praha: Professional Publishing, 2011. ISBN 978-80-7431-047-8.

51.    Customer intelligence. In: Wikipedia: the free encyclopedia[online]. San Francisco (CA): Wikimedia Foundation, 2012-01-11 [cit. 2012-04-01]. Dostupné z: http://en.wikipedia.org/wiki/Customer_intelligence

52.    CHLEBOVSKÝ, Vít. CRM Řízení vztahů se zákazníky: Jak úspěšně vytvořit, oživit a udržovat moderní koncepci CRM. Brno : Computer Press, 2006. str. 196. ISBN: 80-251-0798-1.

Seznam obrázků

Obrázek 1: Procenta podniků používající CRM (Zdroj: [1], [2], [3]) . 10

Obrázek 2: Postavení webové analytiky a CI v rámci IS organizace (Zdroj: [12]) . 16

Obrázek 3: Spojení dat z webu s CRM daty (Zdroj: [18]) . 19

Obrázek 4: Evolution path (Zdroj: [28]) . 23

Obrázek 5: Hodnotová segmentace (Zdroj: [32]) . 25

Obrázek 6: Histogram recency . 38

Obrázek 7: Histogram frequency . 39

Obrázek 8: Histogram monetary (do 10 tisíc Kč) . 41

Obrázek 9: Histogram monetary (nad 10 tisíc Kč) . 41

Obrázek 10: RFM bodový graf . 43

Obrázek 11: Key Influencers . 46

Obrázek 12: Zastoupení zemí zákazníků (mimo ČR) . 48

Obrázek 13: Princip sběru dat Google Analytics (Zdroj: [42]) . 56

Obrázek 14: Report zákaznických dat . 67

 

Seznam tabulek

Tabulka 1: Princip sestavení skóre karty (Zdroj: [36]) . 29

Tabulka 2: Nejvěrnější zákazníci 40

Tabulka 3: Zákazníci s nejvyšší útratou . 42

Tabulka 4: Key Influencersa jejich významnost . 46

Tabulka 5: Četnosti jednotlivých hodnot . 47

Tabulka 6: Přehled nejdůležitějších předávaných parametrů (Zdroj: [44]) . 57

Tabulka 7: Přehled nejdůležitějších cookies . 58

Tabulka 8: Shrnutí splnění dílčích cílů . 69

 

Přílohy

Příloha A: SQL dotazy pro tvorbu RFM analýzy

-- Pohledu pro RFM analýzu za rok 2009 - 2011

CREATE OR REPLACE VIEW ci_rfm AS

SELECT

  magento_sales_order.customer_id AS customer_id,

  magento_customer_entity_varchar.value AS surname,

  (to_days(str_to_date( '2012-01-01' , '%Y-%m-%d' )) - to_days(MAX(magento_sales_order.created_at))) AS recency,

  COUNT (magento_sales_order.increment_id) AS frequency,

  SUM(magento_sales_order.base_subtotal) AS monetary

FROM magento_sales_order

  JOIN magento_customer_entity_varchar ON

    magento_sales_order.customer_id = magento_customer_entity_varchar.entity_id

WHERE magento_sales_order.created_at BETWEEN str_to_date( '2009-01-01' , '%Y-%m-%d' ) AND str_to_date( '2012-01-01' , '%Y-%m-%d' ) AND

  magento_sales_order.total_paid > 0 AND

  magento_customer_entity_varchar.attribute_id = 7 AND

  -- vyloučení dat testovacího zákazníka

  customer_id <> 817

GROUP BY magento_sales_order.customer_id

ORDER BY magento_sales_order.customer_id;

 

 

-- Pohledu pro RFM analýzu od roku 2009 do současnosti

CREATE OR REPLACE VIEW ci_rfm_today AS

SELECT

  magento_sales_order.customer_id AS customer_id,

  magento_customer_entity_varchar.value AS surname,

  (to_days(DATE(NOW())) - to_days(MAX(magento_sales_order.created_at))) AS recency,

  COUNT (magento_sales_order.increment_id) AS frequency,

  SUM(magento_sales_order.base_subtotal) AS monetary

FROM magento_sales_order

  JOIN magento_customer_entity_varchar ON

    magento_sales_order.customer_id = magento_customer_entity_varchar.entity_id

WHERE magento_sales_order.total_paid > 0 AND

  magento_customer_entity_varchar.attribute_id = 7 AND

  -- vyloučení dat testovacího zákazníka

  customer_id <> 817

GROUP BY magento_sales_order.customer_id

ORDER BY magento_sales_order.customer_id;

 

 


 

Příloha B: SQL dotazy za účelem získání Key Influencers

-- Pohled pro první objednávku zákazníků

-- spojením mi vypadnou zákazníci bez nákupu

CREATE OR REPLACE VIEW ci_customer_first_order AS

SELECT

  magento_sales_order.customer_id customer_id,

  magento_customer_entity_varchar.value surname,

  magento_customer_entity.email,

  magento_customer_entity.created_at,

  -- hledáme pouze první objednávku

  MIN(magento_sales_order.entity_id) first_order_id,

  MIN(magento_sales_order.created_at) first_order_date,

  -- doba do prvního nákupu (rozdíl data nákupu a data registrace zákazníka)

  (to_days(MIN(magento_sales_order.created_at)) - to_days(magento_customer_entity.created_at)) to_first_order_days

FROM magento_sales_order

  JOIN magento_customer_entity_varchar ON

    magento_sales_order.customer_id = magento_customer_entity_varchar.entity_id

  JOIN magento_customer_entity ON

    magento_sales_order.customer_id = magento_customer_entity.entity_id

WHERE

  -- magento_sales_order.created_at = (SELECT MIN(created_at) FROM magento_sales_order) AND

  magento_sales_order.total_paid > 0 AND

  magento_customer_entity_varchar.attribute_id = 7 AND

  -- vyloučení dat testovacího zákazníka

  customer_id <> 817

GROUP BY magento_sales_order.customer_id;

 

 

DROP FUNCTION is_one //

CREATE FUNCTION is_one(frequency INT)

RETURNS int( 11 )

BEGIN

    DECLARE s INT;

    IF (frequency > 1 ) THEN SET s = 1 ;

    ELSE SET s = 0 ;  

    END IF ;

    RETURN s;

END //

 

 

CREATE OR REPLACE VIEW ci_customer_adress AS

SELECT magento_customer_address_entity.parent_id customer_id, magento_customer_address_entity.entity_id address_id, magento_customer_entity_varchar.value surname FROM

magento_customer_entity_varchar

JOIN magento_customer_address_entity

  ON magento_customer_address_entity.parent_id = magento_customer_entity_varchar.entity_id

WHERE attribute_id = 7 ;

 

 

CREATE OR REPLACE VIEW ci_customer_countries AS

SELECT entity_id, value FROM magento_customer_address_entity_varchar WHERE attribute_id = 25 ;

 

 

CREATE OR REPLACE VIEW ci_customer_country AS

SELECT DISTINCT customer_id, value country

FROM ci_customer_adress

JOIN

  ci_customer_countries

  ON ci_customer_adress.address_id = ci_customer_countries.entity_id

 

 

CREATE OR REPLACE VIEW ci_regression AS

SELECT

  -- ci_customer_first_order.customer_id, ci_customer_first_order.first_order_id,

  is_one(frequency) count_order, to_first_order_days,

  magento_sales_order.base_subtotal price,

  COUNT (item_id) count_products, SUM(qty_ordered) qty_products,

  MONTH (ci_customer_first_order.first_order_date) months,

  QUARTER(ci_customer_first_order.first_order_date) quarter,

  -- jazyk 1 = cz, 2 = en, 3 = de

  magento_sales_order.store_id language,

  ci_customer_country.country

FROM ci_customer_first_order

JOIN ci_rfm_today

  ON ci_customer_first_order.customer_id = ci_rfm_today.customer_id

JOIN magento_sales_order

  ON ci_customer_first_order.first_order_id = magento_sales_order.entity_id

JOIN magento_sales_flat_order_item

  ON ci_customer_first_order.first_order_id = magento_sales_flat_order_item.order_id

LEFT JOIN

  -- do výpisu chci z adresy pouze stát 

  ci_customer_country

  ON ci_customer_first_order.customer_id = ci_customer_country.customer_id

WHERE

  -- vyloučení poštovného (specificné u tohoto obchodu)

  sku <> '..' AND sku <> 1 AND sku <> 10 AND sku <> 111 AND sku <> 2  

GROUP BY magento_sales_flat_order_item.order_id;

 

 

SELECT country, COUNT (country) frequency

FROM ci_regression

GROUP BY country;

 

 


 

Příloha C: SQL dotazy pro RFM skóring

-- Funkce pro výpočet jednotlivých skóre na základě rozčlenění do kvantilů

DROP FUNCTION score //

 

CREATE FUNCTION score(rank INT) RETURNS int( 11 )

BEGIN

  DECLARE s INT;

  DECLARE d DECIMAL( 5 , 2 );

  -- výpočet 10% z celkového počtu zákazníků

  SELECT COUNT (*) / 10 INTO d FROM ci_rfm_today;

 

  IF rank < d THEN SET s = 1 ; END IF ;

  IF (rank >= d AND rank < 2 *d) THEN SET s = 2 ; END IF ;

  IF (rank >= 2 *d AND rank < 3 *d) THEN SET s = 3 ; END IF ;

  IF (rank >= 3 *d AND rank < 4 *d) THEN SET s = 4 ; END IF ;

  IF (rank >= 4 *d AND rank < 5 *d) THEN SET s = 5 ; END IF ;

  IF (rank >= 5 *d AND rank < 6 *d) THEN SET s = 6 ; END IF ;

  IF (rank >= 6 *d AND rank < 7 *d) THEN SET s = 7 ; END IF ;

  IF (rank >= 7 *d AND rank < 8 *d) THEN SET s = 8 ; END IF ;

  IF (rank >= 8 *d AND rank < 9 *d) THEN SET s = 9 ; END IF ;

  IF (rank >= 9 *d) THEN SET s = 10 ; END IF ;

  RETURN s;

END //

 

 

-- Funkce na výpočet složky F

DROP FUNCTION score_frequency //

CREATE FUNCTION score_frequency(rank INT) RETURNS int( 11 )

BEGIN

  DECLARE s INT;

  IF (rank >= 10 ) THEN SET s = 10 ;

  ELSE SET s = rank;  

  END IF ;

  RETURN s;

END //

 

 

-- Aktualizace tabulky s RFM skórem

DROP PROCEDURE scoring //

CREATE PROCEDURE scoring()

BEGIN

 

  SET @line_r := 0 ;

  SET @line_m := 0 ;

  SET @order := 0 ;

 

  -- nejdříve je vše uloženo do dočasné tabulky, bez číslování

  DROP TABLE IF EXISTS ci_rfm_scores_temporary;

  CREATE TEMPORARY TABLE IF NOT EXISTS ci_rfm_scores_temporary

    (customer_id INT, surname VARCHAR ( 50 ), p_recency INT, recency INT, s_recency INT, p_monetary INT, monetary DECIMAL( 9 , 2 ), s_monetary INT, frequency INT, s_frequency INT, RFM_score INT);

 

  INSERT INTO ci_rfm_scores_temporary (customer_id, surname, p_recency, recency, s_recency, p_monetary, monetary, s_monetary, frequency, s_frequency, RFM_score)

  SELECT

    ci_rfm_recency.customer_id, ci_rfm_recency.surname,

    p_recency, ci_rfm_recency.recency, score(p_recency) s_recency,

    p_monetary, ci_rfm_monetary.monetary, score(p_monetary) s_monetary,

    ci_rfm_monetary.frequency, score_frequency(ci_rfm_monetary.frequency) s_frequency,

    -- výpočet konečného RFM skóre podle stanovených vah

    ( 3 / 10 *score(p_recency) + 4 / 10 *score_frequency(ci_rfm_monetary.frequency) + 3 / 10 *score(p_monetary))* 10 RFM_score

  FROM

  (

    (

    SELECT *, @line_r := @line_r + 1 AS p_recency

    FROM

      (SELECT *

      FROM ci_rfm_today

      ORDER BY recency DESC ) AS by_recency

    ) AS ci_rfm_recency

  JOIN

    (SELECT *, @line_m := @line_m + 1 AS p_monetary

    FROM

      (SELECT *

      FROM ci_rfm_today

      ORDER BY monetary ASC ) AS by_monetary

    ) AS ci_rfm_monetary

  ON ci_rfm_recency.customer_id = ci_rfm_monetary.customer_id

  )

  ORDER BY RFM_score DESC , monetary DESC ;

 

  -- vytvořena tabulka ci_rfm_scores, která obsahuje i pořadí

  DROP TABLE IF EXISTS ci_rfm_scores;

  CREATE TABLE ci_rfm_scores

    (orders INT, customer_id INT, surname VARCHAR ( 50 ), p_recency INT, recency INT, s_recency INT, p_monetary INT, monetary DECIMAL( 9 , 2 ), s_monetary INT, frequency INT, s_frequency INT, RFM_score INT);

 

  INSERT INTO ci_rfm_scores (customer_id, surname, p_recency, recency, s_recency, p_monetary, monetary, s_monetary, frequency, s_frequency, RFM_score, orders)

  SELECT *, @order := @order+ 1 FROM ci_rfm_scores_temporary;

   

  DROP TABLE IF EXISTS ci_rfm_scores_temporary;  

END //

 

 


 

Příloha D: SQL dotazy pro E-loyalty skóring

CREATE OR REPLACE VIEW ci_eloyalty AS

SELECT ci_ga_base.customer_id, name, ci_ga_base.visits, time_on_site, page_views,

  (to_days(DATE(NOW())) - to_days(MAX(date))) AS date_recency

FROM ci_ga_date

JOIN ci_ga_base

  ON ci_ga_date.customer_id = ci_ga_base.customer_id

GROUP BY customer_id;

 

 

DROP FUNCTION score_eloyalty //

CREATE FUNCTION score_eloyalty(rank INT) RETURNS int( 11 )

BEGIN

    DECLARE s INT;

    DECLARE d DECIMAL( 5 , 2 );

    -- výpočet 10% z celkového počtu zákazníků

    SELECT COUNT (*) / 10 INTO d FROM ci_eloyalty;

 

    IF rank < d THEN SET s = 1 ; END IF ;

    IF (rank >= d AND rank < 2 *d) THEN SET s = 2 ; END IF ;

    IF (rank >= 2 *d AND rank < 3 *d) THEN SET s = 3 ; END IF ;

    IF (rank >= 3 *d AND rank < 4 *d) THEN SET s = 4 ; END IF ;

    IF (rank >= 4 *d AND rank < 5 *d) THEN SET s = 5 ; END IF ;

    IF (rank >= 5 *d AND rank < 6 *d) THEN SET s = 6 ; END IF ;

    IF (rank >= 6 *d AND rank < 7 *d) THEN SET s = 7 ; END IF ;

    IF (rank >= 7 *d AND rank < 8 *d) THEN SET s = 8 ; END IF ;

    IF (rank >= 8 *d AND rank < 9 *d) THEN SET s = 9 ; END IF ;

    IF (rank >= 9 *d) THEN SET s = 10 ; END IF ;

    RETURN s;

END ;

 

 

DROP PROCEDURE scoring_eloyalty //

CREATE PROCEDURE scoring_eloyalty()

BEGIN

 

  SET @line_v := 0 ;

  SET @line_t := 0 ;

  SET @line_p := 0 ;

  SET @line_d := 0 ;

  SET @order := 0 ;

 

  -- nejdříve je vše uloženo do dočasné tabulky, bez číslování

  DROP TABLE IF EXISTS ci_eloyalty_scores_temporary;

  CREATE TEMPORARY TABLE IF NOT EXISTS ci_eloyalty_scores_temporary

    (customer_id INT, name VARCHAR ( 50 ), p_visits INT, visits INT, s_visits INT, p_time_on_site INT, time_on_site INT, s_time_on_site INT, p_page_views INT, page_views INT, s_page_views INT, p_date_recency INT, date_recency INT, s_date_recency INT, eloyalty_score INT);

 

  INSERT INTO ci_eloyalty_scores_temporary (customer_id, name, p_visits, visits, s_visits, p_time_on_site, time_on_site, s_time_on_site, p_page_views, page_views, s_page_views, p_date_recency, date_recency, s_date_recency, eloyalty_score)

  SELECT

    ci_eloyalty_visits.customer_id, ci_eloyalty_visits.name,

    p_visits, ci_eloyalty_visits.visits, score_eloyalty(p_visits) s_visits,

    p_time_on_site, ci_eloyalty_time_on_site.time_on_site, score_eloyalty(p_time_on_site) s_time_on_site,

    p_page_views, ci_eloyalty_page_views.page_views, score_eloyalty(p_page_views) s_page_views,

    p_date_recency, ci_eloyalty_date_recency.date_recency, score_eloyalty(p_date_recency) s_date_recency,

    -- výpočet konečného RFM skóre podle stanovených vah

    ( 3 / 10 *score_eloyalty(p_visits) + 2 / 10 *score_eloyalty(p_date_recency) + 2.5 / 10 *score_eloyalty(p_page_views) + 2.5 / 10 *score_eloyalty(p_time_on_site))* 10 eloyalty_score

  FROM

    (SELECT *, @line_v := @line_v + 1 AS p_visits

    FROM

      (SELECT *

      FROM ci_eloyalty

      ORDER BY visits ASC ) AS by_visits

    ) AS ci_eloyalty_visits

  JOIN

    (SELECT *, @line_t := @line_t + 1 AS p_time_on_site

    FROM

      (SELECT *

      FROM ci_eloyalty

      ORDER BY time_on_site ASC ) AS by_time_on_site

    ) AS ci_eloyalty_time_on_site

  ON ci_eloyalty_visits.customer_id = ci_eloyalty_time_on_site.customer_id

  JOIN

    (SELECT *, @line_p := @line_p + 1 AS p_page_views

    FROM

      (SELECT *

      FROM ci_eloyalty

      ORDER BY page_views ASC ) AS by_page_views

    ) AS ci_eloyalty_page_views

  ON ci_eloyalty_visits.customer_id = ci_eloyalty_page_views.customer_id

  JOIN

    (SELECT *, @line_d := @line_d + 1 AS p_date_recency

    FROM

      (SELECT *

      FROM ci_eloyalty

      ORDER BY date_recency DESC ) AS by_date_recency

    ) AS ci_eloyalty_date_recency

  ON ci_eloyalty_visits.customer_id = ci_eloyalty_date_recency.customer_id

 

  ORDER BY eloyalty_score DESC , visits DESC ;

 

  -- vytvořena tabulka ci_rfm_scores, která obsahuje i pořadí

  DROP TABLE IF EXISTS ci_eloyalty_scores;

  CREATE TABLE ci_eloyalty_scores

    (orders INT, customer_id INT, name VARCHAR ( 50 ), p_visits INT, visits INT, s_visits INT, p_time_on_site INT, time_on_site INT, s_time_on_site INT, p_page_views INT, page_views INT, s_page_views INT, p_date_recency INT, date_recency INT, s_date_recency INT, eloyalty_score INT);

 

  INSERT INTO ci_eloyalty_scores (customer_id, name, p_visits, visits, s_visits, p_time_on_site, time_on_site, s_time_on_site, p_page_views, page_views, s_page_views, p_date_recency, date_recency, s_date_recency, eloyalty_score, orders)

  SELECT *, @order := @order + 1 FROM ci_eloyalty_scores_temporary;

   

  DROP TABLE IF EXISTS ci_eloyalty_scores_temporary;  

END //  



[1] Customer Relationship Management

[2] Application Programming Interface

[3] Vyjadřuje jakýkoliv nový, radikální nebo revoluční termín, který vešel v obecnou laickou známost [16].

[4] Vizionáři a nadšení uživatelé nových technologií a produktů. Mají přehled a chápou hodnotu služby/produktu dříve než ji pochopí běžný uživatel [22].

[5] Search Engine Optimization neboli optimalizace pro internetové vyhledávače je řada operací, jejichž účelem je zlepšení pozic ve výsledcích vyhledávání ve fulltextových vyhledávačích [23].

[6] Pay Per Click je model platby za internetovou reklamu spočívající v platbě za prokliky (resp. kliknutí na reklamu) [24].

[7] Business to Business (obchodník → obchodník), koncept B2B se tedy týká obchodních vztahů a vzájemné komunikace mezi dvěma společnostmi [34].

[8] Software as a Service (SaaS) je poskytování softwaru formou služby. SaaS aplikace nejsou instalovány na lokálních serverech firmy nebo uživatele, ale běží na serverech poskytovatele služby. Uživatelé k nim přistupují přes Internet [39].

[9] Soubory web beacons jsou elektronické obrázky, které mohou být užity pro rozpoznání souborů cookies v počítači. Web beacons různými způsoby pomáhají měřit efektivitu stránek a reklam [41].

[10] Cookies jsou malé textové informace, které se dají uložit na počítači klienta. Z bezpečnostních důvodů je ukládání všech souborů na klientovi zakázáno, cookies jsou jedinou omezenou výjimkou [43].

[11] Google Analytics Tracking Code

[12] Entity Relationship diagramy popisují statickou strukturu databáze. Pro popis toku dat a podobné věci slouží například některé podmnožiny UML [48].