Big Data, bigs maux de tête 

On a beau lire des tonnes d’articles sur le sujet, difficile d’appréhender la complexité des problématiques de data tant qu’on n’y est pas confronté. Bien sûr cher lecteur, je sais que vous savez depuis fort longtemps que l’important ce n’est pas le big data mais la smart data, qu’il faut savoir « faire parler les chiffres », et autres principes auxquels vous adhérez avec la plus grande sincérité. Mais attention à la pratique… #RealityCheck ahead !

La qualité de la data

Chiffre choc sorti d’une étude Experian Marketing parue en février 2017 : 92% des entreprises n’ont pas confiance en la qualité de leur data. Dès lors, comment prendre des décisions éclairées de data marketing ?
Mais je vous vois hésiter petit lecteur : « Ne pas avoir confiance en sa data » ça reste vague, vous êtes pas sûrs de comprendre ce que ça veut dire. Alors développons un exemple pour rendre tout cela plus concret. Appelons le « votre requête », aka « êtes vous vraiment sûr de ce qui se cache dans les colonnes du tableau que vous lisez ?… ».

Daft Punk masque
Imaginons que vous ayez une boutique sur Amazon et que vous suiviez votre clic-to-sale (CTS). Si un prospect clique sur votre produit A, puis sur B puis sur C, puis de nouveau sur A, ça compte 2 clics ou 1 clic pour A ? Parce que si vous calculez votre CTS sans être certain de la réponse à cette question, il y a de fortes chances que vous compariez des carottes et des écrous rouillés. Hmm… Coup de bol, Johnny de l’équipe data est formel : les clics sont dédupliqués dans la base de données. Ouf. Mais au fait Johnny, la fenêtre de déduplication est de combien ? 1mn, 5mn, 10mn, 30mn ?… Si un utilisateur est parti équeuter les haricots et éplucher les patates avant de reprendre sa session 45 mn plus tard, quand il reclique sur A dans l’exemple précédent ça compte 2 clics ou 1 clic ? Ah bah là Johnny est plus très sûr, faut qu’il revérifie. Pfiou, ça se complique ! C’est le moment où un nouveau doute peut apparaître : on ne sait pas s’il n’y a pas un problème parce que dans les fichiers d’Amazon, il y 17% d’écart avec nos volumes. Damned. Quels chiffres sont les bons ? Voilà, vous y êtes, vous commencez à bien vous arracher les cheveux. Et attendez c’est pas tout vous allez rire : Johnny s’est rendu compte en vérifiant le code de la requête qu’il y avait des erreurs dans les formules et qu’en fait ça fait deux ans que certains indicateurs du reporting étaient faux. C’est pas lui qu’a fait les formules, pis il avait jamais vérifié. Vous voyez le genre ?… cheveux énervéToute ressemblance avec des personnes et des situations existant ou ayant existé est purement fortuite… Bienvenue dans le lot des 92% d’entreprises qui n’ont pas confiance en leur data !

Le gap du multicanal

Ca fait un moment qu’on en parle, mais le sujet n’est toujours pas réglé, du moins pour la majorité des commerçants : il est toujours aussi difficile de tracker le parcours d’un prospect qui commence une recherche sur desktop au bureau et continue le soir sur mobile. Evidemment des Facebook ou Amazon n’ont pas ce problème car il y a de fortes chances que, sur toutes vos devices, votre compte chez eux soit loggé ; mais pour tous les autres, difficile de pleinement comprendre des parcours ou actions quand le changement d’appareil vient créer d’énormes brèches dans l’analyse. Et encore, ça c’est quand on parle d’ecommerçants. Plus complexe encore, l’analyse du web-to-store ou store-to-web. Comment savoir si une action marketing en magasin a déclenché un achat sur le web ou une action web un achat IRL ? La certitude n’est jamais totale. D’autant plus que nous voici arrivés au 3ème point…

Les effets de bord

Quand bien même l’on aurait vérifié la qualité de sa data avec la plus grande exigence et mis en place un système de tracking d’une grande robustesse, n’en reste pas moins qu’à l’heure de l’analyse, se présentent souvent des éléments extérieurs qui viennent complexifier l’analyse. Je m’explique. Imaginons que vous soyez Décathlon et que vous souhaitiez tester une baisse de prix sur les tongs en période pre-estivale. Vous avez validé qu’à partir du 1er mai les tongs seront à 10€ au lieu de 12€ dans vos magasins. Il s’avère qu’une forte vague de chaleur s’abat sur la France (yeahhhhh!) et vos ventes explosent. Vous ne saurez jamais quantifier l’impact de l’un et de l’autre et ne pourrez donc prendre des décisions pérennes dans un sens ou dans l’autre (« en mai, pas la peine de faire des promos sur les tongs, ça part pas ça part pas » ou « au printemps, l’élasticité de la vente des tongs à une promo de 20% est de 35% »). A moins que vous ayez également fait un A/B test sur votre site web, avec un groupe de contrôle rigoureusement construit, qui vous aura permis de chiffrer l’uplift de la promo sur vos ventes ! L’exemple vous paraît peut-être simple et trivial, pourtant vous seriez étonnés de savoir à quel point les effets de bord sont fréquents et complexifient infiniment la lecture de la data. Online, l’A/B test rigoureux est une vraie solution pour isoler l’impact de ses actions.

Et voilà quelques exemples, très loin d’être exhaustifs, des difficultés que l’on peut croiser au quotidien quand on se frotte à la data. Avis à ceux qui ne jurent que par la data : la vérité dans les chiffres peut être parfois difficile à trouver !

Article initialement publié sur Siècle Digital.

Publicités

Un commentaire ? C'est à vous

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s