Enrichir GA4 avec des données CRM via BigQuery : Tutoriel complet (2025)

Enrichir GA4 avec des données CRM via BigQuery : Tutoriel complet (2025)

Un devis adapté à vos besoins ?

Prendre un RDV

Ce tutoriel t’explique pas à pas, comme un guide opérationnel, comment :

Exporter GA4 vers BigQuery, Importer les données CRM, Faire correspondre GA4 ↔ CRM, Enrichir GA4 avec des données business, Réutiliser le tout dans ton stack marketing

1. Introduction : Pourquoi enrichir GA4 avec des données CRM ?

GA4 est excellent pour analyser le comportement utilisateur : navigation, funnel, conversions, devices, sources d’acquisition…
Mais il lui manque quelque chose de critique : les données client.

  • valeur client réelle (LTV)

  • segment marketing (VIP, churn risk…)

  • informations transactionnelles du CRM

  • statut d’abonnement

  • cohorte d’acquisition

  • RFM scoring

  • multi-device matching

Toutes ces données vivent dans ton CRM ou ton backend, mais pas dans GA4.

La solution la plus puissante et économique consiste à fusionner GA4 + CRM dans BigQuery, puis à exploiter cette base enrichie dans Looker Studio, Google Ads, Meta, ou vos outils internes.


2. Comprendre GA4, BigQuery et le rôle du CRM

2.1. Comment fonctionne l’export BigQuery natif GA4 ?

GA4 propose un export direct vers BigQuery.
Tu obtiens des tables quotidiennes :

  • events_YYYYMMDD

  • events_intraday_YYYYMMDD

Chaque ligne = 1 event.
Identifiant utilisateur = user_pseudo_id.
Les paramètres d’événements sont stockés dans event_params (tableau clé/valeur).

Avantage : granularité totale.
Limite : aucune donnée CRM n’existe dans GA4 (pas d’email, pas de LTV).


2.2. Pourquoi BigQuery est idéal pour enrichir GA4

BigQuery permet :

  • de stocker massivement (GA4 + CRM + backend)

  • de joindre ces données de manière flexible

  • d’alimenter Looker Studio

  • de faire du ML (BigQuery ML)

  • d’exporter vers Google Ads / Meta

C’est littéralement la Customer Data Platform low-cost la plus robuste du marché.


2.3. Attention à la RGPD

Important :
GA4 interdit les PII (personally identifiable information).

Donc :

  • jamais d’email brut dans GA4

  • toujours hash SHA256 (lowercase + trim)

Dans BigQuery, tu peux stocker les emails bruts, mais les données envoyées vers GA4 doivent être hashées.


3. Étape 1 — Exporter GA4 vers BigQuery

3.1. Activer le lien GA4 → BigQuery

Dans GA4 → Admin → Lien BigQuery

  1. Choisir ton projet Google Cloud

  2. Sélectionner ou créer un dataset

  3. Activer le streaming (recommandé)

  4. Sauvegarder

GA4 va créer automatiquement les tables quotidiennes.


3.2. Vérifier la structure GA4

Les colonnes essentielles :

  • event_name

  • event_timestamp

  • user_pseudo_id

  • event_params.key / .value

  • user_properties

  • geo, device, etc.

3.3. Préparer des vues propres GA4

Crée des vues SQL simplifiées :

  • ga4_pageviews

  • ga4_conversions

  • ga4_sessions

  • ga4_users

Ces vues serviront pour la jointure avec tes données CRM.


4. Étape 2 — Importer les données CRM dans BigQuery

4.1. Les données CRM à importer

Les colonnes typiques :

  • customer_id

  • email

  • email_hash

  • first_seen

  • last_seen

  • ltv (lifetime value)

  • total_orders

  • segment

  • subscription_status

  • personas

  • rfm_score

Tu peux importer tout ce dont tu as besoin côté business.


4.2. Comment importer le CRM dans BigQuery

Plusieurs options :

A. CSV / Google Sheets → BigQuery

Simple mais manuel.

B. Zapier / Make / n8n

Automatisé si ton CRM n’a pas d’export natif.

C. API / Script Google Apps Script

Très efficace pour HubSpot / Intercom / Salesforce.

D. ETL professionnels

  • Fivetran

  • Airbyte

  • Stitch

E. Ton backend (export SQL → BigQuery)

Souvent le plus propre.


4.3. Normaliser les données CRM

Avant d’aller plus loin :

  • Métadonnées homogènes

  • Dates au format TIMESTAMP

  • Colonnes en snake_case

  • Email hash = SHA256(lower(email))

Tu viens de préparer la brique la plus importante.


5. Étape 3 — Faire correspondre GA4 ↔ CRM (Matching)

C’est LA partie cruciale.

5.1. Quel identifiant utiliser pour relier GA4 et CRM ?

1. user_id (si login obligatoire)

La meilleure option → unique, stable.

2. email hashé

Parfait pour le cross-device
→ matching très élevé.

3. transaction_id

Utile pour l’e-commerce → enrichir les achats.

⚠️ À éviter :

user_pseudo_id
→ change si l’utilisateur efface les cookies ou change de device.


5.2. Construire la table de correspondance

Exemple de jointure SQL :

SELECT 
  ga4.user_pseudo_id,
  crm.customer_id,
  crm.email_hash,
  crm.ltv,
  crm.segment,
  crm.subscription_status,
  ga4.event_name,
  ga4.event_timestamp
FROM 
  `myproject.ga4.events_*` AS ga4
LEFT JOIN 
  `myproject.crm.customers` AS crm
ON 
  ga4.user_id = crm.customer_id
  OR ga4.user_properties.email_hash.value.string_value = crm.email_hash;

Tu obtiens une vue enrichie GA4 + CRM.


5.3. Créer une “Customer 360 Table”

  1. 1 ligne = 1 client unique

  2. Colonnes enrichies :

    • ltv

    • churn_risk

    • cohort

    • attribution first_touch GA4

    • attribution last_touch GA4

    • devices

    • total_sessions

  3. Mise à jour quotidienne via un scheduled query.

C’est le cœur de ton architecture.


6. Étape 4 — Enrichir les données GA4 avec ton CRM

Maintenant que les deux sources sont jointes → enrichissement.

6.1. Enrichir les events GA4

Ajouter dans tes vues :

  • customer_ltv

  • customer_segment

  • subscription_status

  • rfm_score

  • customer_age_in_days

Exemple :

SELECT 
  ga4.*,
  crm.ltv AS customer_ltv,
  crm.segment AS customer_segment,
  crm.subscription_status
FROM 
  ga4_events AS ga4
LEFT JOIN 
  crm_customers AS crm
ON ga4.email_hash = crm.email_hash;

6.2. Produire des vues analytiques enrichies

Exemples :

Vue : Funnel enrichi CRM

  • Voir l’impact du segment CRM sur le funnel GA4.

Vue : Cohortes LTV

  • Regarder la LTV des utilisateurs par source GA4.

Vue : E-commerce enrichi

  • Revenus CRM vs “purchase value” GA4.


6.3. Nettoyer, normaliser, industrialiser

  • Dates uniformisées

  • Types de données cohérents

  • Vues versionnées

  • Contrôle des duplications

Tu obtiens un warehouse propre.


7. Étape 5 — Utiliser les données enrichies dans ton écosystème marketing

7.1. Looker Studio : dashboards enrichis GA4 + CRM

Tu peux maintenant visualiser :

  • Funnel enrichi par segment CRM

  • LTV par source d’acquisition GA4

  • Cohortes d’engagement

  • Churn vs engagement GA4

  • Retour marketing basé sur la vraie valeur client

C’est beaucoup plus puissant que GA4 seul.


7.2. Exporter des audiences enrichies vers Ads (via BigQuery)

Utilisations possibles :

  • Google Ads → audience haute LTV

  • Meta Ads → exclusion churn

  • Customer.io → campagne email segmentée

  • Klaviyo → multi-device retargeting

Grâce à BigQuery, chaque audience peut être alimentée automatiquement.


7.3. Réinjecter des données dans GA4 (prudent !)

Possible via Measurement Protocol si :

  • aucun PII

  • hash email uniquement

  • données agrégrées (ltv_bucket, segment_name)

Exemples réinjectables :

  • user_property: segment = "VIP"

  • event: purchase_type = "subscription"

  • event: crm_value_bucket = "200-500€"

Jamais : email, prénom, nom, téléphone.


7.4. BigQuery ML : aller encore plus loin

Tu peux créer :

  • modèle churn

  • modèle LTV

  • scoring automatique

  • classification RFM

  • attribution data-driven maison

Puis exporter vers Ads pour optimiser automatiquement.


8. Étape 6 — Mettre en place un pipeline durable

8.1. Automatiser l’ensemble

Pipeline quotidien :

  1. GA4 export automatique

  2. CRM import (API / ETL / push backend)

  3. Jointures enrichies

  4. Mise à jour Customer 360

  5. Export audiences

  6. MAJ dashboards Looker Studio


8.2. Mettre en place des contrôles de qualité (QA)

  • Vérifier les volumes GA4

  • Vérifier les volumes CRM

  • Taux de matching GA4 ↔ CRM

  • Contrôles sur les doublons

  • Comparaison LTV GA4 vs backend


8.3. Documenter le modèle de données

Inclure :

  • schémas

  • mapping identifiants

  • convention de nommage

  • cycle de mise à jour

  • propriétaires des tables

Cela garantit la durabilité du système.


9. Cas d’usage concrets

E-commerce

  • Valoriser les segments VIP

  • Affiner les prédictions LTV

  • Optimiser Google Ads selon la valeur réelle client

SaaS / Subscription

  • Mesurer les upgrades / downgrades

  • Lier churn ↔ comportement GA4

  • Optimiser CAC payback

Apps mobiles

  • Lier Mixpanel / Adjust / AppsFlyer avec GA4

  • Propager LTV dans les audiences Ads

  • Construire des cohorte ROAS fiables


10. Erreurs fréquentes à éviter

  • Envoyer de la donnée PII dans GA4

  • Ne pas unifier les identifiants

  • Mauvais hashing email

  • Pipeline intermittent / non automisé

  • LTV non alignée avec le backend

  • Mauvais mapping GA4 (special characters…)

  • Jointure CRM ↔ GA4 non fiable

  • Donner trop d’importance aux données GA4 purchase (souvent incorrectes)


Conclusion

Enrichir GA4 avec les données CRM via BigQuery est l’un des leviers les plus puissants pour passer d’une vision “analytics comportementale” à une véritable vision business 360°.

Grâce à ce tutoriel :

  • tu exportes GA4 correctement

  • tu importes ton CRM

  • tu matches les identifiants

  • tu construis une Customer 360 Table

  • tu enrichis GA4 et tes dashboards

  • tu optimises tes campagnes Ads avec des audiences business

  • tu poses les bases pour le ML

C’est la stack idéale pour toutes les entreprises data-driven en 2025.
Et la meilleure façon de transformer GA4 en un moteur marketing complet.



Questions fréquemment posées sur le sujet

Enrichir GA4 avec des données CRM permet de lier le comportement digital (événements, sessions) aux données métier (clients, ventes, marge) afin d’avoir une vision complète des utilisateurs et de piloter les actions marketing au-delà des conversions Web.

Il faut disposer d’une propriété GA4 active, avoir un projet Google Cloud avec BigQuery activé, les liens de liaison GA4 → BigQuery créés, et les droits IAM adéquats pour exporter les données d’événements. :contentReference[oaicite:3]{index=3}

Il convient d’exporter les données CRM (ex. table clients, ventes, leads) dans BigQuery sous forme de dataset dédié, de s’assurer d’avoir une clé commune (ex. user id, email haché) pour joindre avec GA4, et de respecter les règles de confidentialité (hachage des identifiants personnels).

Dans BigQuery vous écrivez une requête SQL qui joint la table d’événements GA4 (ex. `events_*`) avec la table CRM sur la clé commune (ex. `user_pseudo_id` ou `hashed_email`) et vous récupérez les métriques GA4 enrichies des attributs CRM (ex. segment client, valeur de vie, catégorie).

Utiliser un algorithme sécurisé (SHA-256) pour hacher les emails ou téléphones avant import, jamais stocker d’identifiants clairs dans GA4 ou BigQuery destinés au marketing, et documenter cette transformation dans votre registre RGPD.

Vous connectez Looker Studio à votre dataset BigQuery enrichi, puis créez des sources de données, définissez dimensions (ex. segment client, valeur client) et métriques (ex. nombre d’événements, revenu CRM), puis construisez les visuels (funnels, cohortes, LTV) pour piloter les KPIs.

Le croisement permet d’accéder aux données brutes (événements GA4), de dépasser les limites d’échantillonnage, d’analyser en profondeur (SQL), de segmenter avec des données métier CRM, et de créer des modèles prédictifs ou d’attribution plus fiables. :contentReference[oaicite:5]{index=5}

Among others : ne pas définir de clé de jointure compatible, importer des données personnelles non hachées, oublier de partitionner les tables entraînant des coûts élevés, ne pas documenter ni auditer le pipeline, ou utiliser des données CRM obsolètes.

Utiliser le partitioning et clustering de tables, limiter les scans via des filtres sur `_TABLE_SUFFIX`, prévoir un processus de nettoyage ou d’archivage, et monitorer les requêtes lourdes pour optimiser les coûts. :contentReference[oaicite:6]{index=6}

Vous pouvez créer un modèle de valeur client (LTV) dans BigQuery en combinant les données événements GA4 avec les données CRM (achats, marges), segmenter les utilisateurs selon valeur et engagement, et suivre les cohortes dans Looker Studio pour piloter l’acquisition et la fidélisation.




Besoin d'optimiser votre tracking ?

Prendre un RDV

Services et prestations

Un bon suivi de site web permet d'identifier les pages et les éléments qui convertissent le mieux les visiteurs en clients ou prospects.

Détail de l'offre

➕ Mise en place de l'architecture server-side
➕ Transfert des tags et pixels existants
➕ Amélioration de la rapidité de chargement
➕ Gestion des cookies et des AdBlockers
➕ Vérifications et tests pour garantir la fiabilité
➕ Formation GTM Server Side
➕ Validation des compétences GTM server-side

Délais

Entre 1 et 5 jours

Pricing

Détail de l'offre

➕ Exploration détaillée de vos données
➕ Paramétrage sur mesure de Google Analytics 4
➕ Intégration fluide avec vos outils actuels
➕ Dimensions personnalisées adaptées à votre business
➕ Formation Google Analytics 4

Délais

Entre 1 et 3 jours

Pricing

Détail de l'offre

➕ Choix de la CMP
➕ Paramétrage de la CMP
➕ Listing et classification des cookies
➕ Implémentation de Google Consent Mode v2
➕ Assurance de la conformité aux réglementations CNIL et RGPD
➕ Formation

Délais

Entre 1 et 3 jours

Pricing

Détail de l'offre

➕ Automatisation des dashboards
➕ Dashboard personnalisés
➕ Mise en forme ergonomique et pratique
➕ Données en temps réel
➕ Compatible tous device
➕ Validation de vos compétences Looker Studio

Délais

Entre 1 et 10 jours

Pricing

Articles qui peuvent t'intéresser