SQL, c'est ton interface avec l'IA pour la data : la langue commune entre toi, les bases et les agents qui génèrent des requêtes à ta place. Comprendre ce qu'on fait, pas juste recopier du code. D'abord la vue d'ensemble (lecture défilable), puis le détail technique en 12 chapitres.
Vue d'ensemble · à lire d'une traite
1
SQL, c'est des commandes pour sélectionner des données
SQL — Structured Query Language — sert à poser une question à une base de données et récupérer la réponse sous forme de tableau. C'est l'équivalent d'une formule Excel, mais pensé pour des volumes que ton tableur ne peut pas tenir.
2
Les données sont stockées dans des bases (et c'est compliqué)
Dans une vraie entreprise, la donnée vit dans des bases — BigQuery, Snowflake, PostgreSQL, etc. Elle est répartie en projets → datasets → tables → colonnes, avec des règles d'accès, des historiques, des versions.
Le SQL est le langage standard pour communiquer avec ces bases. Le même SELECT fonctionne partout — c'est ce qui rend la compétence si transférable.
3
L'étape minimale ressemble à Excel
Tu choisis des données : SELECT les colonnes, FROM la table, et tu peux WHERE filtrer. C'est exactement ce que tu fais sur Excel quand tu sélectionnes des colonnes et appliques un filtre.
SELECT name, amount
FROM orders
WHERE status = 'completed';
Fonctions de texte, dates, calculs, agrégations (SUM, AVG, COUNT) — tout ce que tu fais avec des formules Excel a un équivalent SQL. Souvent plus court, toujours plus reproductible.
La sortie de SQL est toujours une table. Chaque élément que tu écris entre virgules dans le SELECT devient une colonne de ton résultat.
Il y a donc une granularité à choisir : 1 ligne = 1 commande ? 1 ligne = 1 client ? 1 ligne = 1 mois ? Cette granularité, on la pilote avec GROUP BY qui sépare ce qu'on agrège (les métriques) de ce sur quoi on regroupe (les dimensions).
Réflexe métier : avant d'écrire la requête, dessine sur papier la table de sortie attendue. Combien de colonnes ? Quelle granularité ? C'est 80% du travail.
Comme sur Excel où certains calculs nécessitent plusieurs colonnes intermédiaires, en SQL on utilise les CTE (Common Table Expressions) — une sorte de variable temporaire qui rend la requête lisible et permet d'enchaîner les transformations.
WITH ventes_par_client AS (
SELECT customer_id, SUM(amount) AS total
FROM orders
GROUP BY customer_id
)
SELECT * FROM ventes_par_client
WHERE total > 1000;
Une requête SQL, c'est une transformation reproductible. Tu l'écris une fois, elle tourne mille fois — sur 10 lignes ou 10 millions, sans toucher au fichier source.
Industrialisable : intégrable dans un dashboard Looker / Power BI, un export Excel automatique, un pipeline.
Précis : pas de copier-coller hasardeux, pas de formule cassée par un tri.
Au plus près de la source : tu travailles sur la donnée brute, tu vois exactement d'où viennent les écarts, tu valides la cohérence.
Indépendance : tu n'attends plus quelqu'un pour répondre à une question business. C'est ce qui crée la confiance dans tes chiffres.
L'objectif typique : trouver le bon format de query, puis embarquer le résultat dans Excel, Looker Studio ou Power BI pour la diffusion. Le SQL est la brique fondatrice, pas la finalité.
9
🤖 L'IA & le SQL : pourquoi tu dois maîtriser les fondamentaux maintenant
Les agents IA (ChatGPT, Claude, Copilot...) écrivent du SQL très vite. Mais ils ne savent pas :
Si la table orders contient des doublons ou des lignes annulées à filtrer
Que le KPI "CA" se calcule en filtrant status = 'completed' chez vous, pas chez le voisin
Que la jointure orders → customers peut perdre 12% des lignes (orphelines, à investiguer)
Si la colonne amount est en € HT, TTC, ou en cents
L'IA produit une requête syntaxiquement correcte. Toi seul peux dire si elle est métier-correcte. Sans la compréhension du schéma, de la qualité des données, et de la définition de tes KPIs, tu vas livrer des chiffres faux qui ressemblent à des chiffres justes.
Le vrai skill 2026 : savoir recetter une requête (générée par toi ou par IA) contre une source de vérité (export Excel, dashboard officiel, recompte manuel sur 5 lignes). C'est ce qui sépare un analyste qui livre du bruit d'un analyste qui livre de la décision.
10
📐 La gouvernance, la doc et les KPIs : la vraie valeur
Dans une vraie boîte, le SQL n'est pas l'enjeu — c'est la chaîne complète :
Gouvernance : qui est propriétaire de la donnée ? qui décide de la définition d'un KPI ?
Documentation : à quoi sert chaque table ? quelle est sa fréquence de rafraîchissement ? quels sont ses pièges connus ?
Qualité : est-ce qu'on a des NULLs, des doublons, des valeurs aberrantes ? est-ce qu'on les a documentés ?
Cohérence des KPIs : si tu changes la définition d'un KPI, tu casses tous les dashboards qui l'utilisent
Une boîte data-mature, c'est une boîte où les analystes passent plus de temps à clarifier les définitions et les sources qu'à coder. SQL est le marteau — mais le vrai métier, c'est de savoir où, quand et pourquoi taper.
Va voir : la page Bases de données du Lab pour voir à quoi ressemble une vraie doc de table (granularité, refresh, pièges qualité).
↓ Pour aller en profondeur sur chaque concept ↓
Aller plus loin
Tu as parcouru les fondamentaux ?
Les formations CK Labs te donnent la méthode complète : vidéos pas-à-pas, supports écrits, cas réels.