# Créer une formule Google Sheet si contient un texte précis
Les professionnels du marketing, de la finance et de la gestion de données font face quotidiennement à des volumes importants d’informations textuelles dans leurs feuilles de calcul. La capacité à détecter automatiquement la présence d’un texte spécifique dans des milliers de cellules transforme radicalement l’efficacité opérationnelle. Les formules conditionnelles de Google Sheets offrent une puissance remarquable pour automatiser ces recherches textuelles, permettant d’économiser des heures de tri manuel et de réduire considérablement les erreurs humaines. Maîtriser ces techniques devient désormais une compétence essentielle pour quiconque souhaite optimiser son workflow et extraire des insights pertinents de ses données.
Syntaxe de la fonction RECHERCHE pour détecter du texte dans google sheets
La fonction SEARCH (ou RECHERCHE en français) constitue l’outil fondamental pour localiser une chaîne de caractères spécifique au sein d’une cellule. Cette fonction retourne la position numérique du premier caractère de la chaîne recherchée, ou une erreur si le texte n’est pas trouvé. La syntaxe de base s’exprime ainsi : =SEARCH(texte_recherché, texte_source, [position_départ]). Le premier paramètre définit ce que vous cherchez, le second indique où chercher, et le troisième paramètre optionnel spécifie à partir de quelle position commencer la recherche.
L’avantage principal de SEARCH réside dans sa flexibilité et sa capacité à ignorer la casse par défaut. Lorsque vous recherchez « marketing » dans une cellule contenant « Le MARKETING digital évolue », la fonction détectera la correspondance sans difficulté. Cette caractéristique la rend particulièrement adaptée aux environnements où les données proviennent de sources multiples avec des conventions de formatage variables.
Structure de la fonction SEARCH et ses paramètres obligatoires
Les deux premiers paramètres de SEARCH sont indispensables pour son fonctionnement. Le texte recherché peut être une chaîne littérale entre guillemets (« client »), une référence de cellule (A2), ou même le résultat d’une autre fonction. Le texte source représente généralement une référence à la cellule où effectuer la recherche. Par exemple, =SEARCH("facture", B5) cherchera le mot « facture » dans la cellule B5 et retournera sa position si elle est trouvée.
Le paramètre optionnel de position de départ mérite une attention particulière car il permet des recherches sophistiquées. En spécifiant =SEARCH("@", C3, 5), vous demandez à Google Sheets de commencer la recherche du symbole @ uniquement à partir du cinquième caractère de la cellule C3. Cette fonctionnalité devient précieuse lorsque vous devez localiser la deuxième occurrence d’un terme dans une même cellule.
Différence entre SEARCH, FIND et REGEXMATCH pour la détection de chaînes
Google Sheets propose trois fonctions principales pour la détection textuelle, chacune ayant ses spécificités. FIND (ou TROUVE) fonctionne de manière similaire à SEARCH, mais avec une différence cruciale : elle est sensible à la casse. Ainsi, =FIND("Marketing", A1) ne détectera pas « marketing » en minuscules. Cette distinction peut sembler mineure, mais elle influence considérablement le comportement de vos formules.
REGEXMATCH représente l’outil le plus puissant des trois,
car elle repose sur les expressions régulières. Là où SEARCH et FIND cherchent une chaîne exacte, REGEXMATCH vous permet de définir un motif beaucoup plus souple, capable de couvrir plusieurs variantes d’un même texte. En pratique, on réservera SEARCH et FIND aux formules simples “si la cellule contient ce mot précis”, et REGEXMATCH dès qu’il faut gérer des formats, des options, ou des conditions plus complexes.
Dans un tableau marketing, par exemple, =SEARCH("promo", A2) suffit pour savoir si un message parle de promotion. En revanche, si vous devez vérifier qu’une cellule contient soit “promo”, soit “réduction”, soit “soldes”, une expression régulière comme =REGEXMATCH(A2;"promo|réduction|soldes") devient plus adaptée. Vous disposez ainsi d’un éventail progressif : FIND pour les recherches strictes, SEARCH pour les recherches souples sur la casse, et REGEXMATCH pour les cas avancés.
Gestion de la sensibilité à la casse avec EXACT vs SEARCH
La sensibilité à la casse joue un rôle clé lorsque vous créez une formule Google Sheet “si contient un texte précis”. SEARCH ignore la casse, ce qui est pratique dans la majorité des cas, mais parfois vous devez distinguer “VIP” de “vip” ou “Email” de “email”. C’est là que la fonction EXACT intervient, puisqu’elle compare deux chaînes en tenant compte des majuscules et minuscules.
La syntaxe d’EXACT est simple : =EXACT(texte1; texte2) renvoie TRUE si les deux textes sont identiques caractère par caractère, casse comprise. Pour mimer un “contient” sensible à la casse, on combine souvent EXACT avec MID ou LEFT/RIGHT, ce qui revient à comparer un extrait du texte source à un motif donné. Même si cette approche est plus technique, elle reste utile dans les contextes réglementaires ou techniques où “ID” et “id” n’ont pas la même signification.
En pratique, vous pouvez adopter un compromis : utiliser SEARCH pour la majorité de vos contrôles textuels, puis réserver EXACT aux quelques cas critiques qui exigent une concordance parfaite. Vous évitez ainsi des formules trop rigides tout en sécurisant les champs sensibles, comme les codes produits ou les statuts internes. Cette combinaison vous donne un contrôle fin sur la façon dont Google Sheets interprète vos données textuelles.
Utilisation des caractères génériques astérisque et point d’interrogation
Lorsqu’il s’agit de rechercher un texte partiel ou un motif flou, les caractères génériques sont vos meilleurs alliés. L’astérisque * représente “zéro ou plusieurs caractères”, tandis que le point d’interrogation ? symbolise “un caractère unique”. Bien que SEARCH ne gère pas directement ces jokers comme dans Excel, ils deviennent très puissants dès que vous utilisez des fonctions comme COUNTIF, SUMIF ou certaines formules de filtrage.
Par exemple, une formule Google Sheet comme =COUNTIF(A:A;"*facture*") compte toutes les cellules contenant le mot “facture”, qu’il apparaisse au début, au milieu ou à la fin de la phrase. De la même façon, =COUNTIF(B:B;"FR???") permet de repérer tous les codes commençant par “FR” suivis de trois caractères. On obtient ainsi une détection textuelle simple, très lisible, idéale pour les équipes non techniques.
On peut voir ces caractères génériques comme des “trous” dans un puzzle : vous définissez le cadre, et Google Sheets accepte toutes les pièces qui rentrent dans cette forme. Dès que vos besoins dépassent ce niveau (formats d’e-mails, combinaisons de mots, etc.), vous passerez naturellement aux expressions régulières avec REGEXMATCH. Mais pour la plupart des contrôles opérationnels courants, astérisque et point d’interrogation restent des solutions rapides et efficaces.
Formules conditionnelles IF combinées avec ISNUMBER et SEARCH
Construction de la formule IF(ISNUMBER(SEARCH())) pas à pas
Pour créer une formule Google Sheet “si contient un texte précis”, la combinaison la plus répandue reste IF(ISNUMBER(SEARCH())). Pourquoi ? Parce que SEARCH renvoie la position du texte trouvé sous forme de nombre, et ISNUMBER permet de transformer cette information en condition logique TRUE/FALSE. C’est cette valeur logique que la fonction IF va ensuite exploiter pour retourner le résultat souhaité.
Construisons-la étape par étape. Partons d’abord de =SEARCH("urgent"; A2), qui renvoie par exemple 5 si le mot “urgent” commence au 5e caractère. Ensuite, enveloppez-la dans ISNUMBER : =ISNUMBER(SEARCH("urgent"; A2)) renverra TRUE si le texte est trouvé, ou une erreur si ce n’est pas le cas. Enfin, placez cette expression dans IF : =IF(ISNUMBER(SEARCH("urgent"; A2)); "Ticket prioritaire"; "Standard").
Vous obtenez ainsi une formule lisible : si la cellule A2 contient “urgent”, le ticket est marqué comme prioritaire, sinon il reste standard. Vous pouvez décliner ce modèle à l’infini pour vos emails, vos commentaires clients ou vos colonnes de statut projet. C’est un peu comme installer un détecteur automatique de mots-clés qui déclenche immédiatement l’action appropriée.
Traitement des erreurs #VALUE avec IFERROR dans les recherches textuelles
Si vous testez SEARCH sur une cellule qui ne contient pas le texte recherché, Google Sheets renvoie une erreur #VALUE!. Ce comportement est normal, mais il peut gêner vos tableaux de bord, surtout si vous affichez les résultats à des collègues moins familiers des erreurs de formules. Pour rendre votre formule plus robuste, vous pouvez encapsuler SEARCH ou l’ensemble de la construction dans IFERROR.
Une approche simple consiste à écrire : =IFERROR(SEARCH("urgent"; A2); ""), qui renverra une chaîne vide au lieu d’une erreur lorsque le mot n’est pas trouvé. Plus souvent, on combine directement avec IF : =IF(IFERROR(ISNUMBER(SEARCH("urgent"; A2)); FALSE); "Prioritaire"; "Standard"). Ici, IFERROR transforme l’erreur potentielle en FALSE, ce qui permet à la logique conditionnelle de rester propre.
Cette gestion des erreurs est cruciale dès que vous appliquez vos formules à des centaines ou des milliers de lignes. Elle évite d’avoir des colonnes “polluées” par des #VALUE! et rend vos feuilles de calcul plus lisibles. En pratique, dès que vous travaillez avec des recherches textuelles susceptibles d’échouer, prenez le réflexe d’ajouter IFERROR pour lisser les cas négatifs.
Application de conditions multiples avec AND et OR dans les tests de contenu
Vos données textuelles sont rarement binaires. Vous pouvez vouloir marquer une ligne comme “à risque” si elle contient à la fois “retard” et “litige”, ou comme “prospect chaud” si elle contient “appel” ou “démonstration”. Pour ces scénarios, les opérateurs logiques AND et OR deviennent indispensables. Ils vous permettent de combiner plusieurs tests ISNUMBER(SEARCH()) au sein d’une même formule conditionnelle.
Par exemple, pour vérifier si une description contient à la fois “retard” et “facture”, vous pouvez utiliser : =IF(AND(ISNUMBER(SEARCH("retard"; A2)); ISNUMBER(SEARCH("facture"; A2))); "Dossier sensible"; "Normal"). À l’inverse, pour un cas “au moins un des deux mots”, écrivez : =IF(OR(ISNUMBER(SEARCH("appel"; B2)); ISNUMBER(SEARCH("démonstration"; B2))); "Prospect chaud"; "Prospect froid"). Vous transformez ainsi vos mots-clés en véritables règles métier.
On peut comparer AND et OR à des filtres de recherche avancée dans un outil CRM : vous définissez vos critères, et Google Sheets fait le tri pour vous. Plus vos jeux de données grandissent, plus ces combinaisons vous évitent des tri manuels fastidieux. N’hésitez pas à tester plusieurs variantes sur un petit échantillon de lignes avant de déployer vos formules sur l’ensemble d’une colonne.
Retourner des valeurs personnalisées selon la présence du texte recherché
Un des grands atouts des formules conditionnelles est de pouvoir renvoyer autre chose qu’un simple “Oui/Non”. Dans Google Sheets, vous pouvez retourner un texte personnalisé, une valeur numérique, un code couleur (via mise en forme conditionnelle), ou même construire une chaîne dynamique à partir du contenu détecté. Cette souplesse est essentielle pour intégrer vos contrôles textuels dans un reporting exploitable.
Par exemple, vous pouvez attribuer un score en fonction de la présence d’un mot-clé : =IF(ISNUMBER(SEARCH("remboursement"; A2)); 10; 0). Sur une autre colonne, vous pouvez générer une étiquette lisible pour les équipes commerciales : =IF(ISNUMBER(SEARCH("réclamation"; A2)); "Client insatisfait"; "Client neutre"). Vous obtenez ainsi des colonnes dérivées prêtes à être utilisées dans des graphiques ou des tableaux croisés dynamiques.
En combinant plusieurs tests, vous pouvez même construire des messages contextualisés, par exemple : =IF(ISNUMBER(SEARCH("urgent"; A2)); "Action immédiate - " & A2; A2). Cette technique revient à coller automatiquement un “post-it numérique” sur les lignes importantes. Plus vos règles sont claires, plus vos collaborateurs peuvent les interpréter sans avoir à plonger dans la logique des formules.
Techniques avancées avec REGEXMATCH pour les correspondances complexes
Patterns regex pour détecter des formats spécifiques emails, URLs et codes postaux
Dès que vous devez vérifier des formats structurés (adresses e-mail, URLs, codes postaux), les fonctions basées sur les expressions régulières deviennent incontournables. REGEXMATCH vous permet de tester si une cellule respecte un motif précis, bien plus puissant qu’un simple “contient un texte”. C’est comme passer vos données dans un gabarit : seules celles qui ont la bonne forme sont acceptées.
Pour contrôler rapidement si une cellule ressemble à une adresse e-mail, vous pouvez utiliser un motif simple comme : =REGEXMATCH(A2;"^[^@]+@[^@]+.[^@]+$"). Ce pattern vérifie qu’il y a du texte avant et après le @, puis un point suivi d’au moins un caractère. Pour repérer une URL basique, un motif courant est : =REGEXMATCH(A2;"^(https?://)?[A-Za-z0-9.-]+.[A-Za-z]{2,}"), qui accepte à la fois http et https.
Pour les codes postaux français, un pattern simple est : =REGEXMATCH(A2;"^[0-9]{5}$"), qui ne valide que les chaînes composées de cinq chiffres. Vous pouvez combiner ces tests avec IF afin d’indiquer clairement si la donnée est valide ou non, par exemple : =IF(REGEXMATCH(A2;"^[0-9]{5}$"); "Code postal valide"; "Format incorrect"). Vous gagnez ainsi un outil puissant de contrôle de qualité des données directement dans Google Sheets.
Utilisation des groupes de capture et des alternances dans les expressions régulières
Les groupes de capture et l’alternance sont deux concepts clés pour écrire des expressions régulières plus expressives. Les parenthèses () servent à regrouper des parties du motif, et le symbole | indique une alternance, c’est-à-dire “ou”. Pour la détection, REGEXMATCH n’utilise pas directement la valeur capturée, mais ces constructions permettent de couvrir plusieurs variantes en une seule formule.
Imaginons que vous souhaitiez détecter tous les messages contenant soit “promo”, soit “soldes”, soit “réduction”. Au lieu d’écrire trois formules séparées, vous pouvez utiliser : =REGEXMATCH(A2;"promo|soldes|réduction"). Vous pouvez aussi combiner avec des variantes d’orthographe ou d’accentuation, par exemple : =REGEXMATCH(A2;"(remboursement|remboursé|remboursee)"). Un seul motif couvre alors plusieurs tournures utilisées par vos clients.
Ces mêmes groupes deviennent encore plus intéressants lorsque vous passez à REGEXEXTRACT, qui renvoie précisément la partie capturée par les parenthèses. Même si nous détaillerons cet aspect plus loin, il est utile de garder en tête cette analogie : REGEXMATCH répond à la question “est-ce que ce texte suit l’un de ces schémas ?”, tandis que REGEXEXTRACT répond à “quelle partie du texte correspond exactement à ce schéma ?”. Ensemble, ils offrent un arsenal complet pour l’analyse textuelle.
Combinaison REGEXMATCH avec SUMIF et COUNTIF pour agrégations conditionnelles
Pour passer de la simple détection textuelle à l’analyse quantitative, vous pouvez combiner REGEXMATCH avec des fonctions d’agrégation. Google Sheets ne permet pas directement SUMIF avec un critère regex, mais vous pouvez contourner cette limite avec des formules matricielles. L’idée est de transformer d’abord le résultat de REGEXMATCH en 1 ou 0, puis de sommer ces valeurs.
Par exemple, pour compter le nombre de lignes de la colonne A contenant un code promo commençant par “PROMO” suivi de chiffres, vous pouvez utiliser : =SUM(ArrayFormula(--REGEXMATCH(A2:A100;"PROMO[0-9]+"))). Ici, REGEXMATCH renvoie une matrice de TRUE/FALSE, le double signe moins -- la convertit en 1/0, et SUM ajoute le tout. Vous obtenez un équivalent de COUNTIF avec critère regex.
La même logique s’applique pour des totaux conditionnels avec SUM. Vous pouvez utiliser IF dans une formule matricielle, par exemple : =SUM(ArrayFormula(IF(REGEXMATCH(A2:A100;"(urgent|critique)"); B2:B100; 0))). Cette formule ajoute uniquement les valeurs de B lorsque la description en A contient l’un des mots-clés “urgent” ou “critique”. Vous transformez ainsi vos textes en filtres d’agrégation sophistiqués, sans quitter Google Sheets.
Formules matricielles ARRAYFORMULA pour appliquer la recherche sur des plages
Syntaxe ARRAYFORMULA avec SEARCH pour traiter des colonnes entières
Lorsque vous travaillez sur des dizaines de milliers de lignes, recopier une formule dans chaque cellule devient vite ingérable. C’est là que ARRAYFORMULA intervient, en appliquant automatiquement une formule à une plage entière. Combinée avec SEARCH, elle vous permet de créer en une seule fois une colonne entière de “si contient un texte précis”.
Un exemple typique serait : =ArrayFormula(IF(A2:A=""; ""; IF(ISNUMBER(SEARCH("urgent"; A2:A)); "Oui"; "Non"))). Cette formule parcourt toute la colonne A à partir de la ligne 2, laisse les lignes vides intactes, et écrit “Oui” ou “Non” selon que le mot “urgent” est présent. Vous placez cette formule en tête de colonne, et elle se déploie automatiquement sur toutes les lignes remplies.
On peut voir ARRAYFORMULA comme un “mode groupe” pour vos fonctions textuelles. Plutôt que de gérer chaque cellule individuellement, vous décrivez une règle générale que Google Sheets applique ensuite à toute la plage. Cette approche réduit les risques d’erreurs de recopie et améliore nettement la maintenabilité de vos feuilles sur le long terme.
Optimisation des performances avec MAP et LAMBDA pour itérations personnalisées
Sur les versions récentes de Google Sheets, les fonctions MAP et LAMBDA permettent d’aller encore plus loin dans le traitement de texte par lot. MAP applique une fonction personnalisée à chaque élément d’une plage, tandis que LAMBDA vous aide à définir cette fonction directement dans votre formule. Cela revient à écrire du code, mais en restant dans l’interface classique des formules.
Par exemple, pour marquer chaque ligne de A2:A comme “Prioritaire” si elle contient “urgent”, vous pouvez écrire : =MAP(A2:A; LAMBDA(x; IF(x=""; ""; IF(ISNUMBER(SEARCH("urgent"; x)); "Prioritaire"; "Standard")))). Ici, x représente la cellule courante, et la logique à l’intérieur de LAMBDA est appliquée à toute la colonne. Vous obtenez une formule compacte, lisible, et facilement réutilisable.
Cette approche est particulièrement intéressante pour les cas où vous devez enchaîner plusieurs tests textuels complexes. Au lieu d’écrire une gigantesque formule IF imbriquée, vous pouvez structurer votre logique à l’intérieur d’un LAMBDA réutilisable. En termes de performance, vous limitez aussi le nombre d’appels internes, ce qui peut accélérer vos feuilles volumineuses.
Filtrage dynamique avec FILTER et conditions textuelles multiples
Au-delà de l’étiquetage des lignes, vous pouvez vouloir créer une vue spécifique ne montrant que les enregistrements contenant certains mots-clés. La fonction FILTER est idéale pour construire ce type de tableau dynamique. Elle renvoie uniquement les lignes qui satisfont à une ou plusieurs conditions, y compris des conditions textuelles basées sur SEARCH ou REGEXMATCH.
Par exemple, pour extraire toutes les lignes de A2:B100 dont la description en colonne A contient “erreur”, vous pouvez utiliser : =FILTER(A2:B100; ISNUMBER(SEARCH("erreur"; A2:A100))). Vous obtenez ainsi un sous-tableau mis à jour automatiquement dès que de nouvelles lignes sont ajoutées. Pour plusieurs mots-clés, vous pouvez combiner les conditions avec + (équivalent de OR) ou * (équivalent de AND) dans une formule matricielle.
Pour un cas plus avancé avec expressions régulières, la formule suivante extrait les lignes contenant “urgent” ou “critique” : =FILTER(A2:B100; REGEXMATCH(A2:A100;"(urgent|critique)")). Vous créez ainsi des vues thématiques de vos données, comme des files de tickets par priorité ou des segments de clients par type de demande. C’est un excellent moyen de transformer une simple feuille de calcul en tableau de bord dynamique.
Cas pratiques de détection textuelle dans google sheets
Extraction de données depuis des cellules contenant des mots-clés spécifiques
Dans de nombreux cas métiers, l’objectif n’est pas seulement de savoir si un texte est présent, mais aussi d’en extraire une partie. Par exemple, récupérer un numéro de commande, un code promo ou un identifiant caché dans une phrase. Pour cela, vous pouvez combiner SEARCH, MID et parfois LEN, ou passer directement à REGEXEXTRACT pour davantage de flexibilité.
Supposons qu’une cellule contienne la phrase “Commande #12345 livrée”. Pour extraire le numéro, vous pouvez repérer la position du # avec SEARCH, puis prendre les caractères qui suivent : =MID(A2; SEARCH("#"; A2)+1; 5). Cette méthode fonctionne bien si la longueur du code est constante. Dès que la longueur varie, une expression régulière comme =REGEXEXTRACT(A2;"#([0-9]+)") devient plus adaptée.
On peut comparer ces techniques à l’utilisation d’un surligneur numérique : vous demandez à Google Sheets de repérer un mot-clé, puis de “surligner” (extraire) ce qui vous intéresse autour. En automatisant ce travail, vous évitez des heures de copier-coller manuel et réduisez considérablement les risques d’erreur lors de la préparation de vos rapports.
Catégorisation automatique avec SWITCH et recherches textuelles imbriquées
Pour classer vos lignes en catégories en fonction des mots-clés présents, la fonction SWITCH peut offrir une alternative plus lisible qu’une succession de IF. L’idée est de transformer vos tests textuels (via REGEXMATCH ou ISNUMBER(SEARCH())) en une série de cas à traiter. C’est très utile pour segmenter des tickets de support, des feedbacks clients ou des leads marketing.
Comme SWITCH travaille sur une seule expression, on utilise souvent un petit “truc” consistant à convertir les résultats des tests en étiquettes intermédiaires. Par exemple : =SWITCH(TRUE; REGEXMATCH(A2;"remboursement"); "Finance"; REGEXMATCH(A2;"bug|erreur"); "Technique"; REGEXMATCH(A2;"inscription|compte"); "Onboarding"; "Autre"). Ici, nous passons TRUE en première position et faisons évaluer chaque condition l’une après l’autre.
Cette structure rend la logique métier plus facile à lire par un œil non technique. Vous pouvez expliquer à un collègue : “si le texte parle de remboursement, on le met en Finance ; s’il mentionne un bug, on le met en Technique, etc.”. Vous obtenez ainsi une catégorisation automatique alignée sur votre organisation interne, sans intervention manuelle quotidienne.
Validation conditionnelle et mise en forme avec règles personnalisées basées sur SEARCH
Les formules de détection textuelle ne servent pas uniquement dans les cellules : elles peuvent aussi alimenter des règles de mise en forme conditionnelle et de validation de données. Cela vous permet de surligner automatiquement les lignes importantes ou de bloquer la saisie de valeurs invalides en fonction du texte. C’est un excellent moyen d’améliorer la qualité de vos données directement à la source.
Pour surligner toutes les lignes contenant le mot “urgent”, vous pouvez créer une règle de mise en forme conditionnelle avec la formule personnalisée =ISNUMBER(SEARCH("urgent"; $A2)) appliquée à la plage entière, par exemple A2:D1000. À chaque fois qu’un utilisateur saisit “urgent” dans la colonne A, la ligne entière se colore automatiquement. Vous transformez ainsi vos mots-clés en signaux visuels immédiats.
Pour la validation de données, vous pouvez utiliser une formule comme =REGEXMATCH(A2;"^[0-9]{5}$") pour imposer un format de code postal, ou =REGEXMATCH(A2;"^[^@]+@[^@]+.[^@]+$") pour vérifier rapidement une adresse e-mail. Les utilisateurs reçoivent un message d’erreur si le texte ne respecte pas le motif attendu. Au fil du temps, ces garde-fous réduisent fortement les anomalies dans vos bases Google Sheets.
Nettoyage de données et identification de doublons partiels avec REGEXEXTRACT
Lors d’un nettoyage de données, il est fréquent de rencontrer des doublons “partiels” : les mêmes informations apparaissent sous des formes légèrement différentes, parfois avec du texte en plus. REGEXEXTRACT peut vous aider à isoler la partie stable (par exemple un identifiant, un numéro de contrat ou un code client), afin de détecter plus facilement ces doublons. Vous créez ainsi une clé normalisée à partir d’un texte hétérogène.
Imaginons des cellules comme “Client 123 – Paris”, “Client n°123 (Paris)” ou “CLT-123 / FR”. Un motif comme =REGEXEXTRACT(A2;"[0-9]{3}") permet d’extraire systématiquement le “123”, quel que soit le contexte autour. Vous pouvez ensuite utiliser cette colonne d’identifiants extraits pour chercher des doublons avec COUNTIF ou des mises en forme conditionnelles.
Cette approche revient à dégager le “noyau” structuré de vos textes pour les rendre comparables. Une fois ce noyau mis en évidence, vous pouvez regrouper, dédoublonner et fiabiliser vos bases beaucoup plus facilement. En combinant REGEXEXTRACT, REGEXMATCH et quelques fonctions conditionnelles, Google Sheets devient un véritable outil de data cleaning, sans nécessiter d’outils externes plus complexes.