DÉCLICN°187
Janvier 2018

Sommaire :

1. Terminologie, notions de base sur les doublons
2.
Sélection, repérage des doublons
3. Comtrôle, suppression des doublons
4. Au sommaire de DéclicN°177

 

La fonction "Recherche et suppression des doublons" a beaucoup évolué depuis sa création en octobre 2005, cf. Déclic News N°57. Elle est revisitée ci-dessous avec ses améliorations et compléments.

1. Terminologie sur les doublons. Notions de base
Ci-dessous les principaux termes utilisés et leur définition:

Fiche(s) en double. Une ou plusieurs fiche sont en double si elles correspondent au même prospect (entreprise ou particulier) et s'il convient de les fusionner et de n'en conserver qu'une seule

est une fiche dont le contenu de la "zone identifiante" se retrouve dans au moins une autre fiche. Les 2 fiches correspondent donc généralement à la même entreprise et l'une des deux doit normalement être supprimée.

Zone identifiante. C'est une zone qui permet (ou contribue à permettre) d'identifier les doubles. La zone identifiante la plus utilisée est le téléphone, car si 2 fiches ont même téléphone elles correspondent généralement à la même entreprise et sont donc en double. L'email et l'Entreprise peuvent aussi être utilisées pour identifier les doubles
Un tri sur la "zone identifiante" rend les fiches de chaque "série de fiches en double" consécutives.
Suppression des doublons. Opération qui consiste à supprimer, pour chaque "série de fiches en double" toutes les fiches sauf une, la "meilleure fiche de la série" (par ex. supprimer toutes les fiches de même téléphone sauf celle que l'on souhaite conserver).
Dans certains cas il est nécessaire, avant la suppression, de regrouper des informations de plusieurs fiches de la série, opération qui ne peut pas être automatisée.
Zone qualifiante. Zone qui, utilisée en second critère de tri, permet de placer la "meilleure fiche de la série" toujours en-tête (ou toujours en queue) de chaque série. Par exemple, dans le cas fréquent où les fiches à dédoublonner proviennent de différentes sources de données, on souhaite généralement conserver en priorité les fiches de la source la plus fiable. Dans ce cas la "zone qualifiante" sera la zone source ou origine.

2 Fonction de recherche et repérage des doublons

Cette fonction se trouve dans les "Fonctions Spéciales" de l'écran "Outils". La fonction commence par afficher l'écran ci-contre. 
Le nota en rouge de la figure rappelle que, préalablement au lancement de la fonction, il convient de trier sur la "zone identifiante" en premier critère et sur la "zone qualifiante" en second critère (si possible) de façon à rendre les fiches de chaque "série de fiches en double" consécutives avec la meilleure toujours en-tête (ou toujours en queue).
Comme le montre l'écran ci-dessus, 3 types de repérage sont proposés:

. Repérer les doublons sauf  les premiers de chaque série de doublons (série correspondant à un même téléphone).
. Repérer les doublons sauf  les derniers de chaque série de doublons.
. Repérer tous les doublons y compris le premier et le dernier de chaque série de doublons.
Nota: Le repérage s'effectue systématiquement avec la Coche Blanche dont l'ancienne configuration est perdue. Il n'est pas nécessaire d'effacer préalablement les coches blanches.
Rappelons que la coche blanche est réservée à ce genre de repérage occasionnel.
3 Contrôle et suppression des doublons
Les 2 premières options ci-dessus sont très similaires. Pour simplifier donnons un exemple, celui de la zone identifiante téléphone. Ce 2 options consistent à repérer avec la coche blanche les fiches ayant le même téléphone sauf une (la première ou la dernière de chaque série). Si après exécution de la fonction, on supprime les fiches repérées par la coche blanche, on obtient une base de données sans doublon (toutes les fiches ont des téléphones différents).
Grâce à ses 2 boutons de défilement qui l'entourent, la coche blanche permet de faire défiler les fiches repérées (c'est à dire de parcourir les doublons) pour les examiner, les contrôler et ajuster le repérage.
Dans la détection des doublons il n'est pas tenu compte des blancs avant et après, ainsi que de la casse (majuscule, minuscule).

Pour terminer la suppression des doublons, il suffit de supprimer les fiches repérées par la coche blanche.


4. Au sommaire de DéclicN°188 et suivantes:

. Sercice Déclic de dé-doublonnage d'une base de données.
. Amélioration  de la boucle de synchronisation (Option de traitement N° 20).
. Amélioration de l'utilisation du presse papier dans Déclic (conservation de l'historique)

 

Les Déclic Précédentes sont disponibles à l'adresse:

http://www.declic-prospection.com/declic_news_historique.htm

Grâce à vos suggestions, les logiciels Déclic évoluent et s'améliorent constamment..
Merci de me communiquer vos remarques et critiques à :
virginie.s@declic-marketing.com

 

Pour vous désabonner répondez avec "Désabonner" dans l'objet.

 

Lettre mensuelle éditée par Déclic Marketing S.A.
RC:Pontoise 404 441 776   Tel:01.30.30.60.70