DÉCLICN°176
Juillet 2015

Sommaire :

1. Notions de base et terminologie sur les doublons
2. Recherche, repérage des doublons
3. Comtrôle, fusion et suppression des doublons
4. Au sommaire de DéclicN°177

 

La fonction "Recherche et suppression des doublons" a beaucoup évolué depuis sa création exposée dans Déclic News N°57. Elle est rappelée ci-dessous avec les améliorations et les compléments qui y ont été apportés.

1. Notions de base et terminologie sur les doublons
Fiche(s) en double. Une ou plusieurs fiche sont en double si elles correspondent au même prospect (entreprise ou particulier) et s'il convient de les fusionner et de n'en conserver qu'une seule

est une fiche dont le contenu de la "zone identifiante" se retrouve dans au moins une autre fiche. Les 2 fiches correspondent donc généralement à la même entreprise et l'une des deux doit normalement être supprimée.

Zone identifiante. C'est une zone qui permet (ou contribue à permettre) d'identifier les doubles. La zone identifiante la plus utilisée est le téléphone, car si 2 fiches ont même téléphone elles correspondent généralement à la même entreprise et sont donc en double. L'email et l'Entreprise peuvent aussi être utilisées pour identifier les doubles
Un tri sur la "zone identifiante" rend les fiches de chaque "série de fiches en double" consécutives.
Suppression des doublons. Opération qui consiste à supprimer, pour chaque "série de fiches en double" toutes les fiches sauf une, la "meilleure fiche de la série" (par ex. supprimer toutes les fiches de même téléphone sauf celle que l'on souhaite conserver).
Dans certains cas il est nécessaire, avant la suppression, de regrouper des informations de plusieurs fiches de la série, opération qui ne peut pas être automatisée.
Zone qualifiante. Zone qui, utilisée en second critère de tri, permet de placer la "meilleure fiche de la série" toujours en-tête (ou toujours en queue) de chaque série. Par exemple, dans le cas fréquent où les fiches à dédoublonner proviennent de différentes sources de données, on souhaite généralement conserver en priorité les fiches de la source la plus fiable. Dans ce cas la "zone qualifiante" sera la zone source ou origine.

2 Fonction de recherche et repérage des doublons

Cette fonction se trouve dans les "Fonctions Spéciales" de l'écran "Outils". La fonction commence par afficher l'écran ci-contre. 
Le nota en rouge de la figure rappelle que, préalablement au lancement de la fonction, il convient de trier sur la "zone identifiante" en premier critère et sur la "zone qualifiante" en second critère (si possible) de façon à rendre les fiches de chaque "série de fiches en double" consécutives avec la meilleure toujours en-tête (ou toujours en queue).
Comme le montre l'écran ci-dessus, 3 types de repérage sont proposés:

. Repérer les doublons sauf  les premiers de chaque série de doublons (série correspondant à un même téléphone).
. Repérer les doublons sauf  les derniers de chaque série de doublons.
. Repérer tous les doublons y compris le premier et le dernier de chaque série de doublons.
Nota: Le repérage s'effectue systématiquement avec la Coche Blanche dont l'ancienne configuration est perdue. Il n'est pas nécessaire d'effacer préalablement les coches blanches car les repérages effacent les coches blanches des fiches non repérées.
Rappelons que la coche blanche est réservée à ce genre de repérage occasionnel.
3 Contrôle et suppression des doublons
Les 2 premières options ci-dessus sont très similaires. Dans l'exemple des téléphones, elles reviennent à repérer avec la coche blanche les fiches ayant le même téléphone sauf une (la première ou la dernière de chaque série). Si après exécution de la fonction, on supprime les fiches repérées par la coche blanche, on obtient une base de données sans doublon (toutes les fiches ont des téléphones différents).
Grâce à ses 2 boutons de défilement qui l'entourent, la coche blanche permet de faire défiler les fiches repérées, en l'occurrence de parcourir les doublons pour les examiner et les contrôler.
Dans la détection des doublons il n'est pas tenu compte des blancs avant et après, ainsi que de la casse (majuscule, minuscule).


4. Au sommaire de DéclicN°177 et suivantes:

. Réparation, à l'ouverture d'une base de données dégradée.

. Création et utilisation d'une base Archive.

. Amélioration de l'utilisation du presse papier dans Déclic (conservation de l'historique)
 

Les Déclic Précédentes sont disponibles à l'adresse:

http://www.declic-prospection.com/declic_news_historique.htm

Grâce à vos suggestions, les logiciels Déclic évoluent et s'améliorent constamment..
Merci de me communiquer vos remarques et critiques à :
virginie.s@declic-marketing.com

 

Pour vous désabonner répondez avec "Désabonner" dans l'objet.

 

Lettre mensuelle éditée par Déclic Marketing S.A.
RC:Pontoise 404 441 776   Tel:01.30.30.60.70