DÉCLICN°167
Octobre 2015

Sommaire :

1. Rappel sur la "Recherche et suppression des doublons"
2. Service Déclic de dédoublonnage sur devis
3. Au sommaire de DéclicN°168

 

1. Rappel sur la "Recherche et suppression des doublons"
L'importante fonction "Recherche et suppression des doublons" a notablement évolué depuis qu'elle a été exposée lors de sa création, notamment dans Déclic News N°57. Elle est rappelée ci-dessous avec les compléments et les améliorations qui y ont été apportés depuis.
1.1 Rappel de la terminologie et méthode utilisées
Une "zone identifiante" est une zone qui permet de retrouver les doubles. Généralement la zone identifiante utilisée est le téléphone, car si 2 fiches ont même téléphone elles correspondent à la même entreprise et sont donc en double.
Une "fiche en double" est une fiche dont le contenu de la "zone identifiante" se retrouve dans au moins une autre fiche. Les 2 fiches correspondent donc généralement à la même entreprise et l'une des deux doit normalement être supprimée.
Une "série de fiches en double" est constituée des fiches dont le contenu de la "zone identifiante" est identique (par ex. toutes les fiches qui ont un même téléphone). Un tri sur la "zone identifiante" rend les fiches de chaque "série de fiches en double" consécutives.
La "suppression des doublons" consiste à supprimer, pour chaque "série de fiches en double" toutes les fiches sauf une, la "meilleure fiche de la série" (par ex. supprimer toutes les fiches de même téléphone sauf celle que l'on souhaite conserver).
Dans certains cas il est nécessaire, avant la suppression, de regrouper des informations de plusieurs fiches de la série, opération qui ne peut pas être automatisée.
La "zone qualifiante" est la zone qui, utilisée en second critère de tri, permet de placer la "meilleure fiche de la série" toujours en-tête (ou toujours en queue) de chaque série. Par exemple, dans le cas fréquent où les fiches à dédoublonner proviennent de différentes sources de données, on souhaite généralement conserver en priorité les fiches de la source la plus fiable. Dans ce cas la "zone qualifiante" sera la zone source ou origine.

1.2 Description de la nouvelle fonction de recherche et suppression des doublons

La fonction "Recherche et de suppression des Doublons" se trouve dans les "Fonctions Spéciales" de l'écran "Outils".
La fonction commence par afficher l'écran ci-contre. 

Le nota en rouge de la figure rappelle que, préalablement au lancement de la fonction, il convient de trier sur la "zone identifiante" en premier critère et sur la "zone qualifiante" en second critère (si possible) de façon à rendre les fiches de chaque "série de fiches en double" consécutives avec la meilleure toujours en-tête (ou toujours en queue).

Comme le montre l'écran ci-dessus, 3 types de repérage sont proposés:
. Repérer les doublons sauf  les premiers de chaque série de doublons (série correspondant à un même téléphone).
. Repérer les doublons sauf  les derniers de chaque série de doublons.
Ces 2 premières options sont très similaires. Dans l'exemple des téléphones, elles reviennent à repérer avec la coche blanche les fiches ayant le même téléphone sauf une (la première ou la dernière de chaque série). Si après exécution de la fonction, on supprime les fiches repérées par la coche blanche, on obtient une base de données sans doublon (toutes les fiches ont des téléphones différents).
Le premier exemple ci-dessous présente un exemple caractéristique de ce mode de repérage.
. Repérer tous les doublons y compris le premier et le dernier de chaque série de doublons.
Le second exemple ci-dessous montre l'intérêt du dernier mode de repérage
Dans les 3 options ci-dessus décrites:
Nota: Le repérage s'effectue systématiquement avec la Coche Blanche dont l'ancienne configuration est perdue. Il n'est pas nécessaire d'effacer préalablement les coches blanches car les repérages effacent les coches blanches des fiches non repérées.
Rappelons que la coche blanche est réservée à ce genre de repérage occasionnel.
Grâce à ses 2 boutons de défilement qui l'entourent, la coche blanche permet de faire défiler les fiches repérées, en l'occurrence de parcourir les doublons pour les examiner et les contrôler.

Dans la détection des doublons il n'est pas tenu compte des blancs avant et après, ainsi que de la casse (majuscule, minuscule).

1.3 Deux exemples caractéristiques de repérage et suppression de doublons :
Exemple 1. Suppression de doublons sur le téléphone en conservant de préférence les fiches pour lesquelles le Fax est renseigné.
Cet exemple correspond au cas classique de suppression de fiches en double en conservant la mieux renseignée.
Une telle suppression de doublons peut s'effectuer très simplement:
. tri des fiches sur le téléphone et sur le fax en second critère. Les fiches ayant le même téléphone deviendront consécutives avec en- tête les fiches dépourvues de fax (zone fax vide).
. repérage des doublons sauf le dernier avec la coche (2ème option)
. suppression des fiches repérées par la coche blanche
Dans les fiches résiduelles, pour chaque téléphone il n'y aura qu'une seule fiche, avec un fax s'il existait une fiche avec ce téléphone et un fax dans les fiches de départ.

Exemple 2. Suppression des fiches à l'aide d'une liste de désabonnement d'un emailing (ou d'un faxmailing)
La liste de désabonnement se présente comme un tableau d'une colonne en format Excel (ou Texte délimité si le nombre de lignes dépasse 65.000). La suppression des fiches dont l'Email (ou le fax) figurent dans la liste s'effectue comme suit:
. Insertion d'une en-tête à la liste (titre de la zone email ou fax)
. Importation de la liste, c'est à dire création d'une fiche par entrée de la liste contenant uniquement l'email (ou le fax)
. Tri de la base de données sur l'email (ou le fax)
.
Repérage de tous les doublons (3ème option)
. Suppression des fiches repérées par la coche blanche qui supprimera à la fois les fiches qui viennent d'être importées et les fiches qui portent le même téléphone (ou fax).

Notons l'intérêt  de Déclic pour le traitement des doublons des grandes bases de données (plus de 65.000 fiches) pour lesquelles l'utilisation d'Excel est impossible.

 

2. Service Déclic de dédoublonnage sur devis
Le dédoublonnage est une opération généralement complexe dont les modalités dépendent de la nature du fichier et de son utilisation.
Par exemple pour un fichier relatif à des entreprises moyennes ou grandes, le N° de téléphone est presque toujours un critère efficace et simple de dédoublonnage.
Mais il n'en est pas de même pour les professions médicales, dans lesquelles plusieurs professionnels peuvent travailler dans le même cabinet, avec le même N° de téléphone.

 

S'il n'existe pas de zone "Identifiante" la recherche de fiches en double est beaucoup plus complexe. I conviendra, généralement de créer une zone identifiante dans une zone inutilisée par regroupement de plusieurs zones existantes (par exemple l'Entreprise et la Ville) avec des règles généralement difficiles à automatiser.

Dans tous les cas, reste à définir ou à créer une zone qualifiante permettant de choisir l'entreprise à conserver dans un lot de doublons.

 

Il s'en suit que pour un dédoublonnage spécifique, un devis préalable est indispensable.

Le coût d'un dédoublonnage, qui dépend de la taille et de la complexité du fichier, se situe généralement entre 300 et 700 € HT.

Pour ce type de services nous disposons d'outils et d'un savoir faire nous permettant d'assurer des prestations de qualité, à des prix compétitifs.

 


3. Au sommaire de DéclicN°168 et suivantes:

. Réparation, à l'ouverture d'une base de données dégradée.

. Création et utilisation d'une base Archive.

. Amélioration de l'utilisation du presse papier dans Déclic (conservation de l'historique)
 

Les Déclic Précédentes sont disponibles à l'adresse:

http://www.declic-prospection.com/declic_news_historique.htm

Grâce à vos suggestions, les logiciels Déclic évoluent et s'améliorent constamment..
Merci de me communiquer vos remarques et critiques à :
virginie.s@declic-marketing.com

 

Pour vous désabonner répondez avec "Désabonner" dans l'objet.

 

Lettre mensuelle éditée par Déclic Marketing S.A.
RC:Pontoise 404 441 776   Tel:01.30.30.60.70