email a friend Contattaci
print this page Stampa Pagina
 
  |    |    |   | Data Management Tools
  Deduplica
  Intro
  Piattaforme
  Vantaggi

 

 

  Contattaci:
 

 

  E' in linea il nuovo portale eQuality:
 

Visitalo e richiedi l'accesso gratuito

 

 

 

 

 

Geolab: GEOUNDUPE, il motore di deduplica

Deduplica

"La presenza di dati duplicati all’interno dei grandi archivi è un fatto noto e difficilmente eliminabile, da un lato per il modo con il quale molte grandi strutture informative si sono evolute nel tempo, dall’altro per le procedure spesso lacunose attraverso le quali si continuano ad alimentare i grandi archivi "

 

    GEOUNDUPE è il prodotto Geolab che affronta il problema della duplicazione dei dati, un fenomeno particolarmente grave quando tocca le informazioni relative alle anagrafiche dei soggetti. Spesso i dati anagrafici relativi a Clienti e Prospect vengono inseriti da differenti divisioni interne all’azienda (Marketing, Customer Care, Ufficio Acquisti, Sedi distaccate) e sovente accade che lo stesso Cliente o contatto venga inserito più volte (spesso con leggere differenze nella scrittura dei dati) all’interno del Sistema Informativo. Questo provoca una difficile gestione del DB e soprattutto gravi problemi allorquando è necessario un contatto con i titolari delle anagrafiche. L’invio simultaneo di due o più comunicazioni (brochures, lettere etc.) al medesimo soggetto rappresenta prima di tutto uno spreco di denaro e in secondo luogo un grave danno di immagine per l’azienda.

  

GEOUNDUPE:

    GeoUNDUPE è il prodotto di deduplica proposto da GeoLab come completamento naturale dei processi di data cleaning svolti tramite il motore di Address Validation GeoADVAL. GeoUNDUPE effettua controlli sia su singoli archivi che su archivi diversi, ritornando in output una lista di probabili doppi e permettendo all’utente di decidere quale strategia adottare nella gestione dei duplicati..

    Il prodotto consente ricerche per similitudine tramite algoritmi di ricerca tassonomica sulle singole stringhe. Ciò consente l’individuazione di elementi doppi anche apparentemente non del tutto identici, garantendo quindi performance molto elevate.

Caratteristiche:

 

 

Flash

La duplicazione dei dati, è un problema che si manifesta sia internamente che esternamente alle aziende.

Da un lato, la difficoltà di collimare anagrafiche diverse (CRM, ERP, Portali) rende difficoltosa la costruzione di una visione unificata coerente dei propri clienti e delle loro attività.

Dall'altro la stessa anagrafica clienti principali, può contenere lo stesso cliente ripetuto più volte

 

 

 

Caratteristiche: Dettaglio:

»  Possibilità di effettuare controlli su archivi di grande estensione (> 5.000.000 record).

Il flusso continuo di dati in ingresso, specialmente in aziende conivolte in un continuo processo di relazione con il mercato consumer, rende il suo trattamento un problema con aspetti di perfomance. E' proprio per problemi di performance, sia del software che degli operatori, che spesso la duplicazione ei dati in azienda è "tollerata" non riuscendo a verificare online sulla anagrafica centrale la qualità del dato immesso.

»  Consente dedupliche su diversi campi, quali l’indirizzo (anche scomposto) e l’anagrafica (nome, cognome, ragione sociale).

La deduplica non è mai un problema univocamente determinato, in alcuni casi vogliamo trattare un record (o un soggetto) come unico anche se evidentemente ripetuto, in altri casi si tende ad unificare la visione cercando di trattare come unici una serie di record differenti.

GEOUNDUPE è largamente configurabile, e può simultaneamente supportare criteri differenti di deduplica e doblonatura, che fanno anche capo a codici esistenti e propri dell'azienda.

»  Possibilità di impostare controlli di univocità per uguaglianza su campi (tramite individuazione codici numerici – MATCHCODE) Per rendere i risultati e la natura stessa del processo di deduplica trattabile anche da sistemi paralleli, è possibile generare CODICI NUMERICI univoci per trattare anche informazioni non numeriche (nomi, cognomi, indirizzi).

»  Completa gestione degli eventuali elementi doppi (GeoUNDUPE durante l’analisi si limita alla segnalazione dei probabili doppi).

Il prodotto di deduplica non sarebbe completo, se nel sua DNA, non includesse il codice necessario ad agire di conseguenza dopo avere individuato uno o più doppi o ambigui.

 

   Torna su ...

 



© Copyright Geolab 2004-2005.