Informatica 9, una completa plataforma d'Integració de Dades

 

En el mercat de la Integració de Dades un dels fabricants líders és Informàtica.Aquesta companyia és el primer proveïdor independent de programari d'Integració de Dades. La seva eina més coneguda, i el cor de la seva plataforma, és Informatica PowerCenter, que ja ha passat per moltes versions, i és una referència en el món de la integració.

Però a part de PowerCenter, Informàtica també disposa d'altres eines que s'orienten a propòsits més específics, al mateix temps que s'integren dins de la plataforma, i sempre en el marc de la Integració de Dades.

La plataforma d'Informatica 9 està ideada per cobrir el cicle de vida complet de la integració de dades, que consta de cinc passos principals: accés, detecció, neteja, integració i lliurament.

Plaataforma de Informatica 9 para cubrir el cliclo completo de vida de la integracion de datos 

Com sol passar amb els grans fabricants de programari, Informàtica disposa de molts productes, opcions i edicions, i pot costar una mica fer-se una idea del que fa cada un, i del que podem necessitar i el que no per a les nostres necessitats, encara que el fet que Informatica sigui un proveïdor independent dedicat exclusivament al programari d'Integració de Dades facilita molt les coses.

En aquest article donaré un repàs als principals productes que componen la plataforma d'Informatica 9, agrupant-los per tipus de problemàtica que resolen, i realitzant una breu descripció de cada un.

 

Integració de dades

  Informatica PowerCenter

  Informatica PowerExchange

 
Qualitat de dades

  Informatica Data Explorer

  Informatica Data Quality 

  Informatica Identity Resolution

 

Intercamvi de dades B2B

  Informatica B2B Data Exchange

  Informatica B2B Data Transformation

 

Gestió del cicle de vida de la Informació

  Informatica Data Archive

  Informatica Data Subset

  Informatica Data Privacy

 

 

Integració de dades

Els productes d'Integració de Dades són els que tenen un ús més genèric i, per fer una analogia, podríem comparar-los amb les eines ETL d'altres fabricants.

Informatica PowerCenter

 

És el que podríem anomenar producte estrella d'Informatica. Permet connectar amb multitud d'orígens de dades en temps real, per lots o fins i tot per captura de canvis en les dades (CDC).

Com altres eines de ETL, permet definir i aplicar sobre aquestes dades les transformacions necessàries i després distribuir als sistemes destinació segons convingui.

De PowerCenter jo destacaria la facilitat d'ús de les seves eines visuals de desenvolupament, el rendiment, l'escalabilitat, i les possibilitats d'ampliació de funcionalitat mitjançant l'adquisició de configuració 'extra' i integració amb altres aplicacions de la plataforma.

Hi ha tres edicions del producte, cadascuna orientada a cobrir un tipus de requeriments. Són la Standard Edition amb les opcions bàsiques, la Advanced Edition que incorpora opcions més avançades, i la Reial Time Edition, que està orientada a la Integració de dades en temps real.

 

Informatica 9. Metadata Manager de Powercenter 
 

Informatica PowerExchange

 

Aquesta eina permet accedir directament, tractar i distribuir dades que es troben en plataformes que en moltes ocasions requereixen de passos intermedis per poder gestionar amb una ETL estàndard.

PowerExchange es pot connectar amb aplicacions SaaS (Software com a Servei), tot tipus de bases de dades, Email, LDAP, Serveis Web, XML, etc.

En la seva versió avançada Complex Data Exchange pot fins i tot treballar amb formats de dades complexes com EDI, HL7, SWIFT, EDIFACT, etc.

Amb algunes d'aquestes plataformes pot treballar en temps real, o també utilitzar la tecnologia CDC (Captura de Canvis), que permet detectar canvis en les dades de manera no intrusiva, i sense sobrecarregar així el sistema origen amb consultes innecessàries.

A més s'integra amb Informàtica Powercenter i amb Informàtica Data Quality.

 

Informatica PowerExchange 
 

Qualitat de dades

No cal comentar molt per definir aquest grup, totes les eines ideades per donar ajudar en la millora de la qualitat de dades de les companyies són aquí.

Informatica Data Explorer

 

 

És l'eina de perfilat de dades d'Informatica. Permet realitzar fàcilment perfilat de dades a nivell de columna, de taula i entre taules, el que Informàtica bateja com Anàlisi de dades en tres dimensions que permet treballar sobre dades complexos.

De l'anàlisi i el perfilat es generen metadades, es relacionen fonts i destins, i es creen informes que permeten controlar tot el procés de Qualitat de les dades, les anomalies, les mancances i les millores al llarg del temps.

A més s'integra amb Informàtica PowerCenter i Informàtica DataQuality per visualitzar resultats, crear mappings automàticament, o desplegar especificacions de neteja i transformació de dades.

Informatica Data Explorer 
 

Informatica Data Quality 

 

Data Quality té un abast més ampli que Data Explorer, està orientada a gestionar tot el procés de Qualitat de Dades, perfilat, especificació, neteja, validació i supervisió, permetent participar-hi de manera coordinada tant a analistes de dades com a desenvolupadors i administradors . Cada un disposa de la seva pròpia interfície orientada al seu perfil, i accessible en entorn web.

De la seva funcionalitat destaca la possibilitat de definició de regles i serveis de qualitat que poden ser reutilitzats en diferents projectes de qualitat de dades.

També disposa de regles predefinides i neteja d'adreces amb codificació geogràfica per més de 60 països.

 

Informatica Data Quality 
 

Informatica Identity Resolution

 

Aquest programari de resolució d'identitats permet detectar registres que consten en el sistema com a individus diferents, però que per la semblança entre valors associats a aquests es pot deduir que corresponen a la mateixa identitat. En altres àmbits aquest procés s'anomena també deduplicació de clients, i no pot faltar en un projecte de Qualitat de dades.

Informàtica Identity Resolution combina algorismes de comparació per semblança d'una manera eficient, té en compte possibles errors tipogràfics, variacions de les dades i fins i tot compara dades informats en idiomes i fins i tot alfabets diferents.

Pot funcionar tant en processos batch com en temps real, i disposa d'API's que permeten incorporar funcions de detecció d'identitats altres aplicacions.

 

Informatica Identity Resolution 
 

Intercanvi de dades B2B

 

En aquest grup s'engloben les eines que s'utilitzen per facilitar la integració amb dades d'altres negocis, amb el món exterior, on la manera d'accedir a la informació, les normes i els protocols canvien, i on és vital garantir la qualitat dels dades entrants, i que no es vegi compromesa la seguretat dels sistemes interns.

Aquesta família de productes, formada per Informàtica B2B Data Exchange i Informàtica B2B Data Transformation està orientada a l'intercanvi efectiu d'informació entre empreses, i ofereix una gran flexibilitat pel que fa a formats, admetent dades tant estructurats com no estructurats.

Les eines s'integren amb la resta de la plataforma d'Informatica, i al recollir dades externes també incorporen les mesures de seguretat necessàries perquè puguin integrar-se sense problemes amb les dades internes.

 

Informatica B2B Data Exchange, Informatica B2B Data Transformation

Informatica B2B Data Transformation ofereix funcions de transformació i qualitat de dades de fàcil utilització per a que el pas de dades externs a interns sigui senzill i sense necessitat de programació.

Informatica B2B Data Exchange  permet també definir interna i externament perfils de socis amb les empreses amb les que s'intercanvia informació, de manera que en la mateixa plataforma es puguin definir regles per a les transaccions i s'agilitzi el protocol anterior a la posada en marxa de l'intercanvi .

També gestiona esdeveniments, actuals i històrics i permet portar un control de les transaccions.

 

 

Gestió del cicle de vida de la Informació

La informació té un cicle de vida, i moltes dades es van quedant obsolets a mesura que va passant el temps. Les dades també es mouen i repliquen en diferents entorns, uns més crítics que altres, i la gestió eficient de l'espai és important. Molts de les dades que es manegen necessiten ser protegits i garantir que només puguin veure en clar els perfils adequats. És important gestionar bé el cicle de vida de la Informació, i aquestes són les eines que Informatica proporciona per ajudar en aquesta tasca.

Informatica Data Archive

 

Informàtica Data Archive s'encarrega de gestionar el arxivat, amb o sense compressió, de dades inactius, de manera que deixin de consumir espai i recursos en els principals sistemes de producció, i alhora segueixin mantenint la seva integritat referencial i sent accessibles a través de la eina i les diverses interfícies que proporciona.

Permet definir regles i crear metadades per al arxivat de dades, i proporciona connectivitat directa amb diverses bases de dades, sistemes ERP i CRM, i fins i tot aplicacions personalitzades.

Una altra característica important és que al gestionar el arxivat, permet analitzar i controlar activament el creixement de les dades.

 

Informatica Data Archive

Informatica Data Subset

 

Aquesta aplicació s'utilitza per crear subconjunts de dades a partir de, per exemple, les dades completes d'un sistema de l'entorn de producció.

Permet definir aquests subconjunts i les polítiques de creació i replicació o manteniment d'aquestes dades a partir dels de l'origen 'complet'. El programari també s'encarrega de mantenir la integritat referencial dins de les dades que formen els subconjunts.

Inclou acceleradors per utilitzar sobre diversos ERP's i CRM's, i pot facilitar molt la creació i manteniment d'entorns de desenvolupament de mida reduïda, i actualitzats.

 

Informatica Data Subset 
 

Informatica Data Privacy

 

Per acabar, aquesta aplicació s'encarrega de gestionar de manera centralitzada l'emmascarament de les dades que ho requereixin dins de l'organització, ajudant així a complir amb les lleis de protecció de dades, evitar fuites de dades sensibles, i facilitar la creació d'entorns de desenvolupament 100% operatius, però que no mostrin dades crítics.

Permet definir regles de emmascarament, i compta amb diferents algoritmes o maneres d'aplicar, alhora que assegura la coherència i la integritat de les dades emmascarats. Cal destacar que mitjançant la dissociació de valors permet emmascarar dades, però mantenint la funcionalitat i llegibilitat d'aquests.

Com era d'esperar, també incorpora acceleradors d'aplicacions que inclouen regles predefinides per aplicar emmascarament ràpidament sobre diverses aplicacions d'ERP i CRM.

 

Informatica Data Privacy