SQL Server Data EST profils stockés dans des tables

La tâche de SQL Server Data Services Informations sur le profil stocke les résultats du profilage dans un document XML qui peuvent être examinés avec la visionneuse du profil des données. Dans l'article SQL Server 2008 Dataprofiling à expliquer comment utiliser cette nouvelle tâche dans SSIS.

Bien que cette méthode est très simple, parfois peut-être pas suffisante. Si un projet répond à la qualité des données pourrait être intéressant, par exemple, conserver un historique de profil pour évaluer la façon dont il a été l'amélioration de la qualité des données traitées.

La meilleure façon de travailler avec des données historiques est d'utiliser une base de données et le stockage des données dans les tables, sur lesquelles peut faire les enquêtes, les rapports et il faut comparer.Pour ce faire tout ce que vous avez besoin est de passer les tables de métadonnées que la tâche de profilage a été stockée dans le fichier XML.

Comme quelqu'un l'a déjà passé à la recherche d'un moyen facile de le faire. Thomas Frisendal de leur web des solutions de qualité de l'information explique comment créer un fichier XSLT pour chaque type de profilage qui est utilisé pour extraire le code XML généré par le profil de travail de données SSIS un ou plusieurs fichiers XML dans un format qui peut être importé directement dans les tableaux .

De packages SSIS pour aller à des profils de données Tables

Ainsi, avec seulement la création d'un processus qui applique un XSLT pour chaque type de profil, puis de charger chaque fichier XML résultant dans une table et peut stocker des données de profil dans les tableaux.Comme il est également dans tous les fichiers inclure un champ qui indique le nom de la table source, avec un tableau pour chaque type de profil et vous pouvez stocker les profils de tous les tableaux à discuter.

De données SSIS ProfileToSQL tâche de flux de

J'ai également ajouté à la table un champ de date qui stocke la date à laquelle le processus est terminé, et maintenant le résultat a été bon.

Dans le graphique, nous pouvons voir la répartition des types de pistes différentes à la rue espagnol selon l'INE et de réaliser, par exemplepar exemple, que les identifiants ne sont pas trop bien établie, puisque nous pouvons trouver des choses comme plus d'un identifiant pour le même type de rue (rue, C, C /), ou de nombreuses voies à un point comme un identifiant.

Le tableau de données SSIS le profil des valeurs de manières différentes

Dans outil gratuit pour l'automatisation de SQL Server , l'auteur explique comment cette solution fonctionne et comment obtenir les feuillesstyle, et recommandations pour les feuilles de style Utilisation ProfileToSQL expliqué en détail comment utiliser XSLT, et comprend un avertissement précisant que ce logiciel est une version d'essai.

Talk About It forum