Pentaho Kettle Solutions: Comentarios

Bo ..

Acaba de ler Solucións Pentaho Kettle . Este libro é tan extenso e interesante, teño lido máis do que eu pensaba, pero quedei sorprendido coa calidade do contido e diversidade de temas abordados.
Aquí están as opinións:
Unha visión xeral): Este é un libro moi divertido de ler, que analiza moitas cuestións complexas doado de entender explicacións manter. O destaque deste libro está escrito por profesionais que traballaron con PDI (akaChaleira) por moitos anos, facendo numerosas contribucións e mesmo realizar o seu desenvolvemento (no caso de Matt Casters). É dicir, hai unha gran diferenza entre saber o que é un 'paso', e sabe por que crearon este "paso", e esa diferenza é perceptible en todos os lugares neste libro.
Pentaho Kettle Solutions pesar de non ser destinado para principiantes, é ideal para os que está a traballar actualmente con PDI ou queren facer no futuro, abordando temas que son vitais para telos en conta cando usar esta ferramenta.
2) Revisión detallada: esta ini librocia cunha introdución sobre a ETL e as peculiaridades que deben ter unha ferramenta de ETL, a continuación, presenta Chaleira e describe as súas características, como instalar e executalo, e como está concibida, é dicir, en detalles Transformations, Traballos, saltos, tipos de datos , tipo de depósito, parámetros, variables, etc
A continuación, presenta exemplos de tomar datos dun banco de datos transacional e cargar un data warehouse, abordando cuestións complexas que ligan con dimensións de modificación lenta , cambio de detección nos datos (CDC - Change Data Captura), desnormalização, etc
Segue coa explicación dos 34 subsistemas do proceso de ETL, conforme definido pola Ralph Kimball, e entón a dirección de cada subsistema de Chaleira, con énfase en como resolver cada situación e ilustrando, no seu caso.Os temas abordados son de destacar:
  • Execución do traballo, backtracking, en paralelo servidores, escravo (carta).
  • Executando transformacións multi-threaded liñas, distribución, clustering e xestión de cambios particións.
  • Conexións con bases de datos: as opcións xerais e avanzadas, pooling, clustering, xestión de conexións e transaccións.
  • Rendemento e módulos.
  • Extracción de datos de perfís de datos, (usando DataCleaner), CDC.
  • Cleasing datos, xestión de diferentes tipos de erros, auditoría, datos duplicados, scripts.
  • Xestión de chaves, cargar as táboas de dimensión (snowflake esquema e estrela), a posta en marcha de distintos tipos de táboas de dimensión.
  • Diferentes tipos de táboas de datos, de carga a granel, carga e manipular.
  • Extraer datos de múltiples tecnoloxías OLAP.
  • Ciclo de vida ETLs desenvolvemento, boas e malas prácticas, desenvolvemento áxil, proba, depuración e documentación.
  • Axenda (cron, ás, xaction, PDS e Pentaho) e seguimento.
  • Usando clusters Dinámico (Amazon EC2).
  • Integración e filiación relixiosae, n datos en tempo real.
  • Manipulación de formatos de datos complexos (non-relacional, non estruturados).
  • Utilizando o Servizo web, exemplos de XML, SOAP e RSS.
Dende que alcanzou os detalles finais como obter e compilar Chaleira Chaleira, usando Java API por exemplo, e como desenvolver plugins para estender Chaleira propia!
Pentaho Kettle Solutions aborda a integración de datos (os 34 subsistemas) e lote enteiro sistematizado de conceptos, exemplos, mellores prácticas, deseño e performance, tornándose unha opción recomendada para os que pertencen enteiramente ao mundo DNI, como para os que precisan facer calquera tipo de integración de datos.
3) Análise final: En definitiva, este é un outro libro de lectura imprescindible, se está a traballar con solucións Pentaho BI ou implementación de sistemas transacionais.Porque a integración de datos abrangue varios temas e enderezos de moitas cuestións que están presentes en calquera empresa / organización que ten sistemas transacionais, os sistemas de DNI, use DBMS ou follas de cálculo sinxelas.
De saúde.