Pentaho Kettle Solutions: Comentarios
Bo ..
Acaba de ler Solucións Pentaho Kettle . Este libro é tan extenso e interesante, teño lido máis do que eu pensaba, pero quedei sorprendido coa calidade do contido e diversidade de temas abordados.
Aquí están as opinións:
Unha visión xeral): Este é un libro moi divertido de ler, que analiza moitas cuestións complexas doado de entender explicacións manter. O destaque deste libro está escrito por profesionais que traballaron con PDI (akaChaleira) por moitos anos, facendo numerosas contribucións e mesmo realizar o seu desenvolvemento (no caso de Matt Casters). É dicir, hai unha gran diferenza entre saber o que é un 'paso', e sabe por que crearon este "paso", e esa diferenza é perceptible en todos os lugares neste libro.
Pentaho Kettle Solutions pesar de non ser destinado para principiantes, é ideal para os que está a traballar actualmente con PDI ou queren facer no futuro, abordando temas que son vitais para telos en conta cando usar esta ferramenta.
2) Revisión detallada: esta ini librocia cunha introdución sobre a ETL e as peculiaridades que deben ter unha ferramenta de ETL, a continuación, presenta Chaleira e describe as súas características, como instalar e executalo, e como está concibida, é dicir, en detalles Transformations, Traballos, saltos, tipos de datos , tipo de depósito, parámetros, variables, etc
A continuación, presenta exemplos de tomar datos dun banco de datos transacional e cargar un data warehouse, abordando cuestións complexas que ligan con dimensións de modificación lenta , cambio de detección nos datos (CDC - Change Data Captura), desnormalização, etc
Segue coa explicación dos 34 subsistemas do proceso de ETL, conforme definido pola Ralph Kimball, e entón a dirección de cada subsistema de Chaleira, con énfase en como resolver cada situación e ilustrando, no seu caso.Os temas abordados son de destacar:
- Execución do traballo, backtracking, en paralelo servidores, escravo (carta).
- Executando transformacións multi-threaded liñas, distribución, clustering e xestión de cambios particións.
- Conexións con bases de datos: as opcións xerais e avanzadas, pooling, clustering, xestión de conexións e transaccións.
- Rendemento e módulos.
- Extracción de datos de perfís de datos, (usando DataCleaner), CDC.
- Cleasing datos, xestión de diferentes tipos de erros, auditoría, datos duplicados, scripts.
- Xestión de chaves, cargar as táboas de dimensión (snowflake esquema e estrela), a posta en marcha de distintos tipos de táboas de dimensión.
- Diferentes tipos de táboas de datos, de carga a granel, carga e manipular.
- Extraer datos de múltiples tecnoloxías OLAP.
- Ciclo de vida ETLs desenvolvemento, boas e malas prácticas, desenvolvemento áxil, proba, depuración e documentación.
- Axenda (cron, ás, xaction, PDS e Pentaho) e seguimento.
- Usando clusters Dinámico (Amazon EC2).
- Integración e filiación relixiosae, n datos en tempo real.
- Manipulación de formatos de datos complexos (non-relacional, non estruturados).
- Utilizando o Servizo web, exemplos de XML, SOAP e RSS.
Dende que alcanzou os detalles finais como obter e compilar Chaleira Chaleira, usando Java API por exemplo, e como desenvolver plugins para estender Chaleira propia!
Pentaho Kettle Solutions aborda a integración de datos (os 34 subsistemas) e lote enteiro sistematizado de conceptos, exemplos, mellores prácticas, deseño e performance, tornándose unha opción recomendada para os que pertencen enteiramente ao mundo DNI, como para os que precisan facer calquera tipo de integración de datos.
3) Análise final: En definitiva, este é un outro libro de lectura imprescindible, se está a traballar con solucións Pentaho BI ou implementación de sistemas transacionais.Porque a integración de datos abrangue varios temas e enderezos de moitas cuestións que están presentes en calquera empresa / organización que ten sistemas transacionais, os sistemas de DNI, use DBMS ou follas de cálculo sinxelas.
De saúde.