Pentaho Чайник решения: Отзывы

Хорошо ..

Я только что закончил читать Pentaho Чайник решения . Эта книга настолько обширна и интересна, я читал больше, чем я думал, но я был удивлен качеством содержания и разнообразие тем, затронутых.
Вот отзывы:
1) Обзор: Это очень интересно почитать книгу, которая анализирует множество сложных вопросов, легко понять объяснения учета. Изюминкой этой книге, написанной специалистами, которые работали с PDI (акаЧайник) в течение многих лет, что делает большой вклад и даже провели их развития (в случае Ведущие Мэтт). То есть, существует большой разрыв между зная, что это для 'шаг', и знают, зачем они создали этот "шаг", и эта разница заметна повсюду в этой книге.
Pentaho Чайник Решения Хотя это и не предназначена для новичков, идеально подходит для тех, кто в настоящее время работает с PDI или хотите сделать в будущем, охватывающих темы, которые являются жизненно важно иметь их в виду при использовании этого инструмента.
2) подробный отзыв: эта книга иниENCE с введением о ETL и особенности, которые должны были ETL-инструмент, затем представляет Чайник и описывает их характеристики, как установить и запустить его, и как она предназначена, то есть сведения о преобразованиях, Джобс, прыжки, типы данных , хранилище типы, параметры, переменные и т.д.
Затем приводятся примеры, взять данные из транзакционных баз данных и нагрузки хранилищ данных, решения сложных вопросов, связанных с медленно изменяющихся измерений , обнаружение изменений в данные (CDC - отслеживание изменений в данных), денормализации и т.д.
Следуйте с объяснением 34 подсистемами ETL-процесс, как это определено Ральф Кимбалл, а потом, каждая подсистема из Чайник, уделяя особое внимание, как он решает для каждой ситуации и иллюстрации в каждом случае.Темам, чтобы выделить следующие:
  • Работа исполнения, отступает, параллельно, подчиненных серверов (письмо).
  • Преобразования Запуск многопоточный, распределительных линий, кластеризации и управления разделами изменения.
  • Подключения к базам данных: общие и дополнительные опции, объединения, кластеризации, управления соединений и транзакций.
  • Производительность и масштабируемость.
  • Бывшийтяги данных, профилирования данных (с использованием DataCleaner), CDC.
  • Данные cleasing, управление различными типами ошибок, аудита, дубликаты данных, скриптов.
  • Управление ключами, загрузка таблиц измерений (снежинка схемы и звезды), реализации различных типов таблиц измерений.
  • Различные типы таблиц фактов, массовой загрузки, погрузки и обработки грузов.
  • Извлечение данных из нескольких OLAP-технологий.
  • Жизненный цикл ETLs развития, положительный и отрицательный опыт, быстрой разработки, тестирования, отладки и документацию.
  • Планирование (хрон, по крайней, xaction, ПСД и Pentaho) и мониторинг.
  • Использование динамических кластеров (Amazon EC2).
  • Интеграция и религиозной принадлежностие, п данных в реальном времени.
  • Обработка сложных форматов данных (нереляционных, неструктурированных).
  • Использование веб-служб, примеры XML, SOAP и RSS.
Так как выход в финал подробно описано, как получить и скомпилировать Чайник, чайник использованием Java API на примерах, и как развивать плагины для расширения собственного Чайник!
Pentaho Чайник Решения адреса интеграции данных (34 подсистем) и систематизировал много понятий, примеры передового опыта, разработки и проблемы с производительностью, что делает его вариант рекомендуется для тех, кто полностью принадлежат BI мира, как для тех, кому нужно делать какие-либо вид интеграции данных.
3) Окончательный обзор: Определенно, это еще одно существенное чтение книги, будь то вы работаете с Pentaho решений BI или осуществления транзакционных систем.Потому что интеграция данных охватывает многие темы и рассматриваются многие вопросы, которые присутствуют в любой компании / организации, которая транзакционных систем, систем бизнес-аналитики, использование СУБД или простые электронные таблицы.
Здравоохранения.