Pentaho Чайник решения: Отзывы

Хорошо ..

Я только что закончил чтение Pentaho Чайник решения . Эта книга настолько обширна, и интересно, я читал больше, чем я думал, но я был удивлен качеством содержания и разнообразия темам.
Вот отзывы:
1) Обзор: Это очень приятный книги для чтения, который исследует многие сложные вопросы, легко понять объяснения учета. Изюминкой этой книги является то, что она была написана профессионалами, которые работали с PDI (акаЧайник) на протяжении многих лет, сделал большой вклад и даже провели их развития (в случае Мэтт Ведущие). То есть, существует большой разрыв между зная, что это за "шаг", и знаю, почему они создали этот "шаг", и эта разница всюду в этой книге.
Pentaho Чайник решения, хотя и не предназначена для новичков, идеально подходит для тех, кто работает с PDI в настоящее время или желающих сделать это в будущем, охватывающих темы, которые важно иметь их в виду при использовании этого инструмента.
2) подробный отзыв: эта книга INIENCE с введением о ETL и особенности, которые должны были ETL инструмент, то представляет чайник и его основных характеристик, как установить и запустить его, и как он предназначен, а именно, сведения о преобразованиях, вакансии, Дайвинг, типы данных , хранилище типы, параметры, переменные и т.д.
Тогда приведены примеры брать данные из транзакционных баз данных и нагрузки хранилищ данных, решения сложных вопросов, связанных с медленно изменяющихся измерений , обнаружения изменений в данных (CDC - Change Data Capture), денормализации, и т.д.
Продолжается с разъяснениями, из 34 подсистем процесс ETL определяется Ральф Кимбалл, а затем адрес каждой подсистемы из чайника, с акцентом о том, как он разрешает каждой ситуации и моделирования в каждом конкретном случае.Чтобы выделить темы, охватываемые являются:
  • Выполнение работ, откат, параллельно, с подчиненных серверов (письмо).
  • Преобразования Запуск многопоточный, распределительных линий, кластеризации и управления разделами изменения.
  • Подключения к базам данных: общие и дополнительные опции, объединения, кластеризация, управление соединения и операции.
  • Производительность и масштабируемость.
  • Бывшийтяги данных, профилирования данных (с использованием DataCleaner), CDC.
  • Данные cleasing, управление различными типами ошибок, аудита, повторяющихся данных, скриптов.
  • Управление ключами, загрузка таблиц измерений (схема "снежинка" и звезда), реализации различных типов таблиц измерений.
  • Различные типы таблиц фактов, массовая загрузка, погрузки и обработки грузов.
  • Извлечение данных из нескольких технологий OLAP.
  • Развития жизненного цикла ETLs, положительный и отрицательный опыт, быстрой разработки, тестирования, отладки и документирования.
  • Планирование (хрон, в, xaction, ПДС и Pentaho) и мониторинга.
  • Кластеры Использование динамических (Amazon EC2).
  • Интеграция и oacuteE, N данных в реальном времени.
  • Обработка сложных форматов данных (не реляционных, неструктурированных).
  • Использование веб-службы, примеры XML, SOAP и RSS.
Так как выход в финал подробно описано, как получить и скомпилировать чайник, чайник с помощью Java API на примере, и, как расширить Чайник разработки собственных плагинов!
Pentaho Чайник Решения адреса интеграции данных (34 подсистем) и систематизировал много понятий, примеры передового опыта, разработка и проблемы с производительностью, что делает его полностью вариант подходит для тех, кто принадлежит к миру BI, как для тех, кто нуждается, чтобы сделать какой-то интеграции данных.
3) Окончательный обзор: Без сомнения, это еще одна книга обязательным чтением, будь то один работает с Pentaho, внедрение BI-решений или транзакционных систем.Поскольку интеграция данных охватывает многие темы и решает многие вопросы, которые присутствуют в любой компании / организации, транзакционные системы, системы бизнес-аналитики, использование СУБД или простые электронные таблицы.
Здравоохранения.