Ejemplo 13: Analisis de Componentes Principales

Printer-friendly version

El cálculo de componentes principales se usa con frecuencia como un paso de procesamiento de la transformación de características. Puede reducir la dimensionalidad del conjunto de datos en cuestión, mientras se preservan las varianzas más importantes de los datos. Ejecutar el proceso y comprobar la salida en la vista gráfica del conjunto de datos Iris cargado y transformado por este proceso. 

1. Agregar el operador Repository Access → Retrieve a la zona de trabajo y localizar el archivo //Samples/data/Iris con el navegador del parámetro repository entry.

2. Agregar el operador Data Transformation → Value Modification → Numerical Value Modification → Normalize. Cambiar el nombre del mismo a “Normalización” y conectar la salida del operador Retrieve a la entrada exa (example set input) de este operador.

3. Agregar el operador Data Transformation → Attribute Set Reduction and Transformation → Principal Component Analysis. Cambiar el nombre del mismo a “Componentes Principales” y conectar la salida exa del operador Normalización (Normalize) a la entrada exa de este operador, y las salidas exa pre a sendos conectores res del panel.







Now FusionCharts Free is also open source , so it can be a very good option to use graphic tools and projects, especially if they are also open source. The license is GPL and MIT, so you can use, modify and redistribute, provided that it is open source. You can access the gallery of graphics, online demos and download the tool directly in the web of FusionCharts Free I especially recommend...
Assuming you have already done a good requirements analysis with analysis of existing reports, interviews with key users, etc., And that already is clear about the different sources on which to focus the DWH , we consider what the facts are most important for the company and for users, business analysts have to exploit the information. Above all it must always bear in mind that the goal of DWH...
Cassandra is an open source database distributed, is one of the noteworthy projects of the Apache Software Foundation and appears to be hitting hard. By being distributed enables high availability, fault tolerance and, above all, a highly scalable without loss of performance. And were using companies that handle large amounts of data such as Rackspace, Digg, or Facebook, and the...