Ejemplo 13: Analisis de Componentes Principales

Printer-friendly version

El cálculo de componentes principales se usa con frecuencia como un paso de procesamiento de la transformación de características. Puede reducir la dimensionalidad del conjunto de datos en cuestión, mientras se preservan las varianzas más importantes de los datos. Ejecutar el proceso y comprobar la salida en la vista gráfica del conjunto de datos Iris cargado y transformado por este proceso. 

1. Agregar el operador Repository Access → Retrieve a la zona de trabajo y localizar el archivo //Samples/data/Iris con el navegador del parámetro repository entry.

2. Agregar el operador Data Transformation → Value Modification → Numerical Value Modification → Normalize. Cambiar el nombre del mismo a “Normalización” y conectar la salida del operador Retrieve a la entrada exa (example set input) de este operador.

3. Agregar el operador Data Transformation → Attribute Set Reduction and Transformation → Principal Component Analysis. Cambiar el nombre del mismo a “Componentes Principales” y conectar la salida exa del operador Normalización (Normalize) a la entrada exa de este operador, y las salidas exa pre a sendos conectores res del panel.

 

 

Resultados:

 

 

Google
 
     

In batch runs to make a massive data dump in the same table using an insert or update of record within a block x on the ground can be optimized with the use of parameters (if client agrees) or use odbc to bind variables. Remember the steps taken by Oracle to process a query: 1) Syntactic Validation 2) Semantic Validation 3) Optimization 4) Generation of the QEP (Query Execution Plan) 5)...
We have published a new online manual Dataprix. This is the Vulcan Methodology prepared by Ricardo Dario Bernabeu, whom we thank for this important contribution to the world BI Hispanic. The manual is divided into two parts: The first is entitled Datawarehousing: Research and Documentation of Concepts , and it is in troduce the concept of Business Intelligence, and detail the theoretical...
From Oracle 11g allows the creation of so-called invisible indexes that allow you make things really interesting. This invisibility means that the optimizer does not take into account the existence of these indices to generate execution plans. This can be very interesting in production databases for example: In the case of testing new rates without affecting the application SQL statements...