


Curso de Análisis Cluster
en Data Mining con R
Antes 990 Ahora 690€
Curso de Diseño y Análisis de Experimentos con R
690€
490€
Curso de Introducción a la Estadística Aplicada con R Software
Descripción
690€
Curso de Análisis de Correlación y Regresión lineal con R
Curso de Machine Learning para clasificación con R
690€
Programa del curso
Curso Análisis Cluster en Data Mining con R
Especialízate en Ciencia de Datos
Aprende el análisis cluster con R Software, de forma clara y sencilla. A
través de ejemplos prácticos, serás capaz de encontrar grupos de
observaciones (clusters) que comparten características similares.
Aprenderás a descubrir patrones importantes a partir de un gran conjunto
de variables, una herramienta de aprendizaje automático no supervisado
muy popular en Data Mining.
Destinatarios
Este curso está destinado a estudiantes,
empleados e investigadores de cualquier
rama de estudios interesados en
comprender los análisis de clasificación
de observaciones, e implementarlos con
ejemplos de datos reales utilizando el
software estadístico R.
Se trata de una técnica ampliamente
utilizada en Data Science y Data Mining.
Por ejemplo, para la segmentación de
clientes o mercado en marketing, para
clasificar pacientes según su perfil de
expresión génica, para identificar grupos
de viviendas según su tipo, valor y
ubicación.
✓ Debido a que es un curso de nivel
medio, es recomendable contar con
conocimientos previos básicos sobre
Estadística y programación en R
Software.
✓ Los contenidos del Curso están
desarrollados completamente en torno
a R Software, la herramienta de
código l ibre l íder en análisis
estadístico para el manejo de grandes
volúmenes de datos y la representación
gráfica de alta calidad.
Objetivos
Con este curso aprenderás a clasificar tus
observaciones en grupos (clusters) con
características similares. Serás capaz de
realizar distintos métodos de agrupación,
comprender cómo funcionan y cómo
interpretar e informar los resultados.
Al finalizar la formación podrás:
• Comprender los análisis cluster y cómo
aplicarlos a casos reales con R Software.
• Seleccionar y preparar los datos para el
análisis.
• Aplicar los algoritmos de agrupación más
populares (cluster jerárquico y no
jerárquico por k-medias).
• Cómo determinar el método de
agrupación óptimo.
• Cómo determinar el número óptimo de
grupos para el análisis.
• Aplicar el análisis cluster para resolver
problemas reales de clasificación.
• Validar la agrupación final.
• Evaluar la calidad de la agrupación.
• Interpretar los resultados del análisis
cluster.
• Informar los resultados con gráficos
avanzados ggplot.

Competencias
Este curso complementa cualquier perfil
profesional vinculado a la investigación y
el análisis de datos.
Al finalizar el curso habrás desarrollado:
• La capacidad de evaluar, modelar y
representar gráf i camente l as
relaciones entre múltiples variables
para crear grupos homogéneos de
observaciones, que apoyarán la toma
de decisiones en tu organización,
investigación o a nivel personal.
• El dominio del lenguaje estadístico de
R Software y RStudio, una de las
competencias profesionales más
demandadas en el mercado laboral de
la Ciencia de Datos.
Al finalizar la formación recibirás un
certificado acreditado por Máxima
Formación S.L..
Metodología
Máxima Formación es garantía del
máximo rendimiento del tiempo
invertido:
Online
Acceso 24 horas al Campus
Tutorías individualizadas
Seguimiento personalizado
Evaluación continua
Sin examen final
Enfoque práctico
Análisis de casos reales
Aprendizaje progresivo
Desde lo básico a lo complejo.
Recursos audiovisuales
Método paso a paso
Comunidad on-line
Compartimos conocimiento
Programa del curso
TEMA 1
Análisis cluster con R
Introducción al análisis de clasificación de observaciones con R Software
▪ ¿Cómo se forman los grupos (cluster)?
▪ Métodos de análisis cluster jerárquico y no jerárquico
▪ Pros y contras
▪ Procedimiento paso a paso
▪ Preparación previa de los datos
▪ ¿Cómo medir las relaciones entre múltiples variables?
▪ Casos de aplicación.
TEMA 2
Análisis cluster jerárquico
Agrupación jerárquica de los datos (dendrograma)
▪ Elección óptima de la técnica cluster: métodos Ward, UPGMA, centroide, etc..
▪ Elección óptima del número de grupos
▪ Representación e interpretación de los resultados: Dendrograma
▪ Validación de la agrupación creada
▪ Evaluación de la calidad de la agrupación.
▪ Cómo interpretar e informar los resultados.
▪ Aplicación con datos reales en R.
TEMA 3
Regresión lineal múltiple
Evaluar la relación lineal entre una variable respuesta y varias variables explicativas
▪ Elección óptima de la técnica cluster: k-medias, k-medoides, Clara
▪ Elección óptima del número de grupos
▪ Representación e interpretación de los resultados: gráfico de dimensiones
▪ Validación de la agrupación creada
▪ Evaluación de la calidad de la agrupación.
▪ Cómo interpretar e informar los resultados.
▪ ¿Cómo elegir la mejor técnica para nuestros datos?
▪ Aplicación con datos reales en R.
Sistema de evaluación
Apostamos por la evaluación continua sin examen final
El sistema de evaluación del Curso de Introducción a R Software se basa en el
seguimiento individualizado de la evolución del alumno/a para garantizar la
comprensión de los conceptos teóricos y la resolución práctica de los ejercicios
aplicados. El desempeño del alumno/a viene determinado por los siguientes indicadores
objetivos:
▪ Actitud
Participación activa en foros y comunicación con el
equipo docente.
▪ Planificación
Gestión del tiempo durante el desarrollo del
programa.
▪ Técnica
Evolución progresiva en el uso de las técnicas con R
Software.
▪ Competencia
Capacidad de aplicación técnica en la resolución
práctica de casos reales.

Confiaron en nosotros
Más de 10 años formando a los mejores profesionales
de España y Latinoamérica


Por qué R Software
El liderazgo de R Software
R Software es la herramienta líder en análisis estadístico, manipulación de
grandes volúmenes de datos y representación gráfica de alta calidad. Su
potencia, robustez y transversalidad lo convierten en el software elegido por
los Data Scientist de la comunidad científica internacional de las universidades,
empresas, industrias e instituciones más prestigiosas del mundo. La implantación
de R Software ya ha superado a otros software comerciales como SPSS, Statistics
y SAS.
Convierte tus datos en ventaja competitiva
SOFTWARE LIBRE
De código abierto y disponible para todos los sistemas operativos
Windows, MACOs, Unix y Linux.
Sin licencias, permite al usuario el acceso, uso y modificación
ilimitados y gratuitos.
ESTABLE E INNOVADOR
Su desarrollo es producto de un proyecto colaborativo que implica
a miles de usuarios en todo el mundo. Un software en estado
permanente de actualización con nuevas funciones y paquetes
accesibles en tiempo real.
VERSÁTIL Y ROBUSTO
Decodifica diversos lenguajes de programación y da acceso a la
lectura de datos procesados en softwares comerciales como Excell,
SPSS, SAS, etc.
TODO EN UNO
R Software es un lenguaje de programación y un entorno gráfico
con una amplia gama de herramientas estadísticas clásicas y
avanzadas para el análisis y la representación gráfica de datos
exportables en diversos formatos: Postcript, pdf, bitmap, pictex,
png, jpeg, etc.
