Curso

Especialidad en Business Intelligence: Big Data (2 meses)

Emisor: EUDE Business School

240 horas

·

Intermedio

·

Español

Programa certificado por ARP

Diploma ARP de validez internacional

Valoraciones de alumnos verificados

Precio a consultar

  • El concepto de dato como valor estratégico.
  • Conceptos aledaños.
Requisitos:

No existen requisitos previos.

240 horas en total

Descargar programa

  • La fascinación por el dato
    • Historia de la información
    • La evolución de las tecnologías del conocimiento
      • Estadística
      • Business Intelligence
      • Small Data, Big Data, Smart Data, Fast Data
    • La Explosión del dato del siglo XX-XXI
      • Por qué en el siglo XX se ha vuelto tan importante el dato
      • Los culpables: la capacidad de computación, el abaratamiento del almacenamiento, internet y los móviles
    • La respuesta: Big Data
      • Definición
      • Las V’s del Big Data
      • Nuevo territorio: lo que importa es la pregunta
      • La evolución de la analítica: descriptiva, predictiva, prescriptiva
      • La pirámide del conocimiento: la diferencia entre el dato, la información y el conocimiento
    • Mapa de la arquitectura Big data
      • Los tres niveles: datos, información y conocimiento
      • Las dos dimensiones: interno-externo
    • Nivel del dato:
      • Tecnologías ETL
      • Del ETL al ELT
      • Datos estructurados y no estructurados
      • La evolución del tipo de dato disponible
    • Nivel de información
      • SQL v NoSQL
      • Sistemas centralizados frente a sistema distribuidos
      • Hadoop básico
        • HDFS
        • Map Reduce
        • Ecosistema Hadoop
      • Spark
        • Comparativa con Hadoop
        • Ecosistema Spark
      • Arquitecturas lambda y Kappa
      • On premise y cloud
        • La nube y los servicios IaaS, PaaS y SaaS
        • Arquitectura Híbrida
      • Nivel del Conocimiento
        • El proceso general de análisis y herramientas utilizadas
        • La importancia de la visualización y herramientas
        • Herramientas de análisis
        • Inteligencia artificial
          • Inteligencia artificial débil y fuerte
          • Diferenciemos entre inteligencia artificial, machine learning y deep learning
          • Tipos de machine learning
            • Aprendizaje supervisado
            • Aprendizaje no supervisado
            • Aprendizaje por refuerzo
          • Deep learnig: ¿qué es una red neuronal?
          • Sistemas cognitivos
        • Caso práctico: Introducción a la visualización con Tableau
          • Objetivo: que los alumnos conozcan una herramienta que les permitirá explorar los datos disponibles a través de la visualización. También aprenderán la necesidad de tratamiento de los datos y la selección de los mejores elementos de visualización para cada tipo de datos

    • Lo importante son las personas
      • Evolución y parición de nuevos roles
      • El “Data Translator”, un nuevo rol clave
    • Repasemos los niveles de la pirámide del conocimiento: hace falta la acción
    • Es necesario llegar a ser una empresa Data Driven
      • Dejar atrás la gestión HiPPO
      • Procesos de transformación
        • Data Centric
        • Data Thinking
        • Data by Design
        • Fata Governance
      • Pero antes es necesario saber dónde estamos el assesment
      • Proceso Data Centric
        • Evolución de la posición del dato dentro de la empresa
        • El Dato se convierte en el centro
      • Proceso Data by Design
        • Lo importante es saber qué quiere el cliente
        • Marco metodológico fundamental: Design Thinking
          • Qué es el Design Thinking
          • Algunas herramientas utilizadas
          • Pero es necesario modificarlo para dejar entrar al dato
        • Cómo lo lanzamos
          • El mínimo producto viable: lo importante es dar valor continuo al cliente
          • Tecnologías Agile-Scrum
        • Relación entre Design Thinking y Agile: ciclo de evolución continuo
      • Data Thinking
        • La cultura del dato en la empresa
        • Cambios organizacionales necesarios: modelo Spotify
        • Data culture: todos los miembros de una organización deben enfocarse al valor del dato
      • Casos de Uso de Big Data
      • Nueva fuente de ingresos: la compartición de datos
        • El dato como producto
        • El nuevo marco de privacidad
      • Y surgió el RGPD
        • Conceptos básicos
        • El consentimiento dentro del RGPD
        • Qué es un tratamiento: el encargado y el responsable de tratamiento
        • Uso legítimo
        • Principios de responsabilidad
        • Derechos del usuario: el nuevo derecho de portabilidad y de no utilización de procesos automatizados

 

  • Caso práctico: uso de Tableau (o Google analytics) para análisis de un e-commerce (u otro tipo de web)
    • Objetivo: que los alumnos profundicen en el uso de la visualización como herramienta fundamental para obtener pistas de la marcha de una empresa online

  • Esquema del módulo:
    • Metodología CRISP-DM
    • Introducción a Rapid Miner: conceptos básicos
    • Preparación de datos
    • Modelos clasificatorios y predictivos
    • Correlación: que dos variables tengan relación puede no decir nada
      • Realizar una matriz de correlación
      • Entender una matriz de correlación
      • Correlación positiva y negativa
      • Correlación no indica causalidad
      • ¿Qué podemos hacer con esa información?
    • Reglas de asociación: ¿qué cosas suelen ir juntas?
      • Entender el funcionamiento de un modelo de asociación
      • Porcentaje de Soporte y de Confianza
      • Usar las reglas de asociación
    • Clusterización: ¿hay diversos grupos de clientes?
      • El algoritmo K-means
      • Cómo funciona y qué significa la K
      • Concepto de centroide
    • Análisis discriminante: empezamos a predecir
      • Explicación de análisis discriminante
      • Concepto de datos de entrenamiento y de datos de scoring
      • Flujo de entrenamiento y flujo de scoring
      • Explicación del nivel de confianza
    • Regresión lineal: una forma de predecir una variable continua
      • Explicación del modelo de regresión lineal
      • Entender los pesos en una regresión lineal
      • ¿Qué podemos hacer con los resultados?
    • Regresión logística: cuando hay que decir entre dos opciones
      • Explicación del modelo de regresión logística
      • También aparece pesos ¿pero significan algo?
      • Explicación del nivel de confianza
      • ¿Qué podemos hacer con los resultados?
    • Árboles de decisión: ¿en dónde cae este cliente?
      • Concepto de árbol de decisión
      • Nodos, ramas y hojas
      • Profundidad del árbol
      • Navegar en un árbol de decisión
      • Comprender un árbol y aplicarlo
    • Redes Neuronales: simulando el pensamiento humano
      • Explicando en lo posible una red neuronal
      • Aplicar una red neuronal
    • Introducción al análisis de textos
      • Análisis comparativo de textos
      • Conceptos básicos
      • Diccionarios, stop words
      • Sinónimos y palabras de la misma familia
      • Combinación de palabras
      • Reemplazo de palabras
    • Validación cruzada: ¿cómo podemos saber si el modelo funciona?
      • Qué es una validación cruzada
      • Concepto de falso positivo
    • La ética en el data mining
      • No siempre los modelos son “justos”
      • Que puedas predecir no quiere decir que debas obligar
      • Cuidado con los sesgos
      • No todos los análisis se pueden hacer

 

  • Caso práctico: uso de Rapid Miner para hacer data mining
    • Objetivo: que los alumnos utilicen lo aprendido para resolver algún tipo de problema basado en datos

  • Módulo 1: definir el problema que se quiere resolver
    • ¿Cuál es el problema principal que estás intentando solucionar y por qué es importante?
    • Contexto: ¿Qué factores contribuyen al problema?
    • Personas: ¿A quién le afecta directamente?
    • Personas que trabajan en el problema: ¿Quién está trabajando actualmente en el problema?
    • ¿Con que frecuencia se toman las decisiones sobre la resolución del problema por parte de las personas que trabajan actualmente en el mismo?
    • Datos existentes: ¿Qué datos, relevantes a este problema, existen actualmente?
    • De forma general, ¿cuál es la periodicidad, retardo y granularidad (geográfica, demográfica, temporal, otras) de los datos existentes?
    • Nuevas fuentes de datos potenciales para la solución: Basados en los factores antes mencionados, ¿qué datos nuevos o adicionales podrían potencialmente aportar nuevos puntos de vista
    • Preguntas guía
  • Módulo 2: inventariar y comprender las lagunas en los datos
    • Datos existentes sobre el problema
    • Para cada fuente de datos, contesta las siguientes preguntas:
    • ¿Está disponible abiertamente, o requiere un permiso especial de acceso?
    • ¿Es estructurada o no estructurada?
    • ¿Con qué frecuencia se recogen los datos?
    • ¿Cómo son de granulares o detallados geográficamente los datos (ALTO, MODERADO, BAJO)?
    • ¿Cómo son de granulares o detallados demográficamente los datos (ALTO, MODERADO, BAJO)?
    • ¿Cuánto tiempo se almacenan?
    • ¿Las personas actualmente implicadas lo usan para la toma de decisiones, evaluación o para otros propósitos?
    • Otros datos organizacionales: ¿Qué otros datos usa tu organización en la operativa del día a día y en la planificación a largo plazo?
    • Identificación de lagunas
  • Módulo 3: mapear a todos los participantes en el proyecto
    • Clientes/usuarios, Solucionadores, Soportes, Otras Personas
    • ¿Cuál es su influencia en el problema?
    • ¿Cuál es su influencia en el proyecto?
    • ¿Cómo puede beneficiarse del proyecto?
    • ¿Cómo los datos ayudan ahora a su toma de decisiones?
    • ¿Qué podría hacer esta persona con mejores datos?
    • ¿Qué podría hacer para socavar el proyecto?
    • ¿Cuál es la mejor forma de mantenerle comprometido?
    • La Ficha Personas
    • Mapa de influencia
  • Módulo 4: comprender quién usará los resultados del proyecto
    • Data Journey actual
    • Análisis de mejoras
    • Diseño del Data Journey nuevo
  • Módulo 5: identificar tu lista de deseos respecto a los datos y definir tus hipótesis de trabajo
    • Resumen de todo el análisis
    • La herramienta de conceptualización del proyecto
      • ¿A quién va a ayudar el proyecto de innovación basada en el dato y qué esperas que sean capaces de hacer gracias al proyecto?
      • Escribe una definición clara y concisa del problema
      • ¿Qué fuentes de datos persigues para cumplir tus objetivos? Rellena la plantilla siguiente con esa información (repite la plantilla tantas veces como fuentes de datos hayas detectado).
      • Ajusta tus Preguntas Guía: ¿Podemos usar [la fuente de datos X] para profundizar en [en el aspecto Y del problema]?
      • Ajusta tus Hipótesis: Ya que sabemos que [hechos A] sobre [las(s) fuente(s) de datos X], creemos que podemos usar [datos específicos B] para abordar [el indicador del problema C]. Validaremos nuestros resultados en comparación a [datos existentes D].
    • Ejemplos de problemáticas

  • Los alumnos deberán proponer una problemática asociada a su TFM que presentaron en el master y deberán seguir los pasos indicados para proponer una mejora basado en el uso del dato y de la información disponible.

  • Becas y ayudas. EUDE Business School ha diseñado un Plan de Becas y Ayudas al Estudio con el único objetivo de proporcionar una mayor flexibilidad económica y respaldar las necesidades de cada alumno.

¿Quieres más información?

Completa este formulario y la academia se pondrá en contacto contigo.

Enviar mensaje

¿Quieres más información?

Completa este formulario y la academia se pondrá en contacto contigo.

Enviar mensaje
report

¿Algo no está bien?

Si has encontrado en este curso información que no está bien puedes reportar una incidencia aquí.

Garantiza la calidad de tu formación

Cursos certificados Nuestra certificación Contacta con nosotros
logosKitDigital
Volver arriba