MENÚ

Te encuentras en
  • Evento
  • Curso en Big Data con Apache Spark

Evento Curso en Big Data con Apache Spark

curso big data

 

¿Listo para incursionar en el mundo del Big Data?

Desde la Fundación Universitaria de Popayán y el Programa Ingeniería de Sistemas invitamos a nuestros egresados a ser parte del “Curso de Big Data”.

Descubre cómo Apache Spark puede ayudarte a superar las barreras del análisis de datos masivos.

Ven y aprende a escribir programas eficientes en PySpark y domina el arte del análisis de datos.

 

¡Únete ahora y explora las últimas tecnologías!

 

 

Generalidades
Detalles del Curso
Temáticas

 

En el mundo de la ciencia de datos, estos datos son llamados big (grandes), cuando superan la capacidad de almacenamiento de una máquina o servidor estándar.

Esto implica que analizar conjuntos de datos requiere múltiples servidores y sistemas distribuidos como Hadoop (HDFS) y modelos computacionales como MapReduce y Spark.

Objetivo


Con ayuda de nuestro curso, aprenderás a superar las barreras del análisis de datos masivos, utilizando Apache Spark.

Al finalizar, podrás reconocer:

– La importancia y el proceso del análisis de datos masivos.
– Cómo los modelos de computación como MapReduce y Apache Spark abordan el problema del análisis de datos masivos.
– La escritura de programas eficientes en Apache Spark con la librería PySpark, incluyendo conceptos fundamentales como transformaciones, acciones, persistencia, variables de difusión, acumuladores y pares clave-valor.

Competencias Específicas


Nuestro curso está dirigido a egresados de la Fundación Universitaria de Popayán – FUP que, preferiblemente cuenten con experiencia en el lenguaje de Programación Python.

Contamos con una combinación de dinámica de clases distribuida en clases magistrales en un 70% y talleres prácticos en 30%. A través de ello, esperamos que adquieran experiencia en el uso de librerías de PySpark en Google Colabs.

 

 

Ficha técnica del curso
Fecha1,4, 8 y 11 de abril 2024
Hora6:00 p.m. a 9:00 p.m.
Duración20 horas
Docente encargadoDr. Carlos Felipe Estrada Solano
ContactoEscríbeme
ModalidadVirtual

 

Introducción a Big DataMotivación de Big Data
¿De dónde proviene la Big Data?
Elementos de la minería de datos
Práctica: análisis de sentimientos en Twitter
Modelos de computación Big DataEl problema de Big Data
Hardware para Big Data
MapReduce y Apache Spark
Práctica: tutorial de PySpark
Fundamentos de SparkEstructura y ciclo de vida de un programa Spark
Conjuntos de Datos Distribuidos Resistentes
Transformaciones, acciones, variables y acumuladores
Práctica: contador de palabras
Gestión de datosDatos estructurados y uniones en Spark
Datos semiestructurados y dataframes en Spark
Práctica: análisis de registros de servidores Web

¿Requieres más información?

     

    EVENTOS

    Agéndate

    CALIDAD

    Educación de calidad con responsabilidad social