Jose Gabriel Mita Rodriguez
Soy informático apasionado por el análisis de datos con experiencia en la gestión, limpieza y optimización de grandes volúmenes de datos. Domino SQL y Python, incluyendo bibliotecas como Pandas, NumPy y Matplotlib, lo que me permite transformar datos complejos en información clara y accionable. He desarrollado paneles interactivos y reportes automatizados que facilitan la comprensión de datos para diversas audiencias. Además, he trabajado en equipos ágiles utilizando metodologías Scrum, contribuyendo
a soluciones innovadoras y eficientes. Poseo habilidades en capacitación y soporte técnico, promoviendo el aprendizaje y la colaboración. Apasionado por la tecnología, me mantengo actualizado en las últimas tendencias de ciencia de datos para mejorar procesos y aportar valor a través de soluciones avanzadas.
Session
En esta charla exploraremos cómo PySpark, la interfaz de Python para Apache Spark, se convierte en una herramienta esencial para procesar grandes volúmenes de datos en entornos distribuidos. A lo largo de la sesión, los asistentes aprenderán cómo utilizar PySpark para trabajar con Big Data de manera eficiente, descubriendo sus principales componentes, como DataFrames y Spark SQL. Además, se presentarán ejemplos prácticos que demuestran la capacidad de PySpark para manejar datos masivos, ofreciendo una solución escalable y accesible para analistas de datos y desarrolladores que desean dar el siguiente paso después de Pandas.