Gerardo Vilcamiza Espinoza PyDay La Paz 2024

Gerardo Vilcamiza Espinoza
.ical

Hola, soy Ingeniero Mecatrónico por la Universidad Peruana de Ciencias Aplicadas, donde me desempeño como investigador en el fascinante mundo de los satélites y la Visión por Computadora. Poseo una Maestría en Inteligencia Artificial en la Universidad de Buenos Aires, ampliando mis horizontes en esta revolucionaria área.

Para combinar mi pasión por enseñar y mi experiencia en el campo tecnológico, durante los últimos 4 años he sido docente de programación en Python enfocado al Machine Learning y al Procesamiento Digital de Señales. Además, en los últimos 3 años he trabajado como Data Scientist y AI Engineer en una empresa multinacional, roles que me han permitido diseñar e implementar soluciones innovadoras en la industria.

Mi compromiso con la divulgación tecnológica me ha llevado a compartir mis experiencias en diversos eventos académicos y profesionales, incluyendo charlas en congresos de IEEE en Perú, México y Colombia, ponencias en eventos empresariales para la industria tecnológica y participaciones destacadas para la comunidad de Python como speaker en Python Meetups Perú, PyDay Perú 2023, Pycon Colombia 2024 y en la Pycon Latam 2024 en México.

Session

16/11

14:40

30minutos

DeepSignBridge: Traductor de Lengua de Señas en Tiempo Real Basado en Transformers y Visión Artificial

Gerardo Vilcamiza Espinoza

Únete a nosotros en un viaje exploratorio detrás de las cámaras de “DeepSignBridge”, un sistema pionero que traduce la lengua de señas peruana a texto en tiempo real. Esta charla te llevará desde los cimientos de nuestro proyecto, comenzando con la exploración de arquitecturas de NLP como LSTM y GRU, pasando por las innovadoras CNN 1-D, hasta culminar en la elección de los Transformers, que revolucionaron nuestro enfoque.

Profundizaremos en los desafíos y las soluciones innovadoras en la detección de poses, destacando el uso de herramientas vanguardistas como MediaPipe y YOLO Pose, que nos permitieron capturar con precisión los gestos complejos del lenguaje de señas. Además, compartiremos nuestras experiencias comparando modelos de vanguardia como ViT y ConvNeXt, y cómo finalmente nos decidimos por MaxViT debido a su excepcional rendimiento y precisión. Además, aprenderemos como el API de ChatGPT nos puede ayudar a mejorar la traducción haciéndola más natural.

Inteligencia artificial (IA)

Auditorio

Gerardo Vilcamiza Espinoza .ical

Session

Gerardo Vilcamiza Espinoza
.ical