Gerardo Vilcamiza Espinoza

Hola, soy Ingeniero Mecatrónico por la Universidad Peruana de Ciencias Aplicadas, donde me desempeño como investigador en el fascinante mundo de los satélites y la Visión por Computadora. Poseo una Maestría en Inteligencia Artificial en la Universidad de Buenos Aires, ampliando mis horizontes en esta revolucionaria área.

Para combinar mi pasión por enseñar y mi experiencia en el campo tecnológico, durante los últimos 4 años he sido docente de programación en Python enfocado al Machine Learning y al Procesamiento Digital de Señales. Además, en los últimos 3 años he trabajado como Data Scientist y AI Engineer en una empresa multinacional, roles que me han permitido diseñar e implementar soluciones innovadoras en la industria.

Mi compromiso con la divulgación tecnológica me ha llevado a compartir mis experiencias en diversos eventos académicos y profesionales, incluyendo charlas en congresos de IEEE en Perú, México y Colombia, ponencias en eventos empresariales para la industria tecnológica y participaciones destacadas para la comunidad de Python como speaker en Python Meetups Perú, PyDay Perú 2023, Pycon Colombia 2024 y en la Pycon Latam 2024 en México.


Session

16/11
14:40
30minutos
DeepSignBridge: Traductor de Lengua de Señas en Tiempo Real Basado en Transformers y Visión Artificial
Gerardo Vilcamiza Espinoza

Únete a nosotros en un viaje exploratorio detrás de las cámaras de “DeepSignBridge”, un sistema pionero que traduce la lengua de señas peruana a texto en tiempo real. Esta charla te llevará desde los cimientos de nuestro proyecto, comenzando con la exploración de arquitecturas de NLP como LSTM y GRU, pasando por las innovadoras CNN 1-D, hasta culminar en la elección de los Transformers, que revolucionaron nuestro enfoque.

Profundizaremos en los desafíos y las soluciones innovadoras en la detección de poses, destacando el uso de herramientas vanguardistas como MediaPipe y YOLO Pose, que nos permitieron capturar con precisión los gestos complejos del lenguaje de señas. Además, compartiremos nuestras experiencias comparando modelos de vanguardia como ViT y ConvNeXt, y cómo finalmente nos decidimos por MaxViT debido a su excepcional rendimiento y precisión. Además, aprenderemos como el API de ChatGPT nos puede ayudar a mejorar la traducción haciéndola más natural.

Inteligencia artificial (IA)
Auditorio