Whisper es un sistema de reconocimiento automático del habla (ASR) entrenado con 680.000 horas de datos multilingües y multitarea supervisados recogidos de la web. Gracias al uso de un conjunto de datos tan amplio y diverso, se mejora la solidez frente a los acentos, el ruido de fondo y el lenguaje técnico.
Seguramente, muchos ya conocen la tecnología GPT (Generative Pre-trained Transformer en inglés, o Transformador preentrenado generativo en español) de OpenAI. La cual, es un modelo de inteligencia artificial que permite generar lenguaje escrito mediante el empleo de un modelo de lenguaje auto-regresivo, es decir, un algoritmo que permite crear la siguiente mejor palabra que seguiría a un texto dado. Y que se ha hecho extremadamente famosa gracias a ChatGPT.
Sin embargo, OpenAI tiene muchos más proyectos de IA, entre los que destaca «Whisper». El cual, según su sitio web oficial, es descrito como un proyecto de código abierto que aporta un modelo versátil de reconocimiento del habla que puede transcribir, identificar y traducir varios idiomas. Sigue leyendo →