McClane acaba de conseguir el último capítulo de Perdidos y arde en deseos de verlo cuanto antes. Como lo ha bajado de un foro cutrero poco profesional, resulta que el capítulo está en versión original. Resulta paradójico que McClane domine todos los lenguajes de programación pero sólo hable castellano, y eso a pesar de tener un nombre tan inglés.
¿Qué hará McClane en esta peliaguda situación? Muy sencillo, ir al menú Reproducir -> Subtítulos -> Activar subtítulos automáticos. Al cabo de un instante los subtítulos empiezan a aparecer pero... ¡horror! los subtítulos salen también en inglés.
- Tranquilo McClane,--piensa con calma-- sólo tengo que configurar los subtítulos.
Así pues, McClane vuelve al menú Reproducir -> Subtítulos -> Configuración... y una vez allí, selecciona Español como idioma preferido. Un instante después los subtítulos cambian de idioma y McClane ya puede ponerse cómodo para disfrutar de su serie preferida.
Y todo gratis con sólo hacer unos cuantos clicks.
¿Qué hará McClane en esta peliaguda situación? Muy sencillo, ir al menú Reproducir -> Subtítulos -> Activar subtítulos automáticos. Al cabo de un instante los subtítulos empiezan a aparecer pero... ¡horror! los subtítulos salen también en inglés.
- Tranquilo McClane,--piensa con calma-- sólo tengo que configurar los subtítulos.
Así pues, McClane vuelve al menú Reproducir -> Subtítulos -> Configuración... y una vez allí, selecciona Español como idioma preferido. Un instante después los subtítulos cambian de idioma y McClane ya puede ponerse cómodo para disfrutar de su serie preferida.
Y todo gratis con sólo hacer unos cuantos clicks.
LA IDEA
El relato anterior no tiene nada de increíble.
Hace años que existe el reconocimiento del habla (me recuerdo hará unos diez años en mi pentium 600 leyendo páginas del Quijote para "entrenar" a mi ordenador) aunque sus aplicaciones sean escasas a día de hoy, pero reconoced que alguna vez le habéis dicho información a una máquina teleoperadora.
La teoría básica del reconocimiento no es muy compleja, lo malo es que los sistemas actuales son propietarios y desarrollar uno desde cero es costosísimo, aunque con algún buen trato se podría intentar usar un sistema ya hecho. También se puede usar un sistema libre, aunque va a ser mucho más malo. De todas formas, aunque haya un porcentaje de palabras no reconocidas, tampoco pasa nada, yo he bajado subtítulos de calidades lamentables y estaban hechos por humanos (o quizás por monos esclavos).
El otro tema es la traducción automática. Aquí la cosa se complica. Muchos hemos usado el traductor de Google con pésimos resultados. Y eso que Google está apostando muy fuerte por la traducción, con la intención de que en un futuro se pueda buscar información en TODA la red sin importar en qué idioma fue creada. Pero bueno, una cosa es que la traducción sea mala y otra que no se pueda hacer, y poder se puede.
Hace años que existe el reconocimiento del habla (me recuerdo hará unos diez años en mi pentium 600 leyendo páginas del Quijote para "entrenar" a mi ordenador) aunque sus aplicaciones sean escasas a día de hoy, pero reconoced que alguna vez le habéis dicho información a una máquina teleoperadora.
La teoría básica del reconocimiento no es muy compleja, lo malo es que los sistemas actuales son propietarios y desarrollar uno desde cero es costosísimo, aunque con algún buen trato se podría intentar usar un sistema ya hecho. También se puede usar un sistema libre, aunque va a ser mucho más malo. De todas formas, aunque haya un porcentaje de palabras no reconocidas, tampoco pasa nada, yo he bajado subtítulos de calidades lamentables y estaban hechos por humanos (o quizás por monos esclavos).
El otro tema es la traducción automática. Aquí la cosa se complica. Muchos hemos usado el traductor de Google con pésimos resultados. Y eso que Google está apostando muy fuerte por la traducción, con la intención de que en un futuro se pueda buscar información en TODA la red sin importar en qué idioma fue creada. Pero bueno, una cosa es que la traducción sea mala y otra que no se pueda hacer, y poder se puede.
EL PROCEDIMIENTO
Ahora que sabemos que todo lo fundamental para nuestra idea ya existe, sólo nos queda desarrollar el software de aplicación, que ya aviso no tiene nada de misterioso. Hay programas comerciales que hacen ambas cosas por separado. Algún día que tenga tiempo, haré los primeros ensayos del subtitulador paso a paso, aunque la idea es hacerlo todo autómatico en un filtro del reproductor.
Del archivo de vídeo se extrae el audio mientras el vídeo se guarda en memoria. Se procesa el audio con el subsistema de reconocimiento de voz. En caso de que no corresponda con el idioma a mostrar se traduce. Se empieza a mostrar el vídeo que tenemos en memoria con el audio procesado y se incorporan los subtítulos.
Tachán!
Del archivo de vídeo se extrae el audio mientras el vídeo se guarda en memoria. Se procesa el audio con el subsistema de reconocimiento de voz. En caso de que no corresponda con el idioma a mostrar se traduce. Se empieza a mostrar el vídeo que tenemos en memoria con el audio procesado y se incorporan los subtítulos.
Tachán!
Notas Finales
- Antes de comenzar la reproducción hay que esperar que se procese una cierta cantidad de información.
- Una cosa que merece la pena destacar es que el tiempo necesario para el proceso no depende de la entrada, vamos, que da igual qué vídeo tengas, siempre tardará lo mismo, con lo que no se crean parones a mitad de la reproducción.
- Como he dicho, el reconocimiento de voz no es sencillo, pero a las malas se puede extraer el vídeo en un archivo y meterlo como entrada en algún programa ya existente. Lo malo es que tardaría más en comenzar el vídeo.
- La traducción se puede hacer también con un programa externo ya existente, aunque la calidad seguramente será mala.
- El sistema también sirve para crear archivos de subtítulos en varios idiomas. Aunque luego haya que corregirlos, el trabajo pesado ya lo hace él solo.



