sábado, 23 de febrero de 2013

Presentación

Hola,

somos Diego Avendaño Peces y Jose Mª Bermudo Mera, dos alumnos de la Escuela Técnica Superior de Ingenieros de Telecomunicación de la Universidad Politécnica de Madrid. Vamos a utilizar este blog para ir mostrando los avances que vamos realizando en el proyecto de la asignatura Sistemas Digitales II.

Nuestro proyecto consiste en la realización de un sistema empotrado basado en la Raspberry Pi cuya finalidad será la de identificar el idioma del locutor. Este sistema puede tener múltiples usos, como la personalización automática del idioma en una interfaz, el acceso a contenidos audiovisuales propios del idioma, el control de acceso a un determinado servicio, aplicaciones en seguridad o incluso la implementación de un sistema de traducción automático.

A continuación realizamos una breve descripción de las etapas del proyecto:

  • Hito 1
Nuestro primer objetivo será capacitar a la Raspberry Pi para capturar una señal de audio (ya que no dispone de entrada de micrófono), grabar un archivo con el audio y conectarnos a un servidor, en el que se ejecutarán los algoritmos de identificación de idioma desarrollados por el Grupo de Tecnología del Habla perteneciente al Departamento de Ingeniería Electrónica. 

Una vez se ha realizado la identificación, el servidor devolverá un mensaje indicando el idioma reconocido y la fiabilidad de dicho reconocimiento.

  • Hito 2
A partir del resultado de la identificación le añadiremos al sistema una funcionalidad concreta (de las descritas anteriormente) a modo de interfaz con el usuario. En concreto, buscaremos interactuar con algún servicio ofrecido por Google.

  • Hito 3
En esta última etapa, intentaremos integrar los algoritmos en la Raspberry Pi, para que el sistema sea autónomo y no dependa de la conectividad con un servidor externo. Los algoritmos originales fueron programados en Matlab, por lo que en esta parte nos centraremos en buscar una alternativa a Matlab que se pueda ejecutar sobre la Raspberry Pi.