Grupo de Tecnoloxías Multimedia |
---|
|
IP: Carmen García Mateo |
http://gtm.uvigo.es |
Este equipo investigador da Universidade de Vigo (UVIGO) ten unha ampla e contrastada experiencia nas liñas de investigación de conversión texto-voz (TTS), recoñecemento automático de voz (ASR), adquisición de recursos lingüísticos nos idiomas galego e castelán, detección facial mediante procesado de imaxe, e busca en contidos multimedia. Nestes campos participou nun bo número de proxectos financiados a nivel europeo, estatal e autonómico, ademais de asinar diversos contratos con empresas. Como resultado, dispón dos seus propios algoritmos e ferramentas software, aspecto que permite a súa adaptación a un novo marco experimental nun prazo breve. Desde 2007 o GTM está considerado pola Xunta de Galicia como “Grupo de referencia competitivo” e desde entón os seus membros publicaron, en liñas de traballo relacionadas con este proxecto, 30 artigos en revistas do JCR e mais de 60 comunicacións en congresos internacionais. Unha fracción significativa desta produción científica ten a súa orixe en colaboracións establecidas con outros grupos investigadores, institucións, consorcios e empresas. A nivel español cabe destacar a longa e estreita relación que o GTM mantén con grupos investigadores da UPC e EHU-UPV, co resto de grupos estatais afíns no marco da Red Temática en Tecnología del Habla (RTTH), ademais de con lingüistas no marco dun convenio co Centro Ramón Piñeiro para a Investigación en Humanidades, centro dependente da Xunta de Galicia. A nivel internacional cabe mencionar a colaboración con outras universidades e empresas europeas no marco da Acción COST IC1206 “De-Identification for Privacy Protection in Multimedia Content”. Ademais, o GTM participou activamente na rede de excelencia BioSecure- Biometrics for Secure Authentication; na actualidade participa na rede de excelencia META-NET (A Network of Excellence forging the Multilingual Europe Technology Alliance) e na Acción COST IC1106. Entre os proxectos relacionados coas tecnoloxías da fala merecen mención especial os proxectos coordinados máis recentes “SpeechTech4All: Investigacion avanzada en tecnologías del habla para aplicación a entornos audiovisuales de interacción hombre-máquina inclusiva TEC38939-C03-01 e o vixente “Detección multimedia y multilingüe de información sobre personas – TraceThem” de referencia TEC2015-65345-P. Nestes dous proxectos o GTM, ademais de mellorar os seus sistemas de TTS e ASR, adquire experiencia en tradución automática estatística (SMT) e no último reforza a súas liñas de extracción de información dos falantes mediante procesado do audio e do video. A transferencia tecnolóxica do GTM no campo do recoñecemento e síntese de voz está articulada a través de acordos de licencia dos seus recursos (bases de datos vocais, lingüísticas, etc.) e dalgunhas das tecnoloxías desenvoltas. Polo que se refire a recoñecemento facial, mantivéronse contratos con varias empresas do ámbito da seguridade e licenciouse un SDK de análise demográfica (con estimación de sexo e idade) a unha terceira empresa do ámbito da publicidade. En canto a organización de congresos e escolas de verán internacionais, o grupo foi o organizador do congreso FALA2010: VI Jornadas en Tecnología del Habla and II Iberian SLTech Workshop, a AERFAI Summer School 2012 on Pattern Recognition in Multimodal Human Interaction, e a “2013 RTTH Summer School on Speech Technology Evaluation”. Das actividades previamente descritas conclúese que o GTM dispón das ferramentas necesarias para o desenvolvemento do proxecto proposto e, ademais, tamén dispón dos contactos con grupos de investigación, centros tecnolóxicos e empresas necesarios para permitir a adquisición de posibles recursos adicionais. MembrosOs investigadores do grupo que traballan en tecnoloxía da fala e participarán na rede son:
|