Novidades sobre comunicação, educação, empreendedorismo, tecnologia, inovação e muito mais.

22 de Março de 2021

Novo sistema de leitura labial transcreve falas a partir da câmera do celular

[0] Comentários | Deixe seu comentário.

Cientistas de um laboratório focado no desenvolvimento de ferramentas de acessibilidade para computadores desenvolveram um sistema para leitura labial. O LipType, como foi nomeado, se apoia nas câmeras de aparelhos e no tratamento de algoritmos para identificar falas e transcrevê-las — e as aplicações vão além de enviar mensagens.

 

A criação do laboratório Human-Computer Interaction Group não é inédita, mas é uma das mais avançadas ferramentas de leitura labial por visão computacional já vistas. Originalmente pensadas como um recurso de acessibilidade, as aplicações do LipType se estendem como um mecanismo de privacidade e até segurança em situações de perigo específicas.

“Há vários erros nas transcrições, especialmente em lugares muito barulhentos, ou para pessoas com problemas de dicção ou não falantes nativos [de um idioma]”, comenta o professor Sabbir Arif, que comandou o projeto. “Contudo, LipType funciona para todos: para pessoas que precisam enviar uma mensagem privada num ambiente público ou numa reunião, e com o LipType se poderia 'dizer' as palavras sem emitir sons”, explicou.

Acompanhado do hardware contido nas câmeras, o algoritmo trabalha arduamente para identificar cada uma das palavras “pronunciadas” pelo usuário. Para isso, os pesquisadores precisaram incluir vários filtros para adaptar o sistema às mais variadas condições de luz e corretores de erros baseados em modelos da linguagem.

Os resultados se mostraram promissores. Os próprios pesquisadores reconhecem que as melhorias do LipType na leitura labial são significativas e podem trazer mudanças reais no cotidiano de pessoas com problemas na fala. Essa avaliação, inclusive, foi reforçada por uma pesquisa conduzida pelo laboratório entre com portadores e não portadoras de deficiências físicas e a avaliação geral foi positiva: a maioria afirma que usaria a ferramenta no dia a dia.

“LipType analisou falas 58% mais rápido e com 53% mais precisão que qualquer outra solução em vários cenários reais, incluindo em condições de baixa luz e ambientes cheios”, comentou o estudante de graduação em ciência da computação e engenharia Laxmi Pandey.

Fonte: Canaltech, disponível em: https://canaltech.com.br/inovacao/novo-sistema-de-leitura-labial-transcreve-falas-a-partir-da-camera-do-celular-180973/

Deixe seu comentário

O seu endereço de e-mail não será publicado.

Sobre Juliska

Juliska Azevedo é jornalista natural de Natal-RN, com larga experiência em veículos de comunicação e também assessoria de imprensa nos setores público e privado.

+ Leia mais

Categorias