Inteligência artificial ajuda a dar voz a quem a perdeu

Machine-learning-e-Intelig%C3%AAncia-artificial-e1568748202967.jpg?profile=RESIZE_710x

O Globo

Jornalista: Sérgio Matsuura

 

16/02/20 - Doenças degenerativas, como a esclerose lateral amiotrófica (ELA) muitas vezes resultam em problemas de comunicação. Estudos mostram que um em cada quatro pacientes com ELA desenvolve problemas na fala. O físico britânico Stephen Hawking, morto há dois anos, era um exemplo dessa condição. Para se comunicar, estava sempre conectado a um computador, dotado de um sistema complexo ativado por um sensor em sua bochecha. Nos laboratórios do Google, pesquisadores estão aplicando a inteligência artificial para criar uma ferramenta mais simples para essas pessoas, capaz de funcionar apenas com um smartphone.

A ideia surgiu de uma necessidade do matemático russo Dimitri Kanevsky. Surdo desde a infância, o pesquisador dedicou sua vida ao desenvolvimento de tecnologias de reconhecimento de voz para facilitar a sua comunicação. Formado na Universidade Estatal de Moscou, migrou para Israel ainda nos anos 1970, para inciar sua carreira de professor na Universidade de Tel Aviv.

— Era muito difícil. Os estudantes não me entendiam e eu não os entendia — diz Kanevsky, que domina o inglês, mas tem a fala prejudicada pela deficiência auditiva.

Então, ele passou a se dedicar à pesquisa nos prestigiados Instituto de Ciências Weizmann (Israel), Instituto Max Planck (Alemanha) e Instituto para Estudos Avançados, em Princeton (EUA). Inventou um aparelho auditivo multicanal e desenvolveu o primeiro sistema de reconhecimento de voz para auxílio a deficientes auditivos em telefones. Entre 1986 e 2014, trabalhou na IBM, onde desenvolveu aplicações para o uso da fala para biometria e o ViaScribe, software que transcreve a fala em tempo real.

Depois, migrou para o Google, onde atua no desenvolvimento de algoritmos de reconhecimento de voz. Participou da criação do aplicativo Live Transcribe, que transcreve conversas em tempo real em mais de 70 línguas. Mas, por causa de seus problemas na fala, o programa o auxilia apenas a entender o que outras pessoas dizem, não para ele próprio se expressar. O projeto Euphonia surgiu para resolver esse problema.

— As tecnologias de inteligência artificial trabalham com muitos dados para treinamento. Essencialmente, amostras de falas — explica Julie Cattiau, gerente de produtos do Google envolvida no projeto. — Mas uma coisa que percebemos, e que motivou este projeto, é que, para pessoas com uma variedade de condições, como ELA, Síndrome de Down e paralisia cerebral, o reconhecimento de voz não é tão confiável. Para Dimitri, que é surdo desde um ano de idade e nunca se ouviu falando inglês, temos o mesmo problema.

O projeto piloto foi realizado com o algoritmo do Live Transcribe treinado com a fala de Kanevsky. Em vez das amostras de várias pessoas, o sistema foi alimentado com cerca de 20 mil sentenças lidas pelo pesquisador. E os resultados são promissores.

— Tudo o que eu preciso para conversar é um smartphone — celebra Kanevsky. — Entender e ser entendido é absolutamente inacreditável.

O projeto também está trabalhando com alguns pacientes com ELA, em parceria com ONGs, para gravar falas de pessoas que sofrem com a doença degenerativa. A ideia é que, no início, cada pessoa tenha um aplicativo personalizado. Com o tempo, e mais dados, é possível que o algoritmo encontre padrões para compreender qualquer um.

O projeto ainda está no início. No momento, os pesquisadores se debruçam sobre questões como quais as melhores sentenças para os pacientes gravarem e qual o volume mínimo de dados para a personalização do algoritmo.

— Apesar de o trabalho ter funcionado muito bem para o Dimitri, ainda não chegamos no ponto para pessoas com ELA, Síndrome de Down ou outras condições neurológicas — diz Julie. — Temos muito trabalho pela frente.

O ex-jogador de futebol americano Tim Shaw, diagnosticado com ELA em 2013, perdeu a voz por causa da doença. Com a inteligência artificial, pesquisadores do Euphonia puderam substituir a voz robótica dos computadores pela do próprio atleta.

— Para além da comunicação, a voz faz parte da identidade das pessoas — diz Julie.

A facilidade de se trabalhar com técnicas de inteligência artificial está abrindo portas para projetos antes impensáveis. Kanevsky, por exemplo, vislumbra o uso desses algoritmos para buscar padrões em choros de bebês, para que pais possam entender as necessidades de recém-nascidos. Ou para, quem sabe, permitir que as pessoas “conversem” com seus animais de estimação. (*O repórter viajou a convite do Google)

Enviar-me um e-mail quando as pessoas deixarem os seus comentários –

DikaJob de

Para adicionar comentários, você deve ser membro de DikaJob.

Join DikaJob

Faça seu post no DikaJob