Microsoft cria inteligência artificial que rastreia olhar e funciona em qualquer câmera

Microsoft cria inteligência artificial que rastreia olhar e funciona em qualquer câmera

A Microsoft criou um sistema de inteligncia artificial que faz o mapeamento dos olhos de um usurio a fim de rastrear seus movimentos oculares. A proposta usar a tecnologia para criar um mtodo de navegao mais preciso e que simule, com o olhar, os movimentos de um mouse comum. A ideia ajudar pessoas com dificuldades motoras, que, hoje, precisam gastar milhares de dlares em equipamentos mecnicos ou, no caso de solues baseadas em software, lidar com a alta probabilidade de falhas de leitura.

A documentao primria publicada pela Microsoft no estabelece um nome para o recurso, mas detalha como ele encontra a sua origem em outra pesquisa similar: o EyeGazer, desenvolvido pelo MIT (Instituto de Tecnologia de Massachusetts), serve de inspirao para a empresa liderada por Satya Nadella. Vale citar, o Windows 10 foi o primeiro sistema operacional da Microsoft a contar com os recursos EyeControl, que permitem o controledo mouse pelo olhar;e o Eye Drive Library, que d o mesmo controle a um joystick plugado no computador.

Reprodu

Grfico que ilustra o mapeamento do rosto e olhos na tecnologia da Microsoft.Imagem: Microsoft/Divulgao

No modelo mais recente, a Microsoft mapeou a regio frontal da face, o olho esquerdo e olho direito, separando-os em grades. Tais imagens so comparadas a modelos implementados em uma biblioteca (esta, baseada no algoritmo ResNet18). O resultado disso o processamento de pontos de direo do olhar, separados em coordenadas. E o mais interessante: funciona em qualquer webcam.

O modelo criado pela Microsoft ento pega tudo isso e “treina” suas capacidades preditivas na biblioteca de dados do EyeGazer, ao mesmo tempo em que conduz aprimoramentos de dados para conseguir antecipar eventuais alteraes de ngulo e movimentos do rosto, imitando possibilidades no mundo real. De forma aleatria, o modelo altera volumes de brilho, contraste, saturao e cor a fim de aprender a lidar com mudanas que softwares de rastreamento ocular atuais no conseguem processar.

Finalmente, o modelo completo ainda usa uma biblioteca de sistemas de deteco facial chamada “Dlib”, que considera movimentos como rotao da cabea e tronco, exibindo imagens mais vvidas, em melhor definio e de melhor qualidade. Isso importante, j que o EyeGazer do MIT, por exemplo, no considera capturas acima das sobrancelhas ou abaixo dos lbios. Depois de um processo que envolve remapear as imagens da Dlib ao modelo pr-existente da Microsoft, a tecnologia resultante insere movimentos completos da cabea, olhos e expresses faciais no quadro original de 25 x 25 linhas.

Reprodu

Ilustrao que mostra a captura do sistema desenvolvido pelos pesquisadores.Imagem: Microsoft/Divulgao

Os autores do projeto determinaram que os modelos tendem a se concentrar mais no monitoramento dos olhos, mas tambm prestam ateno na sobrancelha e na borda inferior da plpebra. Em outras palavras, no enxergam apenas o movimento do olhar, mas tambm identificam os msculos faciais ativados quando uma pessoa, por exemplo, move o olho junto do rosto em uma direo qualquer.

“Modelos trigonomtricos que se concentram apenas na pupila e na ris no necessariamente captam esses detalhes e, por isso, esse o ponto que o aprendizado aprofundado [da IA] pode explorar a fim de aprimorar a sua preciso”, disseram os pesquisadores.

Como o estudo publicado ainda uma premissa, ou seja, ainda no tem uma aplicao em ambiente real, o objetivo dos autores agora o de estabelecer arquiteturas de redes neurais customizadas para melhorar ainda mais a performance: “O rastreamento do olhar, enquanto tecnologia de acessibilidade, tem muitos obstculos, incluindo a falta de interoperabilidade e a inexistncia de um conjunto de dados diversificado e grande, que cubra problemas de ocultao da face, movimentos e poses da cabea e diversas condies dos olhos”, os estudiosos afirmaram. “Essa pesquisa traz a promessa de que, um dia, qualquer computador, tablet ou smartphone seja controlvel pelo dos seus olhos graas capacidade preditiva de redes neurais”.

Fonte: Venture Beat


Microsoft Pesquisa Acessibilidade Inteligncia Artificial rastreamento inteligncia pesquisadores

GarotoProdigio

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *