GPUs NVIDIA AI ajudam o Bing a pesquisar imagens dentro de fotos

Pesquisas estão mais inteligentes graças à AI e as GPUs NVIDIA.

Bing da Microsoft tem como diferencial perante aos demais navegadores a possibilidade de o usuário pesquisar imagens dentro de fotos. É possível até comprar itens encontrados nas fotos. Por exemplo, um fã de “Velozes e Furiosos” que quer personalizar seu carro com os acessórios que viu no filme pode descobrir onde comprar selecionando o item. Em outro caso, uma pessoa que está reformando a sala de estar e viu uma foto de um lustre reluzente que adicionaria o tipo certo de elegância ao ambiente pode saber qual é a marca do produto e onde encontrá-lo.

Em ambos os casos, a inteligência artificial pode ajudar com um sistema de identificação de imagens dentro da imagem. Para isso, basta ao interessado desenhar uma caixa ao redor da figura para destacá-la. A Pesquisa Visual do Bing mostrará fotos semelhantes à sua seleção, onde comprar o item e, em muitos casos, já aparecerá com o preço.

“Queremos ir além da caixa de pesquisa”, diz Meenaz Merchant, líder do Grupo de Pesquisa Visual do Bing.

Como o Bing reconhece uma Louis Vuitton
Este novo tipo de pesquisa não é apenas para compras. O usuário pode fazer upload das suas próprias fotos ou selecionar qualquer coisa on-line — uma torta de maçã, uma cachoeira, um hotel — e a Pesquisa de Imagens do Bing retornará fotos semelhantes e tags que descrevem como o mecanismo de pesquisa entende o que está na foto. Ao selecionar uma imagem parecida, você poderá ver informações úteis, como receitas de tortas de maçã, a localização da cachoeira ou o nome do hotel.

A Pesquisa Visual funciona com deep learning, tornando-se mais precisa quanto mais for usada. Por enquanto, as imagens relacionadas às vezes parecem visualmente semelhantes, mas não são de fato a mesma coisa. Pesquise aquele vestido esportivo amarelo usado por Emma Stone em “La La Land” e você encontrará mais vestidos amarelos, mas todos eles são vestidos de noite.

Embora o Bing não seja o primeiro a apresentar a pesquisa em uma imagem, sua vantagem, de acordo com Merchant, é a vasta coleção de imagens do índice de pesquisa do Bing.

“Se alguém estiver segurando uma bolsa Louis Vuitton, podemos identificá-la porque vimos milhares de imagens dessas bolsas”, explica Merchant.

Ao usar a pesquisa de imagem dentro de imagem do Bing, você pode selecionar parte de uma foto, ver imagens semelhantes e descobrir o que aparece na foto.

O futuro da pesquisa
Merchant e sua equipe usam imagens do índice de pesquisa do Bing, juntamente com GPUs da NVIDIA, para treinar o algoritmo de deep learning para a Pesquisa Visual. Todas as imagens são identificadas ou, na linguagem do deep learning, rotuladas.

Os pesquisadores fornecem uma explicação técnica detalhada de como funciona a Pesquisa de Imagens do Bing e das tecnologias de compreensão de imagens por trás dela nesta publicação no blog. Além da pesquisa de imagens no website e no aplicativo móvel, o Bing lançou uma API para que os desenvolvedores possam incorporar a Pesquisa Visual aos seus aplicativos. Merchant destaca que sua equipe continua a trabalhar na simplificação das pesquisas. “Estamos trabalhando em melhorias”, afirma.

Em breve, a Pesquisa de Imagens do Bing ajudará as pessoas a escolherem objetos sem precisar desenhar uma caixa, afirmou Merchant. Ele disse que o Bing também planeja conectar os objetos identificados ao repositório de conhecimento gráfico Satori e Web Bing para que, quando o mecanismo de pesquisa identificar uma celebridade, por exemplo, o usuário possa receber informações detalhadas sobre essa pessoa. Quando for um produto, o Bing mostrará onde comprá-lo.

“A pesquisa visual é uma fração da pesquisa de texto atualmente”, diz Merchant. “Agora que todos estão carregando uma câmera de alta resolução, ela terá rápido crescimento nos próximos anos e talvez até mesmo supere o texto”, finaliza.