O Google deu um passo significativo na evolução da inteligência artificial generativa na quinta-feira (1º), ao anunciar que o Google Bard agora possui a capacidade de gerar imagens fotorrealistas a partir de descrições textuais.
A atualização coloca o Bard em competição direta com ferramentas renomadas como Dall-E e Midjourney, marcando um avanço notável na interação humano-IA.
A nova funcionalidade permite que os usuários criem imagens detalhadas utilizando apenas descrições em inglês. Por exemplo, ao inserir comandos como “dog riding a surfboard” (cachorro surfando em uma prancha), o sistema oferece quatro variações de imagens geradas pela IA.
O Google assegura que todas as imagens produzidas pelo Bard terão uma marca d’água digital, facilitando a distinção entre fotos originais e as criadas artificialmente, uma medida para promover a transparência e a autenticidade no universo digital.
Esta inovação é fruto da tecnologia Imagen 2, que exemplifica a integração avançada de processamento de texto para imagem, elevando o potencial criativo e aplicativo do Bard.
Melhorias no Sistema
Além da impressionante capacidade de geração de imagens, o Google implementou outras melhorias significativas no Bard. No ano passado, a ferramenta foi integrada ao Gemini Pro, um avançado modelo de linguagem grande e multimodal, melhorando substancialmente as funções de compreensão, raciocínio, síntese e programação em inglês.
Agora, esta tecnologia está disponível em todos os idiomas suportados pela plataforma, incluindo o português, democratizando o acesso a uma inteligência artificial mais sofisticada e versátil.
O Google também introduziu a funcionalidade “Dupla verificação”, ampliando a confiabilidade das interações com o Bard.
Disponível em 40 idiomas, essa ferramenta permite aos usuários realizar buscas adicionais no Google diretamente a partir das respostas fornecidas pela IA, enriquecendo a experiência de pesquisa com fontes diversificadas e validadas.