Recentemente, a Google revelou novidades significativas no que diz respeito às suas tecnologias baseadas em inteligência artificial generativa. A empresa apresentou o Gemini, o seu modelo de linguagem mais potente até à data, que já foi integrado no Bard. Este modelo permitirá à Google incluir a sua IA em todo o tipo de dispositivos e aplicações, dispondo de três versões que escalam em potência e parâmetros: Gemini Nano, Pro e Ultra.
Contudo, estas não foram as únicas notícias sobre IA que a Google partilhou recentemente. A gigante tecnológica também revelou os seus avanços na tecnologia de geração de imagens por meio de IA. A Google divulgou mais informações sobre o Google Imagen 2, uma IA que pretende rivalizar com o DALL-E, Stable Diffusion e outras alternativas do sector.
O Google Imagen 2 é a IA da Google para gerar imagens. Já tínhamos conhecimento de algumas das capacidades do Google Imagen no ano passado, precisamente quando a IA generativa começava a ganhar cada vez mais importância. No entanto, até agora, a Google ainda não tinha disponibilizado ao público esta tecnologia de geração de imagem
Recentemente, a Google partilhou mais detalhes sobre a sua tecnologia de geração de imagem, além de a tornar disponível para desenvolvedores e membros do Google Cloud. A tecnologia está a ser desenvolvida pela equipa da Google DeepMind, os mesmos que nos trouxeram o Gemini.
Embora nem todos possam ainda aceder a esta tecnologia, a Google adiantou algumas características que o Google Imagen 2 irá oferecer. Entre elas, encontramos a possibilidade de gerar imagens fotorealistas e de alta precisão através de prompts em linguagem natural, renderização de texto em múltiplos idiomas para criar imagens com sobreposição de texto e geração de logótipos.
A tecnologia também será capaz de nos fornecer informações para gerar legendas a partir de imagens e também para responder a perguntas que façamos sobre qualquer detalhe da imagem. O Google Imagen 2 é oferecido através do Vertex AI, uma plataforma que permite trabalhar com um conjunto de ferramentas baseadas em IA para prototipagem e teste de modelos de IA generativa. A tecnologia foi lançada em forma de Preview e é compatível com sete idiomas, incluindo o português.
Ainda não sabemos quando a Google planeia lançar a ferramenta para todo o público. Por enquanto, a empresa continua a ser muito conservadora ao lançar este tipo de produtos. Não é para menos, pois suscitam todo o tipo de dúvidas e um debate sobre a ética no uso destas tecnologias. No entanto, esta estratégia está a afectar a sua liderança nesta nova onda de tecnologias, que por enquanto é liderada pela OpenAI.
Embora a empresa ainda não tenha tornado estas tecnologias amplamente acessíveis ao público, é evidente que está a fazer progressos significativos nesta área. No entanto, a sua abordagem conservadora ao lançamento de novos produtos pode estar a afectar a sua posição de liderança no campo da IA generativa. É um equilíbrio delicado entre inovação e ética, e será interessante ver como a Google e outras empresas navegam neste espaço em constante evolução.