Keepler: “A adoção de IA generativa permite rever com precisão todo o conteúdo gerado antes de o disponibilizar”
Falámos com Ramiro Manso, chefe de IA generativa da Keepler Data Tech, sobre os recursos que suportam esta tecnologia, os desafios éticos que se colocam, mas também sobre o seu potencial e o impacto que poderá vir a ter nas empresas.
A IA generativa é o tema da atualidade. Desde que a OpenAI lançou o ChatGPT, este novo desenvolvimento da inteligência artificial passou a ocupar um lugar de destaque no debate público, a todos os níveis. Mais do que uma ferramenta utilizada pelas empresas, o ChatGPT veio democratizar o acesso ao uso da IA, colocando-a ao alcance de todos através de milhares de aplicações, cada uma com uma utilização específica.
As empresas estão a ser engolidas por esta onda, mas estão a tentar apanhá-la, na esperança de aproveitar alguns dos benefícios que possa trazer para os seus objetivos de negócio. Entre as vozes que lideram o debate da IA generativa, encontramos a Keepler Data Tech, uma empresa de serviços de dados na nuvem que ajuda os seus clientes a tornar-se organizações data-driven.
Como especialista em dados, a Keepler vê na IA generativa um grande potencial, que é preciso saber gerir e aplicar. A velocidade com que tudo avança à volta desta, assim como a necessidade de orientar os seus clientes neste processo de adoção, levou a empresa a colocar Ramiro Manso à frente de uma área específica: Head of Generative AI. Ramiro é um dos Data Leads da empresa que, desde que esta abriu, tem sido líder na área de dados. Agora, tem o desafio de estabelecer a IA generativa na organização, criar as capacidades internas necessárias e ajudar na implementação deste tipo de soluções junto dos clientes.
Falámos com ele para tentar perceber a transformação que a IA generativa causa nas organizações.
– Para quem ainda não a conhece, pode explicar-nos o que é a IA generativa? Quais são as diferenças que oferece em relação à IA tradicional?
A IA generativa é uma disciplina (relativamente nova) dentro do campo da inteligência artificial, que visa gerar novas observações (texto, áudio, imagens…) com base numa instrução ou prompt. A principal diferença relativamente a outras disciplinas é que, em casos como o do modelo de ML (modelo de linguagem) de classificação, o que se procura obter é um critério de diferenciação, ou , que separe as observações em classes: A ou B (ou C ou D…).
Usando um exemplo com imagens, seria a diferença entre treinar um modelo de deteção com fotos de gatos para que saiba identificá-los em novas imagens versus treinar um modelo de GenAI com fotos de gatos para que saiba inventar novas fotos de gatos.
– Até que ponto é que a IA generativa pode revolucionar o tratamento de dados e a geração de informação?
Estamos sem dúvida num ponto em que o que se avalia é precisamente a capacidade real destes modelos no momento de processar informação, sobretudo em termos de linguagem natural. Criar modelos, reescrever em diferentes tons de voz, identificar elementos no conteúdo… Um dos exemplos mais simples, mas mais eficazes para mim, é a capacidade de resumir informação. Tenho vindo a experimentar as diferentes aproximações que vão surgindo com o tempo: LDA para topic modelling, tf-idf para frases-chave num texto, redes recorrentes para resumos… Esta é a primeira vez que podemos dizer que estamos a gerar um resumo real da informação, tal como faria uma pessoa comum.
A aplicação destas tecnologias no campo de tratamento de dados tem um enorme impacto. Já para não falar da sua aplicação em código de programação! Autogeração de testes, comentários e até mesmo o próprio código.
– Todos os dias, vemos novas aplicações de IA generativa a sair para o mercado. Estamos perante uma bolha especulativa neste campo ou o seu potencial é tão real que convida à geração de uma oferta abundante?
Creio que ambas. É uma tecnologia inovadora que abrange muitas áreas. A disciplina de machine learning mais tradicional (embora me custe chamar-lhe “tradicional” e o faça com tantos apartes que precisaríamos de muito mais tempo) teve um grande impacto em áreas de negócio a nível de análise preditiva e prescritiva. Aqui, estamos perante um caso semelhante, mas com um obstáculo à entrada no mercado muito menos técnico e com um possível impacto muito mais generalizado.
Mas nem tudo o que reluz é ouro. Devemos estar plenamente conscientes de que este tipo de modelos é especialmente capaz de sintetizar informação, mas isto não quer dizer que seja capaz de a compreender. Distinguir entre capacidades reais e meros artifícios será o elemento diferenciador entre quem domina a disciplina e quem é vítima do hype.
– Quais são os principais casos de uso que têm vindo a identificar nas organizações mais propensas à utilização desta tecnologia?
Um dos principais casos de uso pelos quais uma organização pode começar é, provavelmente, o fornecimento de acesso à informação através de novas técnicas de pesquisa e resumo do conteúdo. Outro caso de uso recomendável para começar é a geração de modelos, tanto de documentação como de idealização, com base nos requisitos específicos.
Isto não significa que sejam os únicos casos, mas são talvez alguns dos mais acessíveis. Alguns exemplos mais complexos podem centrar-se na personalização de conteúdos e/ou experiências do cliente, seja adaptando as estratégias de marketing às características de cada pessoa ou segmento ou baseando-se nas suas preferências de compra. Também é possível gerar relatórios automatizados de diferentes fontes de dados que facilitem a tomada de decisões às equipas internas de uma empresa, permitindo-lhes verificar a informação.
Nem tudo tem de ser documentação escrita. Pensemos na prototipagem rápida de desenhos gráficos, na melhoria de modelos de computer vision através de técnicas de image augmentation baseadas na geração e finalização de imagens ou até na geração de música contextual com base no conteúdo de um vídeo.
Todos estes são casos com vários níveis de complexidade (e viabilidade) que estas tecnologias agora nos permitem. Um dos principais desafios é o de escolher qual é a melhor forma de as aplicar corretamente dentro de uma empresa.
– A nível de conhecimento e experiência, como é que uma empresa como a Keepler vive o aparecimento de uma tecnologia como esta?
Na Keepler, encaramos o aparecimento de uma tecnologia como a IA generativa como uma oportunidade de formação interna contínua e de identificação constante de tecnologias emergentes. Fazemos avaliações internas para compreender o seu potencial e as competências de que necessitamos para a poder aplicar corretamente. Além disso, analisamos as suas possíveis aplicações no nosso negócio e vigiamos de perto todas as mudanças rápidas nos frameworks e serviços que as apoiam.
Dois dos nossos valores como empresa são a melhoria contínua e a geração de valor, que nos ajudam a manter-nos firmes no nosso compromisso de inovar constantemente e oferecer soluções de última geração à medida que avançamos na era da IA generativa.
– Mais concretamente, de que forma é que estão a aplicar a IA generativa nos vossos serviços? Podem dar-nos alguns detalhes?
Perante a integração da IA generativa nos nossos serviços, propusemos uma estratégia baseada na resposta a estas perguntas-chave. Em primeiro lugar, avaliámos os aspetos dos nossos serviços já existentes que mais poderiam beneficiar da IA generativa, em termos de precisão, desempenho ou eficiência. Analisámos detalhadamente de que forma é que podemos potenciar e melhorar as soluções atuais, utilizando a AI generativa como ferramenta adicional para otimizar resultados.
Além disso, explorámos novas oportunidades que, sem esta tecnologia, não eram viáveis. Concentrámo-nos em determinar áreas em que a criação de conteúdo, a personalização e a tomada de decisões baseadas em dados podem alcançar novos níveis de qualidade e eficácia.
– O que devem ter em conta as grandes organizações quando começarem a solucionar casos de uso com esta tecnologia?
Há alguns aspetos importantes a ter em conta quando se começarem a abordar casos de uso com tecnologias como a IA generativa. Em primeiro lugar, os frameworks e ferramentas associados estão em constante alteração e não estão necessariamente prontos para produção, pelo que requerem uma avaliação concreta do seu estado, potenciais problemas e limitações. Além disso, os modelos de linguagem generativos não são deterministas (algo que não é novidade nos modelos ML, diga-se de passagem), o que implica a necessidade de estabelecer mecanismos de controlo de qualidade e de garantir uma revisão adequada do conteúdo gerado, antes da sua entrega aos utilizadores.
As organizações também devem ter em conta os riscos associados aos modelos de linguagem generativos, como a existência de preconceitos e a geração de conteúdo inapropriado, pelo que é fundamental implementar políticas e práticas sólidas, de ética e de gestão de IA.
Finalmente, é essencial educar os colaboradores internos e os clientes a respeito das capacidades e limitações destes modelos para evitar a difusão (interna ou externa) de informação incorreta ou potencialmente prejudicial. Ou simplesmente gerir corretamente as expetativas em relação à capacidade das tecnologias, algo que é compreensível para todas as pessoas que já trabalham há algum tempo com a AI.
– Outro assunto controverso tem a ver com os desafios éticos que enfrentamos com a adoção da IA generativa, como, por exemplo, o mau uso da tecnologia, a criação de fakes, a eliminação de postos de trabalho… Qual é a realidade a curto prazo neste sentido?
Esta é uma pergunta complicada, especialmente numa tecnologia tão recente e quando ainda não temos uma ideia bem definida das suas capacidades e limitações reais e de como podem evoluir no futuro.
A curto prazo, os desafios mais evidentes são o mau uso da tecnologia e a geração de conteúdo falso. Existe o risco de os modelos generativos serem utilizados para criar informação enganadora ou manipulada (os diferentes tipos de fakes que menciona), o que pode ter um impacto negativo na confiança do público em geral, gerar desinformação e conduzir à propagação de notícias falsas. Além disso, a substituição de determinados postos de trabalho devido à automatização generativa também é uma preocupação atual, seja porque existe um excesso de confiança nas capacidades destas tecnologias, seja porque a prioridade é de quantidade sobre qualidade.
– E a longo prazo?
A longo prazo, é provável que estes desafios éticos se tornem mais complexos, à medida que a tecnologia continua a evoluir. Conforme os modelos generativos se vão tornando mais sofisticados, as preocupações atuais relativas a temas como a privacidade podem agravar-se, devido aos avanços tecnológicos. Podemos observar algo semelhante nos processos em que a tomada de decisões se automatizou demasiado com sistemas generativos. É fundamental abordar estes desafios de forma proativa e implementar códigos éticos e regulamentações adequadas, de forma a salvaguardar a utilização responsável e segura da IA generativa.