#7 Lançamento do GPT-4, Hackathon do ChatGPT e Avanços na Geração de Imagens com ControlNet

A newsletter dessa semana cobre grandes avanços nas Inteligências Artificiais Generativas e a concretização de parte do potencial dessas AIs na criação de novos negócios.

Revolução AI

6 min

A newsletter dessa semana cobre grandes avanços nas Inteligências Artificiais Generativas e a concretização de parte do potencial dessas AIs na criação de novos negócios.

Os temas de hoje são:

Lançamento GPT-4 e anúncio da Microsoft; ChatGPT Hackathon e boas ideias; Grande avanço na geração de imagens com ControlNet e Stable Diffusion; Restaure fotos com AI; Transcreva grandes volumes de áudio em segundos.

News

Lançamento GPT-4 e grande anúncio da Microsoft

O CTO da Microsoft Alemanha, Andreas Braun, anunciou, em um evento da empresa ocorrido na quinta feira passada, que o modelo GPT-4 da OpenAI será lançado nesta semana. Ótima notícia.

A OpenAI é parceira da Microsoft e eles estão trabalhando juntos para refinar o modelo de inteligência artificial que está por trás do ChatGPT, Bing e das APIs da empresa. Atualmente, o modelo utilizado é o GPT-3.5, que já é muito poderoso.

É esperado que o tão aguardado GPT-4 seja mais capaz que seu antecessor (não sabemos a magnitude do avanço), mas a grande novidade contada pelo CTO é o fato do novo modelo ser multimodal.

Isso significa que ele será capaz de trabalhar com outras formas de conteúdo, não apenas texto. Porém, ainda não fica claro se ele só será capaz de interpretar imagens, vídeos e áudios como inputs ou se ele conseguirá produzir outputs nesses formatos.

É melhor esperar para ver.

Sobre a data de lançamento, não temos nenhuma informação oficial. No entanto, dia 16 de março, quinta-feira desta semana, haverá um evento da Microsoft com o seu CEO, Satya Nadella, no qual será discutido "o futuro do trabalho com AI". Provavelmente discutirão sobre como a Microsoft está integrando as Inteligências Artificiais Generativas em seus produtos Office.

Pode ser que saia de lá o anúncio oficial do GPT-4, mas não dá pra contar com isso. De qualquer forma, teremos uma semana empolgante pela frente.

ChatGPT Hackathon e boas ideias

Na última newsletter comentamos sobre o lançamento da API do ChatGPT e sobre como isto possibilitaria a criação de uma série de novos negócios a partir dela. E nós não fomos os únicos a pensar desta forma.

Há cerca de 10 dias, aconteceram dois Hackathons (que é, basicamente, uma maratona de programação) visando criar novos negócios utilizando a nova API. E os resultados deles foram bem interessantes.

O maior deles reuniu mais de 250 pessoas e foi patrocinado pela própria OpenAI e por outras grandes empresas do meio. O evento durou um final de semana e 70 soluções/negócios foram criados e apresentadas pelos times.

O outro foi mais um concurso do que um clássico Hackathon. Organizado por um dos grandes comunicadores no mundo das AIs generativas, Ben Tossell, o concurso premiava com U$ 1000 aquele que apresentasse a aplicação mais "impressionante" da API do ChatGPT em um prazo de 5 dias.

Vários projetos de negócios legais saíram desses eventos. O campeão do evento patrocinado pela OpenAI foi o grupo que criou o eLLMo, um urso de pelúcia animado por AI. O segundo lugar foi dado ao projeto Limitless, que também ganhou o concurso do Ben. Ele consiste em uma assistente que grava tudo o que você faz no seu computador e usa essas informações (mais a capacidade do ChatGPT) para completar textos para você. Outras criações foram o GPTBox Games (um jogo de trívia) e CrisisLine (uma linha de suporte 24h para crises humanitárias).

Você pode ver as demos destes e de outros projetos clicando nos links que eu coloquei.

Grande avanço na geração de imagens - ControlNet + Stable Diffusion

A geração de imagens por Inteligência Artificial vem deixando muitas pessoas de queixos caídos por conta da qualidade do que é criado. Mas, apesar de ser incrível, ela não é perfeita.

Um dos grandes defeitos das AIs de imagem é a aleatoriedade do que é criado: você escreve um prompt e espera que elas entendam o que você quis dizer e retornem um resultado adequado. E, na maioria das vezes, você precisa de muitas tentativas para obter esse resultado.

Mas esse problema foi, em grande parte, resolvido por algo chamado ControlNet. Utilizado juntamente com o modelo de geração de imagens de código aberto, Stable Diffusion, o ControlNet é uma estrutura que permite que condições extras sejam adicionadas na geração de imagens, para que você tenha mais controle sobre o que é criado.

Em outras palavras, junto com os comandos de texto, você pode fornecer outras informações que irão guiar o modelo na geração das imagens. Essas "condições extras" podem ser esboços, contornos, poses, formas, etc. Veja alguns exemplos:

Com isso, é possível criar imagens mais consistentes e coerentes com o que foi requisitado. Isso aumenta muito as possibilidades de aplicação da tecnologia.

Formas de aplicação estas que já estão sendo demonstradas. Danny Postma criou uma "agência de modelos" utilizando AI e nela você pode fazer o upload de fotos suas, e ser o próprio modelo, escolher as poses dos modelos, dentre outras coisas.

Hassan El Mghari criou uma ferramenta chamada RoomGPT, que permite que você faça o upload de um comodo e receba uma imagem dele redecorado no estilo que você quiser. Falamos dela nas nossas redes sociais na semana passada.

E um usuário do twitter fez uma releitura realista de logos famosas utilizando o ControlNet:

fofrAI on Twitter: "I put some famous logos through ControlNet. https://t.co/qHZ8lMaxJA" / Twitter

Bem legal.

Esse avanço é relativamente recente e em breve deverá ser incorporado em outras AIs Generativas, como MidJourney.

Indicações

Restore Photos

Restaure fotos antigas utilizando Inteligência Artificial. 100% de graça.

Gladia

Transcreva uma hora de áudio em 10 segundos e com uma taxa de erro de apenas 1%.

Dica de Uso

Para fazer com que os grandes modelos de linguagem, como o ChatGPT, ajam de maneira mais "racional" e executem tarefas mais complexas sem darem muitos saltos lógicos, é possível utilizar uma técnica chamada Chain of Thought.

Essa técnica é bastante simples. Você escreve o seu prompt normalmente e adiciona no final: "vamos pensar passo a passo".

Isso fará com que a AI quebre a resposta em etapas, obrigando-a a "raciocinar", o que diminui de maneira significativa a taxa de erro em suas respostas.

Pensamento do Dia

Extrair o potencial das Inteligências Artificiais e aplicá-las na construção de negócios lucrativos é bastante possível. Mas não é uma tarefa simples.

Se conectar com outras pessoas que tem os mesmos objetivos que você e habilidades e conhecimentos complementares é algo que torna esse processo mais fácil. Seja para compartilhar ideias ou formar parcerias.

Inclusive, nós criamos um Hub no Discord com esse objetivo e você pode entrar por aqui.

Por hoje é só, pessoal!

Agradecemos profundamente pela marca de 1000 seguidores que atingimos no Instagram e por aqueles que se inscreveram recentemente nessa newsletter!

Espero que estejam gostando do conteúdo. Nós sempre estamos abertos a críticas e feedbacks!

Não se esqueçam de baixar o ebook gratuito que elaboramos para ajudar quem está iniciando no universo das AIs e de nos seguir no Instagram e no Tiktok (@revolucao.ai).

Tenha uma excelente semana e até segunda!

Learn

Support

More Options