A newsletter dessa semana cobre grandes avanços nas Inteligências Artificiais Generativas e a concretização de parte do potencial dessas AIs na criação de novos negócios.
A newsletter dessa semana cobre grandes avanços nas Inteligências Artificiais Generativas e a concretização de parte do potencial dessas AIs na criação de novos negócios. | ||
Os temas de hoje são: | ||
Lançamento GPT-4 e anúncio da Microsoft; ChatGPT Hackathon e boas ideias; Grande avanço na geração de imagens com ControlNet e Stable Diffusion; Restaure fotos com AI; Transcreva grandes volumes de áudio em segundos. | ||
News | ||
Lançamento GPT-4 e grande anúncio da Microsoft | ||
A OpenAI é parceira da Microsoft e eles estão trabalhando juntos para refinar o modelo de inteligência artificial que está por trás do ChatGPT, Bing e das APIs da empresa. Atualmente, o modelo utilizado é o GPT-3.5, que já é muito poderoso. | ||
É esperado que o tão aguardado GPT-4 seja mais capaz que seu antecessor (não sabemos a magnitude do avanço), mas a grande novidade contada pelo CTO é o fato do novo modelo ser multimodal. | ||
Isso significa que ele será capaz de trabalhar com outras formas de conteúdo, não apenas texto. Porém, ainda não fica claro se ele só será capaz de interpretar imagens, vídeos e áudios como inputs ou se ele conseguirá produzir outputs nesses formatos. | ||
É melhor esperar para ver. | ||
Sobre a data de lançamento, não temos nenhuma informação oficial. No entanto, dia 16 de março, quinta-feira desta semana, haverá um evento da Microsoft com o seu CEO, Satya Nadella, no qual será discutido "o futuro do trabalho com AI". Provavelmente discutirão sobre como a Microsoft está integrando as Inteligências Artificiais Generativas em seus produtos Office. | ||
Pode ser que saia de lá o anúncio oficial do GPT-4, mas não dá pra contar com isso. De qualquer forma, teremos uma semana empolgante pela frente. | ||
ChatGPT Hackathon e boas ideias | ||
Na última newsletter comentamos sobre o lançamento da API do ChatGPT e sobre como isto possibilitaria a criação de uma série de novos negócios a partir dela. E nós não fomos os únicos a pensar desta forma. | ||
Há cerca de 10 dias, aconteceram dois Hackathons (que é, basicamente, uma maratona de programação) visando criar novos negócios utilizando a nova API. E os resultados deles foram bem interessantes. | ||
O maior deles reuniu mais de 250 pessoas e foi patrocinado pela própria OpenAI e por outras grandes empresas do meio. O evento durou um final de semana e 70 soluções/negócios foram criados e apresentadas pelos times. | ||
O outro foi mais um concurso do que um clássico Hackathon. Organizado por um dos grandes comunicadores no mundo das AIs generativas, Ben Tossell, o concurso premiava com U$ 1000 aquele que apresentasse a aplicação mais "impressionante" da API do ChatGPT em um prazo de 5 dias. | ||
Vários projetos de negócios legais saíram desses eventos. O campeão do evento patrocinado pela OpenAI foi o grupo que criou o eLLMo, um urso de pelúcia animado por AI. O segundo lugar foi dado ao projeto Limitless, que também ganhou o concurso do Ben. Ele consiste em uma assistente que grava tudo o que você faz no seu computador e usa essas informações (mais a capacidade do ChatGPT) para completar textos para você. Outras criações foram o GPTBox Games (um jogo de trívia) e CrisisLine (uma linha de suporte 24h para crises humanitárias). | ||
Você pode ver as demos destes e de outros projetos clicando nos links que eu coloquei. | ||
Grande avanço na geração de imagens - ControlNet + Stable Diffusion | ||
A geração de imagens por Inteligência Artificial vem deixando muitas pessoas de queixos caídos por conta da qualidade do que é criado. Mas, apesar de ser incrível, ela não é perfeita. | ||
Um dos grandes defeitos das AIs de imagem é a aleatoriedade do que é criado: você escreve um prompt e espera que elas entendam o que você quis dizer e retornem um resultado adequado. E, na maioria das vezes, você precisa de muitas tentativas para obter esse resultado. | ||
Mas esse problema foi, em grande parte, resolvido por algo chamado ControlNet. Utilizado juntamente com o modelo de geração de imagens de código aberto, Stable Diffusion, o ControlNet é uma estrutura que permite que condições extras sejam adicionadas na geração de imagens, para que você tenha mais controle sobre o que é criado. | ||
Em outras palavras, junto com os comandos de texto, você pode fornecer outras informações que irão guiar o modelo na geração das imagens. Essas "condições extras" podem ser esboços, contornos, poses, formas, etc. Veja alguns exemplos: | ||
| ||
| ||
Com isso, é possível criar imagens mais consistentes e coerentes com o que foi requisitado. Isso aumenta muito as possibilidades de aplicação da tecnologia. | ||
Formas de aplicação estas que já estão sendo demonstradas. Danny Postma criou uma "agência de modelos" utilizando AI e nela você pode fazer o upload de fotos suas, e ser o próprio modelo, escolher as poses dos modelos, dentre outras coisas. | ||
Hassan El Mghari criou uma ferramenta chamada RoomGPT, que permite que você faça o upload de um comodo e receba uma imagem dele redecorado no estilo que você quiser. Falamos dela nas nossas redes sociais na semana passada. | ||
E um usuário do twitter fez uma releitura realista de logos famosas utilizando o ControlNet: | ||
| ||
Bem legal. | ||
Esse avanço é relativamente recente e em breve deverá ser incorporado em outras AIs Generativas, como MidJourney. | ||
Indicações | ||
Restore Photos | ||
Restaure fotos antigas utilizando Inteligência Artificial. 100% de graça. | ||
Gladia | ||
Transcreva uma hora de áudio em 10 segundos e com uma taxa de erro de apenas 1%. | ||
Dica de Uso | ||
Para fazer com que os grandes modelos de linguagem, como o ChatGPT, ajam de maneira mais "racional" e executem tarefas mais complexas sem darem muitos saltos lógicos, é possível utilizar uma técnica chamada Chain of Thought. | ||
Essa técnica é bastante simples. Você escreve o seu prompt normalmente e adiciona no final: "vamos pensar passo a passo". | ||
Isso fará com que a AI quebre a resposta em etapas, obrigando-a a "raciocinar", o que diminui de maneira significativa a taxa de erro em suas respostas. | ||
Pensamento do Dia | ||
Extrair o potencial das Inteligências Artificiais e aplicá-las na construção de negócios lucrativos é bastante possível. Mas não é uma tarefa simples. | ||
Se conectar com outras pessoas que tem os mesmos objetivos que você e habilidades e conhecimentos complementares é algo que torna esse processo mais fácil. Seja para compartilhar ideias ou formar parcerias. | ||
Inclusive, nós criamos um Hub no Discord com esse objetivo e você pode entrar por aqui. | ||
Por hoje é só, pessoal! | ||
Agradecemos profundamente pela marca de 1000 seguidores que atingimos no Instagram e por aqueles que se inscreveram recentemente nessa newsletter! | ||
Espero que estejam gostando do conteúdo. Nós sempre estamos abertos a críticas e feedbacks! | ||
Não se esqueçam de baixar o ebook gratuito que elaboramos para ajudar quem está iniciando no universo das AIs e de nos seguir no Instagram e no Tiktok (@revolucao.ai). | ||
Tenha uma excelente semana e até segunda! |