- Cooper's Newsletter
- Posts
- 💊 Google fala, OpenAI escuta?
💊 Google fala, OpenAI escuta?
Olá, exploradores da IA
IA revelou segredos milenares, Google deu um tapa na cara da OpenAI com seu assistente falante, e benchmarks ganharam um upgrade, mas com aquele "toque especial" da OpenAI. Tudo muito normal, só que não.
No nosso D-IArio
No resumo de IA de hoje:
🗿 Quando até Gilgamesh entra na fila do IA
🎤 Google fala, OpenAI escuta?
🛠️ OpenAI coloca os benchmarks para suar!
Tempo de leitura: 8 minutos
🗿 Quando até Gilgamesh entra na fila do IA
💊 Uma breve pílula:
O épico de Gilgamesh, um dos primeiros textos da humanidade, está recebendo um "upgrade" tecnológico com a ajuda de IA, revelando versos há muito perdidos. Quem diria que tablets antigos precisavam de uma ajudinha dos tablets modernos?
🌌 Explorando os horizontes:
No laboratório da Universidade de Munique, onde computadores e robôs trabalham lado a lado com tabuletas de argila de 3.000 anos, a tecnologia está trazendo à tona partes esquecidas do épico de Gilgamesh.
Com mais de 1.500 fragmentos espalhados, os especialistas tinham um quebra-cabeça literário nas mãos – mas agora, graças ao aprendizado de máquina, já descobriram mais de 100 versos novos.
Esses achados podem reescrever nossa compreensão das influências religiosas antigas, especialmente quando a história de um grande dilúvio e uma arca começa a soar familiar demais.
E não para por aí! A mesma tecnologia está sendo usada para desvendar outros mistérios antigos, como fragmentos de música medieval e hinos babilônicos. Quem diria que IA seria a nova moda entre os arqueólogos? Descubra mais sobre essa reviravolta arqueológica aqui.
🔍 Explorando os impactos:
Com a IA revelando novos detalhes do passado, só falta mesmo ensinar a tecnologia a traduzir hieróglifos em emojis.
Porque, afinal, quem diria que as tabuletas de argila precisariam de uma atualização de software?
🎤 Google fala, OpenAI escuta?
💊 Uma breve pílula:
No grande duelo das IAs falantes, a Google largou na frente com o Gemini Live, deixando a OpenAI e seu ChatGPT ainda na fase de “alfa limitada”.
Parece que o assistente do Google está pronto para dar as ordens, enquanto o da OpenAI ainda está só cochichando.
🌌 Explorando os horizontes:
A Google acaba de dar um passo ousado no mundo das IAs com o lançamento do Gemini Live. Este assistente é capaz de conversas em profundidade, sem precisar das mãos, e já vem com 10 vozes humanas diferentes.
É como ter um time inteiro de locutores à sua disposição! Além disso, o Gemini Live permite interrupções e perguntas de acompanhamento no meio das respostas, imitando aquela fluidez de uma conversa de verdade.
E o melhor de tudo? Ele se integra diretamente com outros aplicativos do Google, sem precisar ficar trocando de tela.
Por enquanto, ele está disponível para os sortudos donos de Pixel 9 e para os assinantes avançados do Gemini no Android. Enquanto isso, o pessoal da OpenAI ainda está ajustando os botões do seu ChatGPT... Dê uma espiada no anúncio da Google aqui.
🔍 Explorando os impactos:
Com a voz tomando o centro do palco na corrida das IAs, parece que as mensagens de texto podem estar com os dias contados. Afinal, por que digitar quando você pode simplesmente conversar com a sua IA favorita?
🛠️ OpenAI coloca os benchmarks para suar!
💊 Uma breve pílula:
O pessoal da OpenAI, em parceria com os autores do SWE-bench, redesenhou o famoso benchmark de engenharia de software, lançando o SWE-bench Verified.
Agora, com a validação de desenvolvedores humanos, os testes ficaram mais confiáveis – mas será que o novo padrão é mesmo tão neutro assim?
🌌 Explorando os horizontes:
Se benchmarks são o campo de batalha das IAs, o SWE-bench Verified é o novo campo minado. OpenAI, junto com os criadores originais, resolveu dar um upgrade no teste, corrigindo problemas como testes unitários muito específicos e ambientes de desenvolvimento pouco confiáveis, que geravam avaliações erradas do desempenho da IA.
Com um conjunto verificado por profissionais humanos, agora temos 500 amostras que facilitam a vida de quem quer saber se sua IA realmente entende de código. E os resultados já estão aparecendo: o GPT-4o resolveu 33,2% das amostras, enquanto o melhor open-source, o Agentless, conseguiu dobrar sua pontuação para 16%. Porém, um detalhe curioso é a ausência do Genie, da Cosine, que ontem explodiu a pontuação do benchmark antigo.
Será que foi esquecimento ou uma tática? Leia mais sobre essa jogada da OpenAI aqui.
🔍 Explorando os impactos:
Melhorar os benchmarks é crucial, mas quando a OpenAI está envolvida, sempre fica aquela pulga atrás da orelha sobre o quanto o jogo está sendo jogado.
E aí, será que a próxima grande revelação será a "Project Strawberry"?
NOVAS FERRAMENTAS & CURIOSIDADES
🔎 AI Search Grader - Entenda e melhore facilmente a visibilidade e a percepção da sua marca em motores de busca baseados em IA
💬 Omnifact - Plataforma de IA com foco em privacidade, construída para empresas
📈 minusx - Uma extensão do Chrome que opera seus aplicativos de análise por você
🎥 Neural Frame - Crie videoclipes de música com IA reativos ao áudio