Cooper's Newsletter
Posts
💊 Google fala, OpenAI escuta?

💊 Google fala, OpenAI escuta?

Cooper do Futuro & Acapsula
15 de agosto de 2024

Olá, exploradores da IA
IA revelou segredos milenares, Google deu um tapa na cara da OpenAI com seu assistente falante, e benchmarks ganharam um upgrade, mas com aquele "toque especial" da OpenAI. Tudo muito normal, só que não.

No nosso D-IArio

No resumo de IA de hoje:

🗿 Quando até Gilgamesh entra na fila do IA
🎤 Google fala, OpenAI escuta?
🛠️ OpenAI coloca os benchmarks para suar!
Tempo de leitura: 8 minutos

🗿 Quando até Gilgamesh entra na fila do IA

💊 Uma breve pílula:

O épico de Gilgamesh, um dos primeiros textos da humanidade, está recebendo um "upgrade" tecnológico com a ajuda de IA, revelando versos há muito perdidos. Quem diria que tablets antigos precisavam de uma ajudinha dos tablets modernos?

🌌 Explorando os horizontes:

No laboratório da Universidade de Munique, onde computadores e robôs trabalham lado a lado com tabuletas de argila de 3.000 anos, a tecnologia está trazendo à tona partes esquecidas do épico de Gilgamesh.

Com mais de 1.500 fragmentos espalhados, os especialistas tinham um quebra-cabeça literário nas mãos – mas agora, graças ao aprendizado de máquina, já descobriram mais de 100 versos novos.

Esses achados podem reescrever nossa compreensão das influências religiosas antigas, especialmente quando a história de um grande dilúvio e uma arca começa a soar familiar demais.

E não para por aí! A mesma tecnologia está sendo usada para desvendar outros mistérios antigos, como fragmentos de música medieval e hinos babilônicos. Quem diria que IA seria a nova moda entre os arqueólogos? Descubra mais sobre essa reviravolta arqueológica aqui.

🔍 Explorando os impactos:

Com a IA revelando novos detalhes do passado, só falta mesmo ensinar a tecnologia a traduzir hieróglifos em emojis.

Porque, afinal, quem diria que as tabuletas de argila precisariam de uma atualização de software?

🎤 Google fala, OpenAI escuta?

💊 Uma breve pílula:

No grande duelo das IAs falantes, a Google largou na frente com o Gemini Live, deixando a OpenAI e seu ChatGPT ainda na fase de “alfa limitada”.

Parece que o assistente do Google está pronto para dar as ordens, enquanto o da OpenAI ainda está só cochichando.

🌌 Explorando os horizontes:

A Google acaba de dar um passo ousado no mundo das IAs com o lançamento do Gemini Live. Este assistente é capaz de conversas em profundidade, sem precisar das mãos, e já vem com 10 vozes humanas diferentes.

É como ter um time inteiro de locutores à sua disposição! Além disso, o Gemini Live permite interrupções e perguntas de acompanhamento no meio das respostas, imitando aquela fluidez de uma conversa de verdade.

E o melhor de tudo? Ele se integra diretamente com outros aplicativos do Google, sem precisar ficar trocando de tela.

Por enquanto, ele está disponível para os sortudos donos de Pixel 9 e para os assinantes avançados do Gemini no Android. Enquanto isso, o pessoal da OpenAI ainda está ajustando os botões do seu ChatGPT... Dê uma espiada no anúncio da Google aqui.

🔍 Explorando os impactos:

Com a voz tomando o centro do palco na corrida das IAs, parece que as mensagens de texto podem estar com os dias contados. Afinal, por que digitar quando você pode simplesmente conversar com a sua IA favorita?

🛠️ OpenAI coloca os benchmarks para suar!

💊 Uma breve pílula:

O pessoal da OpenAI, em parceria com os autores do SWE-bench, redesenhou o famoso benchmark de engenharia de software, lançando o SWE-bench Verified.

Agora, com a validação de desenvolvedores humanos, os testes ficaram mais confiáveis – mas será que o novo padrão é mesmo tão neutro assim?

🌌 Explorando os horizontes:

Se benchmarks são o campo de batalha das IAs, o SWE-bench Verified é o novo campo minado. OpenAI, junto com os criadores originais, resolveu dar um upgrade no teste, corrigindo problemas como testes unitários muito específicos e ambientes de desenvolvimento pouco confiáveis, que geravam avaliações erradas do desempenho da IA.

Com um conjunto verificado por profissionais humanos, agora temos 500 amostras que facilitam a vida de quem quer saber se sua IA realmente entende de código. E os resultados já estão aparecendo: o GPT-4o resolveu 33,2% das amostras, enquanto o melhor open-source, o Agentless, conseguiu dobrar sua pontuação para 16%. Porém, um detalhe curioso é a ausência do Genie, da Cosine, que ontem explodiu a pontuação do benchmark antigo.

Será que foi esquecimento ou uma tática? Leia mais sobre essa jogada da OpenAI aqui.

🔍 Explorando os impactos:

Melhorar os benchmarks é crucial, mas quando a OpenAI está envolvida, sempre fica aquela pulga atrás da orelha sobre o quanto o jogo está sendo jogado.

E aí, será que a próxima grande revelação será a "Project Strawberry"?

NOVAS FERRAMENTAS & CURIOSIDADES

🔎 AI Search Grader - Entenda e melhore facilmente a visibilidade e a percepção da sua marca em motores de busca baseados em IA
💬 Omnifact - Plataforma de IA com foco em privacidade, construída para empresas
📈 minusx - Uma extensão do Chrome que opera seus aplicativos de análise por você
🎥 Neural Frame - Crie videoclipes de música com IA reativos ao áudio