- Cooper's Newsletter
- Posts
- 💊 IA para o mundo físico
💊 IA para o mundo físico
E agentes IA no google
Olá, exploradores da IA
Com a previsão de um enorme aumento no consumo de energia, entenda como os centros de dados de IA podem competir com criptomoedas como grandes consumidores.
No nosso D-IArio de hoje
No resumo de IA de hoje:
🧠 A disputa pelo talento no Vale do Silício
🔎 Agentes de IA do Google
🤖 A empresa que está trazendo a IA para o mundo físico
🎥 Atualizações Gemini do Google e concorrente Sora
Tempo de leitura: 6 minutos.
🧠 A disputa pelo talento de IA no Vale do Silício
💊 Uma breve pílula
Para se manter relevante na IA, é necessário investir pesado. Enquanto as instituições acadêmicas sofrem com pouca verba, empresas privadas estão dispostas a pagar fortunas para atrair os melhores talentos, resultando em uma concentração preocupante de especialistas em grandes corporações.
🌌 Explorando os horizontes
No competitivo campo da inteligência artificial, o dinheiro fala alto. Empresas privadas, como a Netflix, estão oferecendo salários exorbitantes para atrair os melhores estudiosos de IA. No ano passado, a Netflix anunciou uma posição voltada para machine learning com um salário anual impressionante de $900,000. Isso preocupa muitos ativistas, pois a fuga de cérebros das universidades pode concentrar ainda mais o talento de ponta nas mãos de poucas corporações gigantes.
Além dos altos salários, os acadêmicos também estão cientes de que os grandes avanços tecnológicos não estão mais ocorrendo dentro dos laboratórios universitários. Um estudo da Stanford revelou que em 2022, as instituições acadêmicas criaram apenas três grandes algoritmos de machine learning, em contraste com 32 desenvolvidos por entidades privadas, segundo o Washington Post.
A disputa por talentos em IA vai além do mundo acadêmico. Startups também enfrentam desafios similares ao tentar se estabelecer na indústria. O CEO da Perplexity AI contou ao Business Insider que não conseguiu atrair um pesquisador de ponta da Meta porque a startup tinha muito menos poder de computação. “Volte para mim quando você tiver 10,000 GPUs H100”, teria dito o pesquisador.
🔍 Explorando os impactos
A concentração de talentos de IA nas mãos de poucas corporações privadas pode limitar a diversidade de pesquisas e inovações, exacerbando a desigualdade no acesso ao conhecimento e ao desenvolvimento tecnológico.
🔎 Agentes de IA do Google
💊 Uma breve pílula
O Google revelou o Project Astra, um protótipo de agente de IA em tempo real que pode ver, ouvir e agir em nome do usuário. Além disso, atualizações no Google Search agora incluem resumos de IA expandidos e capacidades avançadas de planejamento e raciocínio.
🌌 Explorando os horizontes
Na I/O Developer's Conference, o Google apresentou o inovador Project Astra, um agente de IA em tempo real que promete revolucionar a interação dos usuários com a tecnologia. Este protótipo pode ver, ouvir e realizar ações complexas com base em comandos do usuário. Durante a demonstração, um assistente de voz mostrou capacidade de responder ao que via e ouvia, incluindo código, imagens e vídeos, demonstrando um raciocínio avançado e uma memória impressionante. A expectativa é que o Astra esteja disponível ao público através do aplicativo Gemini ainda este ano.
Além disso, o Google introduziu os 'AI teammates', agentes capazes de responder perguntas sobre e-mails, reuniões e outros dados dentro do Google Workspace. A funcionalidade Live, que permite conversas quase em tempo real com o Gemini, será lançada nos próximos meses.
No campo das buscas, o Google Search agora possui resumos de IA expandidos, capacidades avançadas de planejamento e resultados organizados por IA. O Gemini será capaz de executar planejamentos complexos, como manter e atualizar itinerários de viagens, e também contará com capacidades de raciocínio multi-etapas, facilitando a decomposição de perguntas e acelerando a pesquisa. Os usuários também poderão fazer perguntas com vídeos, permitindo que o Search analise conteúdo visual e forneça resumos úteis de IA.
🔍 Explorando os impactos
Com essas novas funcionalidades, o Google está elevando a competição no campo dos assistentes de voz e mantendo sua liderança nas ferramentas de busca, tornando ainda mais difícil para concorrentes como a OpenAI e Perplexity desbancarem sua posição dominante.
🤖 A empresa que está trazendo a IA para o mundo físico
💊 Uma breve pílula
A empresa californiana Covariant está trazendo a IA generativa para o mundo físico com uma plataforma de robótica capaz de realizar diversas tarefas com comandos verbais. Com cerca de $222 milhões em financiamento, a startup promete revolucionar a interação entre humanos e robôs.
🌌 Explorando os horizontes
Enquanto muitos de nós interagimos com plataformas de IA generativa digitando comandos em uma tela, a Covariant está quebrando barreiras ao aplicar a IA para tarefas físicas. Com sede na Califórnia, a empresa desenvolveu um software capaz de realizar truques divertidos, como pegar uma sacola ou uma maçã de uma caixa de itens aleatórios. No entanto, o verdadeiro potencial da Covariant está em usos práticos mais amplos.
Diferente dos modelos tradicionais de IA que são treinados com grandes quantidades de dados textuais, o modelo da Covariant incorpora dados de movimento, incluindo vídeos de robôs executando diversas tarefas no mundo real. Isso significa que o modelo não só entende informações factuais, mas também sabe como se mover em espaços físicos, permitindo que robôs realizem uma variedade de atividades baseadas em comandos verbais de funcionários.
Segundo Peter Chen, CEO da Covariant, “ele pode absorver todas essas diferentes modalidades importantes para a robótica e também pode reproduzir qualquer uma delas”. Essa capacidade de resposta multifuncional é realmente impressionante e promete transformar como percebemos e utilizamos a robótica no dia a dia.
🔍 Explorando os impactos
A inovação da Covariant pode eliminar a limitação dos robôs a tarefas especializadas repetitivas, abrindo caminho para uma nova era onde robôs respondem a comandos verbais humanos para realizar múltiplas funções, tornando-se assistentes versáteis em diversas indústrias.
🎥 Atualizações Gemini do Google e concorrente Sora
💊 Uma breve pílula
O Google lançou várias atualizações em seu ecossistema de IA durante a I/O Developer's Conference, incluindo melhorias na família de modelos Gemini e um novo modelo de geração de vídeo chamado Veo, que promete rivalizar com o Sora da OpenAI.
🌌 Explorando os horizontes
Na recente conferência I/O, o Google apresentou uma série de atualizações impressionantes para sua família de modelos de IA, Gemini. A versão 1.5 Pro agora possui uma janela de contexto ampliada para 2 milhões de tokens, permitindo a análise de uma vasta gama de mídias, como documentos, vídeos e áudio. Além disso, foi lançada a Gemini 1.5 Flash, uma versão otimizada para velocidade e eficiência com uma janela de contexto de 1 milhão de tokens.
Em breve, teremos a chegada do Gemma 2, a próxima geração de modelos open-source do Google, e o novo modelo de visão-linguagem chamado PaliGemma. Uma novidade empolgante para os assinantes do Gemini Advanced é a capacidade de criar personas personalizadas chamadas 'Gems' a partir de uma simples descrição de texto, semelhante ao GPTs do ChatGPT.
No campo de geração de vídeos e imagens, o Google apresentou o Veo, um modelo de vídeo capaz de gerar vídeos de mais de 60 segundos em resolução 1080p a partir de prompts de texto, imagem e vídeo. O Imagen 3, nova versão do modelo de texto para imagem, oferece melhores detalhes, geração de texto e compreensão de linguagem natural. Além disso, a ferramenta VideoFX permite a criação de vídeos cena por cena e a adição de músicas, estando disponível em pré-visualização privada nos EUA para criadores selecionados.
🔍 Explorando os impactos
Com essas atualizações, o Google não só aumenta a capacidade de processamento de informações massivas, mas também posiciona-se firmemente na competição com o Sora da OpenAI. A verdadeira questão é: qual modelo chegará ao público primeiro?
🎨 Google VideoFX - Gere vídeos fotorrealistas com o novo modelo Veo
💻 Stunning - Responda a algumas perguntas sobre o seu negócio e gere um site completo
🔎 devv - Motor de busca para desenvolvedores impulsionado por IA
💵 Era - Gerenciamento inteligente de dinheiro com IA e assessores humanos