- Cooper's Newsletter
- Posts
- 💊 GPT-4o mini
💊 GPT-4o mini
Olá, exploradores da IA
Hoje vimos a OpenAI encolher sua IA, a Groq humilhar gigantes da tecnologia, empresas saqueando o YouTube sem permissão e criadores furiosos. No mundo da IA, até as leis parecem miniaturizadas.
No nosso D-IArio
No resumo de IA de hoje:
🤖 GPT-4o mini
⚒️ Groq's: Humilham a concorrência
🔎YouTube: Treinamento de Ia sem permissão e o caos que se segue
Tempo de leitura: 5 minutos.
🤖 GPT-4o mini
💊 Uma breve pílula:
OpenAI lançou o GPT-4o mini, um modelo compacto e econômico que promete revolucionar o acesso à IA para desenvolvedores e empresas.
🌌 Explorando os horizontes:
OpenAI acaba de apresentar o GPT-4o mini, uma versão pocket e bem mais barata do já famoso GPT-4o. Custando apenas 15 centavos por milhão de tokens de entrada e 60 centavos por milhão de tokens de saída, ele é 60% mais barato que o GPT-3.5 Turbo.
Mas não se engane pelo tamanho: o bichinho tem uma pontuação de 82% no benchmark MMLU, superando o Gemini Flash do Google (77.9%) e o Claude Haiku da Anthropic (73.8%).
Agora, prepare-se para o melhor: o GPT-4o mini vai substituir o GPT-3.5 Turbo no ChatGPT para Free, Plus e Team. E se você acha que isso é tudo, ele ainda tem um contexto de 128K tokens e lida com entradas de texto e visão, com capacidades de áudio e vídeo planejadas para futuras atualizações. Confira mais detalhes neste link.
🔍 Explorando os impactos:
Com o GPT-4o mini, a barreira de entrada para integrações de IA fica muito menor. Modelos mais baratos, rápidos e inteligentes estão cada vez mais acessíveis, prenunciando uma revolução na velocidade da aceleração da IA. Em breve, até seu microondas vai saber mais que você.
⚒️ Groq's: Humilham a concorrência
💊 Uma breve pílula:
Groq lançou dois novos modelos de IA open-source, especializados no uso de ferramentas, superando gigantes como GPT-4 Turbo, Claude 3.5 Sonnet e Gemini 1.5 Pro em benchmarks cruciais.
🌌 Explorando os horizontes:
A startup de IA, Groq, acaba de liberar dois modelos open-source focados no uso de ferramentas, e o resultado foi um verdadeiro tapa na cara da concorrência. Os modelos Llama 3 Groq Tool Use 8B e 70B são versões refinadas do Llama 3 da Meta.
O modelo de 70B alcançou impressionantes 90.76% de precisão no BFCL Leaderboard, garantindo o primeiro lugar entre todos os modelos proprietários e open-source. Já o modelo menor, de 8B, não ficou muito atrás, ocupando a terceira posição com 89.06% de precisão.
Ambos os modelos foram treinados exclusivamente com dados sintéticos e estão disponíveis via Groq API e Hugging Face. Saiba mais sobre essa inovação.
🔍 Explorando os impactos:
A Groq já tinha causado sensação com suas velocidades de IA super rápidas e agora, com modelos especializados de alto nível, abre portas para uma infinidade de novas inovações e aplicações. Prepare-se, porque a revolução das ferramentas de IA está só começando.
🔎YouTube: Treinamento de Ia sem permissão e o caos que se segue
💊 Uma breve pílula:
Uma investigação revelou que gigantes da tecnologia usaram conteúdo de mais de 170.000 vídeos do YouTube para treinar suas IAs sem consentimento dos criadores.
🌌 Explorando os horizontes:
Uma nova investigação da Proof News revelou que empresas como Apple, Anthropic, Nvidia e Salesforce usaram conteúdo de mais de 170.000 vídeos do YouTube para treinar seus modelos de IA, sem o consentimento dos criadores. O dataset, chamado “YouTube Subtitles”, contém transcrições de mais de 48.000 canais, incluindo criadores populares, veículos de notícias, canais educativos e muito mais.
Esse conjunto de dados foi compilado pela organização sem fins lucrativos EleutherAI como parte de uma coleção maior chamada ‘The Pile’, destinada a fornecer materiais de treinamento para desenvolvedores e acadêmicos. O problema? Os criadores não faziam a menor ideia de que seu conteúdo estava sendo usado para esse propósito, e os Termos de Serviço do YouTube proíbem o uso de conteúdo sem permissão. A Apple, por exemplo, teria usado o dataset para treinar o OpenELM, um modelo relacionado a novas funcionalidades de IA para iPhones e MacBooks. Confira mais sobre essa história aqui.
🔍 Explorando os impactos:
Enquanto o uso dessas transcrições não deve criar a melhor vibe entre os criadores, ainda não vimos muitas repercussões legais para as empresas nesses casos. Com o dataset também sendo público através da EleutherAI, é difícil prever algo além de uma péssima PR resultante desse relatório, apesar das implicações éticas e morais.