- AI é Fácil!
- Posts
- ⚠️TODA a verdade sobre DeepSeek R1
⚠️TODA a verdade sobre DeepSeek R1
E o novo o3 mini da OpenAI!
Olá apaixonado por IA!
Pront@ para mais uma edição da “AI é Fácil!”, onde te mostro como a inteligência artificial pode transformar o teu dia a dia?
Hoje trago-te A história que marcou a semana passada. Que muitos batizaram como o “momento Sputnik da IA”. Hoje mostro-te TODA A VERDADE sobre o DeepSeek R1!
27 de Janeiro 2025. O mundo acordou com um sismo nos mercados financeiros. 1 trilião de dólares (sim, 12 zeros) desapareceu do mercado. A razão? O lançamento do novo modelo da DeepSeek: o R1. Mas como é que um modelo de IA de uma startup chinesa conseguiu abalar os mercados mundiais e fazer com que empresas tecnológicas gigantes, como a Nvidia, perderem sozinhas mais de 600 mil milhões de dólares em valor de mercado. O que torna o DeepSeek R1 tão especial?
O que Torna o DeepSeek R1 Diferente?
O DeepSeek R1 não é apenas um modelo de IA. O seu impacto deve-se a três fatores-chave: custo, eficiência e acessibilidade.
Custo: O DeepSeek R1 foi desenvolvido a um custo 98% inferior ao do seu principal concorrente, o OpenAI o1. Enquanto a OpenAI gastou centenas de milhões de dólares para treinar o o1, a DeepSeek fez o mesmo com uma fração desse valor. Segundo o artigo da DeepSeek, o R1 teve gastos de 6 milhões de dólares no seu treino.
Eficiência Computacional: O DeepSeek utilizou uma abordagem inovadora para treinar o seu modelo com hardware menos potente e mais barato. Enquanto o o1 dependia de chips de última geração, como o H100 da Nvidia, o DeepSeek conseguiu resultados impressionantes usando chips mais simples e menos dispendiosos.
Aprendizagem por Reforço vs Aprendizagem Supervisionada:
Aprendizagem Supervisionada (Supervised Learning ou Supervised Fine-Tuning): Este é o método tradicional usado por modelos como o OpenAI o1. Consiste em alimentar o modelo com grandes quantidades de dados rotulados, ou seja, informações onde o resultado correto já está identificado. O modelo aprende a associar padrões nos dados a esses resultados, ajustando os seus parâmetros para minimizar erros. O problema? Este método requer imensa intervenção humana para preparar e rotular os dados, além de ser dispendioso e limitado pela qualidade dos dados fornecidos.
Aprendizagem por Reforço (Reinforcement Learning): O DeepSeek R1 seguiu um caminho diferente. Em vez de depender de dados rotulados, o modelo aprende através da experimentação. Pensa nisto como um jogo: o modelo toma decisões e recebe "recompensas" quando acerta e "penalizações" quando erra. Com o tempo, ajusta-se para maximizar as recompensas, tal como um ser humano aprende com a experiência. Esta abordagem permite uma maior autonomia, tornando o modelo mais flexível e capaz de adaptar-se a novos desafios sem depender tanto da supervisão humana.
Esta diferença fundamental tornou o DeepSeek R1 não só mais barato de treinar, mas também mais eficiente em tarefas de raciocínio complexo, já que aprendeu a resolver problemas com base em tentativas e erros, desenvolvendo estratégias que modelos supervisionados dificilmente descobririam. ATENÇÃO: esta explicação está extremamente simplificada. Mas é uma forma simples de perceberes as diferenças essenciais entre os modelos. Se quiseres aprofundar deixo aqui 3 vídeos (muito muito técnicos):
Por Que Razão o Mundo Abalou?
O impacto do lançamento do DeepSeek R1 não foi apenas técnico — foi económico, geopolítico e estratégico:
Impacto Económico: O sucesso do DeepSeek mostrou que era possível obter um desempenho de topo sem depender de hardware sofisticado e caro. Isto abalou empresas como a Nvidia, que perdeu mais de 600 mil milhões de dólares em valor de mercado, pois os investidores temiam uma queda na procura pelos seus chips de alta performance.
Rivalidade Geopolítica: O DeepSeek R1 surgiu num contexto de tensões entre os EUA e a China, especialmente no domínio da tecnologia. O facto de uma startup chinesa ter superado modelos norte-americanos foi visto como um sinal de que a China estava a ganhar terreno na corrida da IA.
Mudança de Paradigma: O modelo desafiou a crença de que só grandes empresas com orçamentos enormes poderiam liderar a inovação em IA. O DeepSeek provou que a eficiência pode superar o poder bruto, redefinindo as regras do jogo.
Mas a “grande chapada” que a DeepSeek dá na OpenAI é outra. Algo que ninguém estava à espera. O R1 é completamente open-source e licenciável. Isto significa que podes usar este modelo sem custos e para fins comerciais! Porque é que é uma “chapada de luva branca”? Porque a missão da OpenAI quando foi fundada era essa mesmo: construir IA open-source para dar ao mundo. E que agora se tornou numa empresa orientada para lucros. Como é óbvio, os memes espalharam-se pela Internet 😂
|
|
Mas para mim o melhor é mesmo este:
Agora a verdadeira questão: DeepSeek R1 é melhor que o1-Pro? Bem, sim e não. Depende de vários contextos. Mas ficam aqui alguns pontos:
Matemática Avançada (AIME 2024): 79,8% de acerto (DeepSeek R1) contra 79,2% (OpenAI o1)
Resolução de Problemas (MATH-500): 97,3% (DeepSeek R1) contra 96,4% (OpenAI o1)
Programação (Codeforces): 96,3% (DeepSeek R1) contra 96,6% (OpenAI o1)
Embora o o1 ainda tivesse uma ligeira vantagem em algumas áreas, o DeepSeek R1 prova ser um concorrente à altura, especialmente considerando o seu custo reduzido. Além disso, o DeepSeek demonstrou uma capacidade de adaptação e raciocínio mais "humana", com respostas mais detalhadas e reflexivas. Ainda assim, a experiência de vários utilizadores revela que o DeepSeek perde muito contexto nas suas respostas e não consegue fazer código tão bem com o o1.
Outra coisa que não gosto propriamente no DeepSeek é a sua limitação contextual. Ou seja os seus vieses. Natural que aconteça tendo em conta o país em que foi feito. E até o ChatGPT os têm. Simplesmente acho que sobressaem mais no DeepSeek.
Mas o drama não acabou aqui! A OpenAI acusou a startup chinesa de ter copiado partes do seu modelo através de um processo chamado "distilação", que permite extrair conhecimento de um modelo existente para criar uma versão mais leve e eficiente. Contudo, até ao momento, não foram apresentadas provas concretas para sustentar essa acusação, levantando suspeitas de que poderia ser apenas uma manobra para proteger a sua posição no mercado. Vindo da mesma empresa que está com pelo menos 20 processos em tribunal por violação de direitos de copywrite 😂 irónico não é?
Outro pormenor que levantou algumas questões deve-se à recolha de dados por parte da DeepSeek com as conversas e dados dos seus utilizadores. Algo que as IAs das empresas americanas nunca fariam (*cough cough*).
No mesmo dia 27 de janeiro, a DeepSeek bloqueou o acesso ao modelo apenas a utilizadores chineses via site e app. Isto em resposta a ataques DDOS (sobrecarga de servidores através de acessos simultâneos em grande nº).
A Resposta da OpenAI
A OpenAI não ficou de braços cruzados. Poucos dias depois, lançou o o3-mini, um novo modelo mais rápido e eficiente. Para manter a competitividade, a OpenAI também tornou gratuitas algumas funcionalidades premium e aumentou os limites de uso para utilizadores pagos. O o3-mini apresentou melhorias significativas, com uma velocidade de processamento superior e maior precisão em tarefas de raciocínio lógico.
O o3-mini foi claramente uma resposta direta à ameaça do DeepSeek R1, tentando recuperar a confiança dos utilizadores e dos investidores. Apesar das melhorias, ainda não conseguiu ofuscar completamente o brilho do DeepSeek R1, especialmente pelo fator custo-eficiência.
O Futuro da IA
Este foi um wake up call para os EUA. Mas eu acho que não foi só isso. Acho sim que foi uma vitória sim do open source. Porque é esse o objectivo. IA livre de uso. Não virada para o lucro. Claro que criar estes modelos acarreta custos. Mas se empresas como a OpenAI têm como por base essa missão, não acho que devem mudar a meio e culpar os outros pela mudança.
Além disso, o caso DeepSeek vs OpenAI abre oficialmente a época louca da corrida a AGI, ao estilo da corrida ao espaço da guerra fria entre os EUA e a Rússia. Os intervenientes agora são outros. Mas o resultado será o mesmo, na minha opinião. Melhor tecnologia. Aguardo ansiosamente os próximos episódios!
AI Numa Frase
O que usa a “AI é Fácil”
As melhores ferramentas para otimizar o teu negócio e simplificar o teu dia a dia
Testámos e aprovámos todas as ferramentas listadas para garantir o melhor para ti. Estas são as ofertas imperdíveis desta semana:
🌐 Navegação segura e privada com SurfShark
Protege os teus dados online de forma simples e acessível. Experimenta o SurfShark com 2 meses grátis e 79% de desconto. Mantém a tua navegação segura e sem preocupações.
🤖 Automatiza contactos com ManyChat
Precisas de mais clientes? O ManyChat ajuda-te a poupar tempo e a simplificar a comunicação com potenciais leads. E agora, tens 30% de desconto durante 3 meses para começares a crescer com facilidade!
🎨 Cria um avatar único com HeyGen
Personaliza a tua presença digital com um avatar criado por inteligência artificial. Explora a tua criatividade e destaca-te com o HeyGen!
🤖 Automatiza o teu trabalho com Relay App
Conecta mais de 100 apps e cria automações rápidas com inteligência artificial e controlo humano. Simples, flexível e eficiente!
📈 Eleva o teu marketing com Blaze
Automatiza estratégias e obtém resultados incríveis. O Blaze usa inteligência artificial para levar o teu marketing ao próximo nível.
E assim termina mais uma edição cheia de ideias e inspiração! Espero que tenhas encontrado algo que te entusiasme tanto quanto a mim. 🚀
Adoro ver esta comunidade crescer e nada disso seria possível sem ti.
Se gostaste desta edição, partilha-a com amigos ou colegas que também possam beneficiar com estas informações. Cada clique faz a diferença para chegarmos ainda mais longe juntos! ✨
Até à próxima edição! E lembra-te, quando se trata de inteligência artificial, "AI é Fácil!”💡
Um abraço,
Tiago
Reply