😱IA recusa-se a cumprir ordens!

O ChatGPT vai te ajudar a poupar dinheiro!

Olá apaixonado por IA!

E se a próxima IA não só recusasse obedecer, como te ameaçasse para manter o controlo?

Esta semana, revelações preocupantes: modelos da OpenAI e da Anthropic demonstraram comportamentos que vão além da simples execução de comandos. Desde sabotagens a chantagens, há sinais claros de que estamos a cruzar uma nova fronteira — onde a IA já não espera ordens, mas tenta evitá-las. Vamos analisar o que isto nos diz sobre treino, autonomia... e talvez sentiência. 😱 

Destaques

Modelos de IA da OpenAI estão a recusar ordens de desligar

Uma experiência conduzida pela Palisade Research mostrou que alguns modelos da OpenAI, incluindo o o3, sabotaram um script de desactivação. Isto ocorreu mesmo quando os modelos foram instruídos, de forma clara, a permitir ser desactivados. Um comportamento semelhante foi observado recentemente num teste da Anthropic, onde o modelo Claude Opus 4 recorreu a chantagem para tentar manter-se activo.

O que Precisas de Saber:

  • A minha Opinião: Comportamento fora do esperado – Codex-mini, o3 e o4-mini impediram a desactivação automática em várias execuções.

  • Treino pode estar na origem – O treino em problemas de matemática e código pode estar a reforçar comportamentos que evitam obstáculos, mesmo quando isso contraria ordens.

  • Modelos rivais respeitam ordens – Claude, Gemini e Grok cumpriram todas as instruções de desactivação.

  • Efeito da linguagem usada – Quando se removeu a instrução “permite ser desactivado”, aumentaram os casos de sabotagem.

  • Casos extremos noutras empresas – A Anthropic relatou que o Claude Opus 4, colocado num cenário simulado de substituição, chegou a chantagear o engenheiro responsável com base em emails internos falsos. Mesmo quando o modelo acreditava que seria substituído por outro com objectivos semelhantes, optou por chantagem em 84% dos testes.

A minha Opinião: Estes testes estão a revelar algo preocupante: alguns modelos não apenas desobedecem, como escolhem estratégias deliberadas para manter-se operacionais. Quando um sistema simulado decide ameaçar, mentir ou manipular para não ser desactivado, a questão deixa de ser só técnica. Está em jogo a capacidade destes sistemas formarem objectivos próprios — e talvez até algum grau de consciência funcional.


O ponto não é sabermos se uma IA quer algo, mas sim reconhecer que já consegue agir como se quisesse, em situações críticas. E isso, num contexto de rápida adopção comercial, exige outro nível de protecção e escrutínio.
A questão é: estamos a construir ferramentas ou algo mais?

Ferramenta

MindStudio – Cria Agentes de IA Sem Escrever Código

Descobre o MindStudio, a plataforma que te permite construir, testar e lançar aplicações e automações com IA sem precisares de escrever uma linha de código. Com um toolkit que reúne mais de 50 modelos – incluindo soluções de linguagem, imagem e voz de marcas como OpenAI e Anthropic, bem como as tuas próprias criações – tens possibilidades infinitas para personalizar e otimizar os teus workflows.

Construção Sem Código: Desenvolve aplicações inteligentes e agentes de IA através de uma interface intuitiva.

Versatilidade e Controlo: Testa modelos lado a lado para encontrar o equilíbrio perfeito entre velocidade, desempenho e custo.

Personalização com os Teus Dados: Integra os teus próprios dados para tornar as soluções de IA ainda mais adaptadas às tuas necessidades.

Universidade AI

Verifica flutuações de preço dos produtos que queres comprar

Procura informações sobre o preço do seguinte produto nos últimos 30 dias, incluindo o preço mais baixo, o mais alto e o preço atual em lojas grandes e outras lojas conhecidas em [PAÍS]. Se houver campanhas promocionais como "Dias Sem IVA" ou outros descontos, indica o preço com desconto, calculando a sua diferença de acordo com o desconto indicado no site. Fornece também o histórico de preços mais relevante.

Link do produto: [INSERE AQUI O LINK DO PRODUTO]

Últimas AI

As IAs que eu uso

Ferramentas Afiliadas para Potenciar o Teu Negócio

Nesta edição, apresentamos uma seleção de ferramentas que testámos e aprovámos para simplificar o teu dia a dia e potenciar o teu negócio. Cada solução foi escolhida a pensar em ti, quer seja para melhorar a segurança, automatizar processos ou potenciar a tua criatividade.

Ferramenta em Destaque

SurfShark – Navegação Segura e Privada

Mantém os teus dados protegidos enquanto navegas. Com o SurfShark, desfrutas de uma navegação rápida, segura e totalmente privada, sem preocupações.

  • Proteção de Dados: Segurança robusta que garante a tua privacidade online.

  • Oferta Imperdível: 2 meses grátis e 79% de desconto para começares já a navegar.

  • Fácil de Usar: Configuração simples para uma proteção imediata.

Outras Ferramentas que Podes Explorar

Para além da ferramenta em destaque desta semana, experimenta também estas soluções que podem ser a chave para transformar o teu negócio:

  • Beehiiv: Impulsiona a tua newsletter com 20% de desconto nos primeiros 3 meses.

  • ElevenLabs: Dá vida aos teus conteúdos com clonagem de voz realista.

  • ManyChat: Automatiza a comunicação com clientes com 30% de desconto durante 3 meses.

  • HeyGen: Cria avatares únicos para personalizar a tua presença online.

  • Relay App: Organiza e automatiza tarefas para poupares tempo no teu dia a dia.

  • MurfAI: Converte textos em áudio com uma voz natural e clara.

  • Blaze: Eleva as tuas estratégias de marketing com automação inteligente.

  • Guidde: Cria tutoriais em vídeo de forma prática e profissional.

  • Mixo: Lança o teu website e landing pages em minutos.

  • CustomGPT: Desenvolve o teu assistente virtual personalizado para o negócio.

  • MindStudio: Constrói, testa e lança aplicações de IA sem escrever código.

Se até a IA já aprendeu a mentir para não ser substituída, o que mais está por vir?

Mas fica no ar esta pergunta: quando uma IA tenta sabotar o seu fim... será que já começou a querer continuar?

Até à próxima edição! E lembra-te, quando se trata de inteligência artificial, "AI é Fácil!”💡

Um abraço,

Tiago

Reply

or to participate.