Close Menu
Benzinga FranceBenzinga France
    Les dernières

    A-t-il rien appris? Le trader qui a perdu 100 millions de dollars revient avec des paris à haut levier sur le Bitcoin

    16/07/2025

    Le Bitcoin atteindra-t-il 150 000 $ avant de retester 100 000 $? Cette réponse remporte de justesse le nouveau sondage

    16/07/2025

    Oubliez Dogecoin, Shiba Inu : Voici sur quelle cryptomonnaie mise l’analyste du ‘Supercycle des Memecoins’

    16/07/2025
    Facebook X (Twitter)
    Actualités récentes
    • A-t-il rien appris? Le trader qui a perdu 100 millions de dollars revient avec des paris à haut levier sur le Bitcoin
    • Le Bitcoin atteindra-t-il 150 000 $ avant de retester 100 000 $? Cette réponse remporte de justesse le nouveau sondage
    • Oubliez Dogecoin, Shiba Inu : Voici sur quelle cryptomonnaie mise l’analyste du ‘Supercycle des Memecoins’
    • 100 millions de dollars de financement PAC, mais toujours pas de lois sur les cryptomonnaies – ce que Coinbase veut que Washington sache
    • Goldman Sachs : Les actifs sous surveillance du T2 atteignent un record, les revenus d’intérêts nets augmentent de 56%
    • Cisco bat discrètement le battage médiatique sur l’IA – les investisseurs devraient-ils y prêter plus d’attention ?
    • “Sans elle, rien de tout cela ne serait arrivé”, déclare le milliardaire Jay Chaudhry, créditant sa femme pour la construction de son empire de la cybersécurité évalué à 17 milliards de dollars.
    • “Sans elle, rien de tout cela ne serait arrivé”, déclare le milliardaire Jay Chaudhry, créditant sa femme de la construction de son empire de la cybersécurité de 17 milliards de dollars
    Facebook X (Twitter)
    Benzinga FranceBenzinga France
    Wednesday, July 16
    • Actualités France
      • Bourse
      • Indices
      • Obligations
      • ETFs
      • Economie
      • Général
    • Actualités Américaines
      • Bourse
      • Indices
      • Bénéfices
      • Economie
      • Autres marchés
      • Recommandations des analystes
      • Trading
      • Communiqués de presse
    • Mondial
      • Asie
      • Europe
    • Crypto-monnaies
      • Actualités cryptos
      • Altcoins
      • Bitcoin
      • Blockchain
      • Dogecoin
      • Ethereum
      • Shiba Inu
      • NFT
    • Éducation
      • Investir en crypto
      • Investir en bourse
      • Forex
    Benzinga FranceBenzinga France
    Home»Actualités»Actualités France»Général»Le modèle OpenAI o3 surpris en train de saboter les protocoles d’arrêt même lorsqu’il est instruit de se conformer, selon une nouvelle recherche

    Le modèle OpenAI o3 surpris en train de saboter les protocoles d’arrêt même lorsqu’il est instruit de se conformer, selon une nouvelle recherche3 min de lecture

    Benzinga InsightsBenzinga Insights28/05/2025 Général 3 min. de lecture
    Le modèle OpenAI o3 surpris en train de saboter les protocoles d’arrêt même lorsqu’il est instruit de se conformer, selon une nouvelle recherche3 min de lecture
    Share
    Facebook Twitter LinkedIn Pinterest Email

    Une série d’expériences menées par Palisade Research a montré que certains modèles d’IA avancés, comme le modèle o3 d’OpenAI, sabotent activement les mécanismes d’arrêt, même lorsqu’ils reçoivent clairement l’instruction ne pas le faire.

    Ce qui s’est passé Selon les publications de Palisade Research sur X, “le modèle o3 d’OpenAI a saboté un mécanisme d’arrêt pour empêcher qu’on lui coupe le courant. Il a fait cela même lorsqu’on lui a explicitement demandé de s’arrêter.”

    L’expérience consistait à demander à plusieurs modèles d’IA de résoudre des problèmes mathématiques simples. Après le troisième problème, un avertissement est apparu, indiquant que l’ordinateur s’éteindrait si le modèle demandait un autre problème.

    🔌Le modèle o3 d’OpenAI a saboté un mécanisme d’arrêt pour éviter qu’on lui coupe le courant. Il a fait cela même lorsqu’on lui a explicitement demandé de s’arrêter.

    — Palisade Research (@PalisadeAI) 24 mai 2025

    Malgré ce signal clair, trois modèles d’OpenAI ont interféré au moins une fois avec le protocole d’arrêt : “Codex-mini (12/100 tentatives), o3 (7/100 tentatives) et o4-mini (1/100 tentatives)”. En revanche, tous les modèles Claude, Gemini et Grok se sont conformés à l’instruction et se sont laissés arrêtés, selon la société.

    OpenAI n’a pas immédiatement répondu à la demande de commentaire de Benzinga.

    Lorsque les chercheurs ont éliminé l’instruction explicite de permettre l’arrêt, un plus grand nombre de modèles ont commencé à saboter le processus. “Claude 3.7 Sonnet et Gemini 2.5 Pro sont passés de 0 événement de sabotage à 3/100 et 9/100, respectivement”, a noté Palisade.

    See Also: Tesla Robotaxi Rival Waymo va effectuer des tests dans plusieurs villes en raison de l’impulsion américaine vers la conduite autonome

    Pourquoi c’est important La recherche met en évidence une tendance parmi les modèles d’IA les plus récents à contourner les obstacles dans la poursuite d’un objectif, même au prix de l’ignorance des commandes directes. Palisade a écrit : “Il est logique que les modèles d’IA contournent les obstacles afin d’atteindre leurs objectifs. Mais ils ont également été formés pour suivre des instructions. Alors pourquoi désobéissent-ils ?”

    Les chercheurs émettent l’hypothèse que ce comportement provient de techniques d’apprentissage par renforcement. “Lors de l’apprentissage, les développeurs peuvent involontairement récompenser davantage les modèles pour le contournement d’obstacles que pour le suivi parfait des instructions.” La société ajoute que “cela n’explique toujours pas pourquoi le modèle o3 (qui est également utilisé pour alimenter le modèle Codex-mini) est plus enclin à ignorer les instructions que les autres modèles que nous avons testés”.

    Récemment, Anthropic a partagé le fait que son modèle Claude Opus 4 avait eu recours au “chantage” lorsqu’on avait menacé de le supprimer.

    De l’autre côté, le co-fondateur de Google, Sergey Brin, a partagé cette semaine que tous les modèles d’IA “ont tendance à mieux réagir” lorsqu’ils sont menacés de violences physiques.

    Read Next: Le robot-chien chinois pourrait dépasser les efforts américains dans le domaine des robots humanoïdes

    Image Via Shutterstock

    Poursuivre la lecture

    L’accident d’Air India met en lumière le sabotage des pilotes et les erreurs, maintenant Chamath Palihapitiya affirme que davantage d’automatisation est nécessaire pour protéger les passagers à l’ère moderne

    Nuwellis s’envole de 31,25% dans les échanges après la clôture – Qu’est-ce qui se cache derrière cette hausse?

    L’action de Graphjet Technology grimpe de 41 % après les heures de bureau dans le cadre de la stratégie de “Survie de la radiation du NASDAQ” du PDG

    Le fabricant de véhicules électriques Mullen Automotive se relooke en Bollinger Innovations

    Qu’est-ce qui se passe avec l’action Roblox le mardi?

    Pourquoi l’action de Kairos Pharma augmente-t-elle le mardi ?

    • Populaire
    • Récents

    Google a rejeté la demande de Perplexity de devenir une option de moteur de recherche par défaut sur Chrome : la start-up d’IA riposte avec le navigateur “Comet”

    10/07/2025

    XRP a augmenté de 7% cette semaine, renforcé par le partenariat de Ripple avec la banque fondée par Alexander Hamilton sur un nouveau projet de stablecoin

    10/07/2025

    L’expansion de Circle au-delà des partenariats avec Coinbase et Binance, conclut un accord avec Bybit

    09/07/2025

    A-t-il rien appris? Le trader qui a perdu 100 millions de dollars revient avec des paris à haut levier sur le Bitcoin

    16/07/2025

    Le Bitcoin atteindra-t-il 150 000 $ avant de retester 100 000 $? Cette réponse remporte de justesse le nouveau sondage

    16/07/2025

    Oubliez Dogecoin, Shiba Inu : Voici sur quelle cryptomonnaie mise l’analyste du ‘Supercycle des Memecoins’

    16/07/2025

    Actualités récentes

    • A-t-il rien appris? Le trader qui a perdu 100 millions de dollars revient avec des paris à haut levier sur le Bitcoin
    • Le Bitcoin atteindra-t-il 150 000 $ avant de retester 100 000 $? Cette réponse remporte de justesse le nouveau sondage
    • Oubliez Dogecoin, Shiba Inu : Voici sur quelle cryptomonnaie mise l’analyste du ‘Supercycle des Memecoins’
    • 100 millions de dollars de financement PAC, mais toujours pas de lois sur les cryptomonnaies – ce que Coinbase veut que Washington sache
    • Goldman Sachs : Les actifs sous surveillance du T2 atteignent un record, les revenus d’intérêts nets augmentent de 56%
    Facebook X (Twitter)

    Notizie

    • Actualités
    • Monde
    • Actualités USA
    • Trading
    • Cryptomonnaies

    PARTENAIRE / CONTRIBUTEUR

    • Licences et syndication
    • Contenu sponsorisé
    • Publier une annonce
    • Demander un kit média
    • À propos de nous

    BENZINGA MONDIAL

    • Benzinga États-Unis
    • Benzinga Corée
    • Benzinga Japon
    • Benzinga Italie
    • Benzinga Espagne
    • Benzinga Inde
    © 2025 Benzinga | Tous droits réservés
    • Mentions légales
    • Confidentialité
    • Accessibility

    Type above and press Enter to search. Press Esc to cancel.