Close Menu
Benzinga FranceBenzinga France
    Les dernières

    Les États-Unis devraient constituer des stocks de munitions, pas de Bitcoin, déclare Jamie Dimon

    31/05/2025

    Disney offre des NFT gratuits aux abonnés de streaming : comment les fans “passionnés” peuvent obtenir de nouvelles œuvres de collection numériques

    30/05/2025

    Canary Capital cherche l’approbation de la SEC pour offrir un ETF CRO mis en jeu offrant une exposition passive aux crypto-monnaies

    30/05/2025
    Facebook X (Twitter)
    Actualités récentes
    • Les États-Unis devraient constituer des stocks de munitions, pas de Bitcoin, déclare Jamie Dimon
    • Disney offre des NFT gratuits aux abonnés de streaming : comment les fans “passionnés” peuvent obtenir de nouvelles œuvres de collection numériques
    • Canary Capital cherche l’approbation de la SEC pour offrir un ETF CRO mis en jeu offrant une exposition passive aux crypto-monnaies
    • Bitcoin, Ethereum, XRP, Dogecoin n’arrivent pas à reprendre leur souffle alors que les traders voient les vendeurs prendre le contrôle
    • Bitcoin chute en dessous de 104 000 $ alors que Trump Media lève 2,32 milliards de dollars pour construire le Trésor de BTC
    • La société canadienne de cannabis Canopy voit ses actions chuter après des résultats du quatrième trimestre en deçà des attentes : Quelle est la suite ?
    • La transformation cryptographique de Cango gagne en momentum avec sa sortie de Chine
    • Le Bitcoin chute à 105 000 $ après que Trump avertit qu’il n’est plus “Monsieur Gentil”
    Facebook X (Twitter)
    Benzinga FranceBenzinga France
    Saturday, May 31
    • Actualités France
      • Bourse
      • Indices
      • Obligations
      • ETFs
      • Economie
      • Général
    • Actualités Américaines
      • Bourse
      • Indices
      • Bénéfices
      • Economie
      • Autres marchés
      • Recommandations des analystes
      • Trading
      • Communiqués de presse
    • Mondial
      • Asie
      • Europe
    • Crypto-monnaies
      • Actualités cryptos
      • Altcoins
      • Bitcoin
      • Blockchain
      • Dogecoin
      • Ethereum
      • Shiba Inu
      • NFT
    • Éducation
      • Investir en crypto
      • Investir en bourse
      • Forex
    Benzinga FranceBenzinga France
    Home»Actualités»Actualités France»Général»Le modèle OpenAI o3 surpris en train de saboter les protocoles d’arrêt même lorsqu’il est instruit de se conformer, selon une nouvelle recherche

    Le modèle OpenAI o3 surpris en train de saboter les protocoles d’arrêt même lorsqu’il est instruit de se conformer, selon une nouvelle recherche3 min de lecture

    Benzinga InsightsBenzinga Insights28/05/2025 Général 3 min. de lecture
    Le modèle OpenAI o3 surpris en train de saboter les protocoles d’arrêt même lorsqu’il est instruit de se conformer, selon une nouvelle recherche3 min de lecture
    Share
    Facebook Twitter LinkedIn Pinterest Email

    Une série d’expériences menées par Palisade Research a montré que certains modèles d’IA avancés, comme le modèle o3 d’OpenAI, sabotent activement les mécanismes d’arrêt, même lorsqu’ils reçoivent clairement l’instruction ne pas le faire.

    Ce qui s’est passé Selon les publications de Palisade Research sur X, “le modèle o3 d’OpenAI a saboté un mécanisme d’arrêt pour empêcher qu’on lui coupe le courant. Il a fait cela même lorsqu’on lui a explicitement demandé de s’arrêter.”

    L’expérience consistait à demander à plusieurs modèles d’IA de résoudre des problèmes mathématiques simples. Après le troisième problème, un avertissement est apparu, indiquant que l’ordinateur s’éteindrait si le modèle demandait un autre problème.

    🔌Le modèle o3 d’OpenAI a saboté un mécanisme d’arrêt pour éviter qu’on lui coupe le courant. Il a fait cela même lorsqu’on lui a explicitement demandé de s’arrêter.

    — Palisade Research (@PalisadeAI) 24 mai 2025

    Malgré ce signal clair, trois modèles d’OpenAI ont interféré au moins une fois avec le protocole d’arrêt : “Codex-mini (12/100 tentatives), o3 (7/100 tentatives) et o4-mini (1/100 tentatives)”. En revanche, tous les modèles Claude, Gemini et Grok se sont conformés à l’instruction et se sont laissés arrêtés, selon la société.

    OpenAI n’a pas immédiatement répondu à la demande de commentaire de Benzinga.

    Lorsque les chercheurs ont éliminé l’instruction explicite de permettre l’arrêt, un plus grand nombre de modèles ont commencé à saboter le processus. “Claude 3.7 Sonnet et Gemini 2.5 Pro sont passés de 0 événement de sabotage à 3/100 et 9/100, respectivement”, a noté Palisade.

    See Also: Tesla Robotaxi Rival Waymo va effectuer des tests dans plusieurs villes en raison de l’impulsion américaine vers la conduite autonome

    Pourquoi c’est important La recherche met en évidence une tendance parmi les modèles d’IA les plus récents à contourner les obstacles dans la poursuite d’un objectif, même au prix de l’ignorance des commandes directes. Palisade a écrit : “Il est logique que les modèles d’IA contournent les obstacles afin d’atteindre leurs objectifs. Mais ils ont également été formés pour suivre des instructions. Alors pourquoi désobéissent-ils ?”

    Les chercheurs émettent l’hypothèse que ce comportement provient de techniques d’apprentissage par renforcement. “Lors de l’apprentissage, les développeurs peuvent involontairement récompenser davantage les modèles pour le contournement d’obstacles que pour le suivi parfait des instructions.” La société ajoute que “cela n’explique toujours pas pourquoi le modèle o3 (qui est également utilisé pour alimenter le modèle Codex-mini) est plus enclin à ignorer les instructions que les autres modèles que nous avons testés”.

    Récemment, Anthropic a partagé le fait que son modèle Claude Opus 4 avait eu recours au “chantage” lorsqu’on avait menacé de le supprimer.

    De l’autre côté, le co-fondateur de Google, Sergey Brin, a partagé cette semaine que tous les modèles d’IA “ont tendance à mieux réagir” lorsqu’ils sont menacés de violences physiques.

    Read Next: Le robot-chien chinois pourrait dépasser les efforts américains dans le domaine des robots humanoïdes

    Image Via Shutterstock

    Poursuivre la lecture

    L’Italie de Meloni : Confiance croissante des entreprises, amélioration de Moody’s et alliance audacieuse avec les États-Unis

    L’étude très suivie sur le cancer du poumon d’Ivonescimab de Summit Therapeutics ne parvient pas à atteindre le critère de jugement de survie globale

    La FAA prolonge le programme permettant à Boeing d’effectuer des inspections pour le compte de l’agence

    Les actions de Regeneron et Sanofi chutent après la publication de données inégales sur le médicament pour les poumons des fumeurs

    ‘Choqué’ par les actions de Trump, un employé du renseignement a tenté de partager des secrets d’État avec un gouvernement étranger pour soutenir les ‘valeurs pour lesquelles les États-Unis… se sont battus:’ rapport

    RFK Jr. abandonne la recommandation du vaccin COVID pour les enfants en bonne santé, mais les experts mettent en garde contre les risques majeurs

    • Populaire
    • Récents

    Les actions de Regeneron et Sanofi chutent après la publication de données inégales sur le médicament pour les poumons des fumeurs

    30/05/2025

    L’Italie de Meloni : Confiance croissante des entreprises, amélioration de Moody’s et alliance audacieuse avec les États-Unis

    30/05/2025

    ‘Choqué’ par les actions de Trump, un employé du renseignement a tenté de partager des secrets d’État avec un gouvernement étranger pour soutenir les ‘valeurs pour lesquelles les États-Unis… se sont battus:’ rapport

    30/05/2025

    Les États-Unis devraient constituer des stocks de munitions, pas de Bitcoin, déclare Jamie Dimon

    31/05/2025

    Disney offre des NFT gratuits aux abonnés de streaming : comment les fans “passionnés” peuvent obtenir de nouvelles œuvres de collection numériques

    30/05/2025

    Canary Capital cherche l’approbation de la SEC pour offrir un ETF CRO mis en jeu offrant une exposition passive aux crypto-monnaies

    30/05/2025

    Actualités récentes

    • Les États-Unis devraient constituer des stocks de munitions, pas de Bitcoin, déclare Jamie Dimon
    • Disney offre des NFT gratuits aux abonnés de streaming : comment les fans “passionnés” peuvent obtenir de nouvelles œuvres de collection numériques
    • Canary Capital cherche l’approbation de la SEC pour offrir un ETF CRO mis en jeu offrant une exposition passive aux crypto-monnaies
    • Bitcoin, Ethereum, XRP, Dogecoin n’arrivent pas à reprendre leur souffle alors que les traders voient les vendeurs prendre le contrôle
    • Bitcoin chute en dessous de 104 000 $ alors que Trump Media lève 2,32 milliards de dollars pour construire le Trésor de BTC
    Facebook X (Twitter)

    Notizie

    • Actualités
    • Monde
    • Actualités USA
    • Trading
    • Cryptomonnaies

    PARTENAIRE / CONTRIBUTEUR

    • Licences et syndication
    • Contenu sponsorisé
    • Publier une annonce
    • Demander un kit média
    • À propos de nous

    BENZINGA MONDIAL

    • Benzinga États-Unis
    • Benzinga Corée
    • Benzinga Japon
    • Benzinga Italie
    • Benzinga Espagne
    • Benzinga Inde
    © 2025 Benzinga | Tous droits réservés
    • Mentions légales
    • Confidentialité
    • Accessibility

    Type above and press Enter to search. Press Esc to cancel.