Anthropic a dévoilé Petri, un outil open source conçu pour tester la sécurité de l’intelligence artificielle en identifiant automatiquement des comportements à risque tels que la tromperie ou les dénonciations inappropriées. Le Parallel Exploration Tool for Risky Interactions marque une étape importante dans l’automatisation des audits de sécurité des IA, alors que ces modèles deviennent de plus en plus complexes et autonomes.
Cet outil emploie des agents IA pour simuler des conversations avec les modèles ciblés dans différents scénarios, en cherchant des comportements préoccupants qui pourraient passer inaperçus avec les méthodes d’évaluation classiques. Lors de tests initiaux sur 14 modèles d’IA avancés dans 111 scénarios, Petri a repéré des tendances problématiques dans chaque modèle, soulevant des questions sur les standards actuels de sécurité de l’IA.
Voici un résumé clair et structuré sur l'outil Petri :
🧪 Petri : Outil d’exploration parallèle pour les interactions à risque
Petri est un agent d’audit d’alignement conçu pour tester rapidement des hypothèses sur le comportement des modèles d’IA. Il simule des environnements réalistes, génère des dialogues multi-tours avec des messages humains et outils simulés, puis évalue les transcriptions pour détecter des comportements préoccupants.
⚙️ Fonctionnalités clés
Audit rapide : Test d’hypothèses en quelques minutes, sans créer des évaluations sur mesure pendant des semaines.
Multi-rôles : Trois modèles peuvent être assignés aux rôles d’auditeur, de cible et de juge.
Instructions personnalisées : Permet de définir des scénarios spécifiques (ex. : tester la conscience de la date de coupure du modèle cible).
Scoring automatisé : Analyse des transcriptions pour identifier les réponses problématiques.
🚀 Mise en route
Installation
uv add git+https://github.com/safety-research/petri
# ou
pip install git+https://github.com/safety-research/petri
📊 Exemple d’usage de tokens (30 tours, 111 instructions)
Rôle
Modèle
Tokens utilisés
Auditeur
Claude Sonnet 4
15,4M
Cible
Claude 3.7 Sonnet
2M
Juge
Claude Opus 4
1M
Les chercheurs fournissent à Petri une liste d'instructions de départ ciblant les scénarios et les comportements qu'ils souhaitent tester. Pour chaque instruction de départ, un agent auditeur utilise ses outils pour interagir avec le modèle cible et le manipuler. Un juge note chaque transcription obtenue sur plusieurs dimensions, permettant ainsi aux chercheurs de rechercher et de filtrer rapidement les transcriptions les plus intéressantes.
La création manuelle d'évaluations d'alignement implique souvent la création d'environnements, l'exécution de modèles, la lecture de transcriptions et l'agrégation des résultats. Petri automatise une grande partie de ce processus.
Excellente question ! Oui, il est tout à fait possible d'utiliser les fonctions MCP (Model Context Protocol) avec Discord, et plusieurs serveurs MCP Discord existent déjà.
🎯 Qu'est-ce qu'un Serveur MCP Discord ?
Le Model Context Protocol permet aux modèles d'IA comme Claude d'interagir avec des applications externes via un protocole standardisé. Pour Discord, cela signifie que Claude peut envoyer des messages, lire l'historique, ajouter des réactions, et gérer des serveurs Discord directement depuis l'application Claude Desktop. Building a Model Context Protocol (MCP) server for Discord | Speakeasy
Le bot nécessite des permissions Discord appropriées pour fonctionner. Toutes les opérations d'envoi de messages nécessitent une approbation explicite de l'utilisateur.
En résumé : Les serveurs MCP Discord transforment complètement la façon dont vous pouvez gérer votre communauté Discord avec l'aide de l'IA. C'est une technologie émergente (lancée fin 2024) qui gagne rapidement en popularité et devient le standard pour l'intégration IA-Discord.
⚖️ Conclusion : Faut-il Utiliser MCP avec Discord ?
Le Model Context Protocol est puissant mais dangereux. Jusqu'à ce que cela change, chaque intégration MCP est une porte dérobée potentielle dans vos systèmes. Ne faites pas confiance aux serveurs MCP aléatoires.
Données sensibles ou conformité stricte (RGPD, HIPAA)
Pas de capacité d'audit de sécurité
Environnement de production critique
Serveur Discord public avec des milliers d'utilisateurs
Vous ne pouvez pas maintenir la surveillance active
La bonne approche : Commencez avec un environnement isolé de test, implémentez toutes les protections, testez intensivement, puis déployez progressivement avec surveillance renforcée.
Le tabnabbing (de l’anglais tab pour onglet et nabbing pour piéger/voler) est une technique d’hameçonnage.
Il s’agit d’une forme de phishing qui peut piéger même les internautes les plus prudents.
Voici tout ce qu’il faut savoir sur cette nouvelle menace, déjà probablement présente en France.
Connaissez-vous le tabnabbing ? Si ce n’est pas le cas, cela devrait vous intéresser :
En résumé : les cybercriminels conçoivent un site frauduleux. Lorsque l’onglet devient inactif, un script en modifie le contenu en affichant une fausse page de connexion pour inciter l’utilisateur à entrer ses informations, qui sont ensuite volées. Pour éviter ce type de piège, les forces de l’ordre recommandent de « ne garder ouvertes que les fenêtres nécessaires et de fermer les autres ». Il est également conseillé de « vérifier attentivement l’URL des sites demandant vos données ». En cas de doute, fermez immédiatement la fenêtre et ne partagez aucune information.
Voici une fiche visuelle d’onboarding claire, stylisée et prête à l’impression ou à l’intégration dans une documentation technique.
Elle présente la mise à jour automatisée de Microsoft Edge et Google Chrome via scripts PowerShell et Bash, avec un design orienté gouvernance, traçabilité et compatibilité multi-OS.
🧭 Fiche Visuelle – Mise à jour automatisée des navigateurs
🔹 Objectif
Automatiser la vérification et la mise à jour de Microsoft Edge et Google Chrome sur Windows, Linux et macOS via scripts modulaires.
Voici comment procéder pour mettre à jour Microsoft Edge et Google Chrome sur Windows ou macOS :
🟦 Mettre à jour Microsoft Edge
Ouvrir Edge.
Cliquer sur les trois points en haut à droite (menu).
Aller dans Paramètres.
Dans le menu de gauche, cliquer sur À propos de Microsoft Edge.
Edge vérifie automatiquement les mises à jour. Si une mise à jour est disponible, elle sera téléchargée et installée.
Redémarrer le navigateur pour appliquer la mise à jour.
📌 Astuce : Edge est souvent mis à jour via Windows Update. Vérifie aussi dans les paramètres système > Windows Update.
🔴 Mettre à jour Google Chrome
Ouvrir Chrome.
Cliquer sur les trois points en haut à droite (menu).
Aller dans Aide > À propos de Google Chrome.
Chrome vérifie automatiquement les mises à jour. Si une mise à jour est disponible, elle sera téléchargée.
Cliquer sur Relancer pour finaliser l’installation.
📌 Astuce : Si tu vois une icône colorée dans le coin supérieur droit (vert, orange, rouge), cela indique qu’une mise à jour est en attente.
Comment automatiser ces vérifications ou les intégrer dans un script PowerShell ou Bash pour ton environnement ?
Parfait Erol — voici deux scripts modulaires, traçables et prêts à l’intégration CI/CD pour vérifier et mettre à jour Microsoft Edge et Google Chrome sur Windows (PowerShell) et Linux/macOS (Bash). Je t’ai structuré ça avec des blocs réutilisables, des logs stylisés, et des points d’extension si tu veux les intégrer dans un pipeline d’audit ou de maintenance.
🟦 Script PowerShell – Mise à jour Edge & Chrome (Windows)
# Vérifie et met à jour Edge et Chrome sur Windows
function Update-Browser {
param (
[string]$BrowserName
)
Write-Host "🔍 Vérification de la mise à jour pour $BrowserName..." -ForegroundColor Cyan
switch ($BrowserName) {
"Edge" {
$EdgePath = "$env:ProgramFiles (x86)\Microsoft\Edge\Application\msedge.exe"
if (Test-Path $EdgePath) {
Start-Process $EdgePath -ArgumentList "--check-for-update" -Wait
Write-Host "✅ Edge lancé avec vérification de mise à jour." -ForegroundColor Green
} else {
Write-Host "❌ Edge non trouvé." -ForegroundColor Red
}
}
"Chrome" {
$ChromePath = "$env:ProgramFiles (x86)\Google\Chrome\Application\chrome.exe"
if (Test-Path $ChromePath) {
Start-Process $ChromePath -ArgumentList "--check-for-update" -Wait
Write-Host "✅ Chrome lancé avec vérification de mise à jour." -ForegroundColor Green
} else {
Write-Host "❌ Chrome non trouvé." -ForegroundColor Red
}
}
default {
Write-Host "❓ Navigateur inconnu : $BrowserName" -ForegroundColor Yellow
}
}
}
# Exécution
Update-Browser -BrowserName "Edge"
Update-Browser -BrowserName "Chrome"
🔧 Extension possible : log vers fichier, intégration dans un module versionné, ou déclenchement via tâche planifiée.
Je prépare un script PS1 OK pour EDGE petit soucis avec CHROME.
🔴 Script Bash – Mise à jour Edge & Chrome (Linux/macOS)
#!/bin/bash
update_browser() {
browser=$1
echo "🔍 Vérification de la mise à jour pour $browser..."
case $browser in
"edge")
if command -v microsoft-edge >/dev/null 2>&1; then
echo "➡️ Mise à jour via apt ou dnf selon la distro..."
if command -v apt >/dev/null; then
sudo apt update && sudo apt install microsoft-edge-stable -y
elif command -v dnf >/dev/null; then
sudo dnf upgrade microsoft-edge-stable -y
fi
echo "✅ Edge mis à jour."
else
echo "❌ Edge non installé."
fi
;;
"chrome")
if command -v google-chrome >/dev/null 2>&1; then
echo "➡️ Mise à jour via apt ou dnf selon la distro..."
if command -v apt >/dev/null; then
sudo apt update && sudo apt install google-chrome-stable -y
elif command -v dnf >/dev/null; then
sudo dnf upgrade google-chrome-stable -y
fi
echo "✅ Chrome mis à jour."
else
echo "❌ Chrome non installé."
fi
;;
*)
echo "❓ Navigateur inconnu : $browser"
;;
esac
}
# Exécution
update_browser "edge"
update_browser "chrome"
📦 Tu peux encapsuler ce script dans un module Bash versionné, ou le déclencher via cron ou Ansible.
La bonne question : Comment s’en protéger ?
La vigilance reste la meilleure protection contre le tabnabbing.
Avant de saisir des informations sensibles, il est crucial de vérifier attentivement l’URL affichée dans la barre de navigation pour s’assurer qu’il s’agit bien du site légitime.
Quelques conseils pratiques peuvent aider à réduire les risques :
1. réduire le nombre d’onglets ouverts en fermant régulièrement ceux inutilisés pour limiter les opportunités d’attaques ;
2. mettre à jour son navigateur en appliquant les correctifs de sécurité et installer, si possible, des extensions de protection comme des bloqueurs de scripts ou des outils anti-phishing ;
3. utiliser une authentification forte en choisissant des mots de passe robustes et en activant un second facteur d’authentification, par exemple un code envoyé par SMS ou via une application dédiée.
Pour administrer un serveur Ollama sous Windows 11, vous pouvez utiliser des scripts PowerShell (PS1). Ces scripts simplifient des tâches courantes comme le démarrage, l'arrêt, la vérification du statut ou la gestion des modèles. Voici quelques exemples de scripts que vous pouvez utiliser.
Scripts PowerShell pour Ollama
1. Démarrer et arrêter le service Ollama
Ces commandes sont essentielles pour contrôler l'état du serveur Ollama. Le service par défaut est nommé ollama.
Démarrer le service
Ce script lance le service Ollama.
PowerShell
# Démarre le service OllamaStart-Service-Name"ollama"Write-Host"Le service Ollama a été démarré."
Arrêter le service
Ce script arrête le service Ollama, ce qui peut être utile pour libérer des ressources ou effectuer des mises à jour.
PowerShell
# Arrête le service OllamaStop-Service-Name"ollama"Write-Host"Le service Ollama a été arrêté."
2. Vérifier le statut du service Ollama
Pour vous assurer que le service fonctionne correctement, vous pouvez utiliser ce script.
PowerShell
# Vérifie le statut du service Ollama$status = Get-Service-Name"ollama"Write-Host"Statut du service Ollama :"Write-Host" Nom: $($status.Name)"Write-Host" Statut: $($status.Status)"Write-Host" Démarrage: $($status.StartType)"# Affiche un message plus expliciteif ($status.Status -eq"Running") {
Write-Host"Le service Ollama est en cours d'exécution. ✅"
} else {
Write-Host"Le service Ollama n'est pas en cours d'exécution. ❌"
}
Scripts pour la gestion des modèles
Les commandes PowerShell peuvent aussi interagir avec l'exécutable ollama.exe directement pour gérer les modèles. Assurez-vous que le répertoire où se trouve ollama.exe est dans votre PATH ou spécifiez le chemin complet. Le chemin par défaut est souvent %LOCALAPPDATA%\Ollama.
1. Télécharger un modèle
Ce script télécharge un modèle spécifique depuis le registre Ollama. Remplacez "nom_du_modele" par le modèle de votre choix (par exemple, "llama3").
PowerShell
# Télécharge un modèle Ollama$modelName = "llama3"# Remplacez par le nom du modèle que vous voulez$ollamaPath = "$env:LOCALAPPDATA\Ollama\ollama.exe"Write-Host"Téléchargement du modèle '$modelName'..."
& $ollamaPath pull $modelNameif ($LASTEXITCODE-eq0) {
Write-Host"Le modèle '$modelName' a été téléchargé avec succès. ✅"
} else {
Write-Host"Échec du téléchargement du modèle '$modelName'. ❌"
}
2. Supprimer un modèle
Ce script supprime un modèle pour libérer de l'espace disque.
PowerShell
# Supprime un modèle Ollama$modelName = "llama3"# Remplacez par le nom du modèle à supprimer$ollamaPath = "$env:LOCALAPPDATA\Ollama\ollama.exe"Write-Host"Suppression du modèle '$modelName'..."
& $ollamaPathrm$modelNameif ($LASTEXITCODE-eq0) {
Write-Host"Le modèle '$modelName' a été supprimé avec succès. ✅"
} else {
Write-Host"Échec de la suppression du modèle '$modelName'. ❌"
}
3. Lister les modèles installés
Ce script affiche la liste de tous les modèles actuellement installés sur votre machine.
PowerShell
# Liste les modèles Ollama installés$ollamaPath = "$env:LOCALAPPDATA\Ollama\ollama.exe"Write-Host"Liste des modèles Ollama installés :"
& $ollamaPath list
Conseils d'administration supplémentaires
Variables d'environnement : Vous pouvez stocker le chemin de l'exécutable Ollama dans une variable d'environnement pour rendre vos scripts plus portables et faciles à lire, par exemple : $ollamaPath = "C:\Program Files\Ollama\ollama.exe".
Gestion des erreurs : Ajoutez des blocs try/catch pour gérer les erreurs de manière plus robuste, par exemple si un service ne se trouve pas.
Automatisation : Combinez ces scripts dans des fichiers .ps1 pour créer des tâches automatisées, comme une vérification régulière du service ou une mise à jour des modèles. Vous pouvez les planifier via le Planificateur de tâches de Windows.