Utiliser le filtrage Bayésien

Cet article (en anglais) décrit une méthode qui consiste à assigner une probabilité à des mots individuels. Notre système de courriel intègre le filtre SpamAssassin, qui effectue un test Bayésien conjointement à ses tests réguliers. Note: Si vous n'avez pas déjà configuré votre courriel pour le filtrage anti-spam, voyez d'abord: Utiliser le filtre anti-spam.

Entraînement automatique

Par défaut, SpamAssassin entraîne automatiquement le filtre Bayes en fonction des résultats de ses autres tests. Si nécessaire, vous pouvez désactiver cette fonction avec la directive bayes_auto_learn=0 dans ~/.spamassassin/user_prefs.

Entraîner le filtre avec le dossier Spam/

Lorsque un utilisateur déplace un courriel vers Spam/, le serveur apprends automatiquement à partir du message (en tant que spam confirmé). Déplacer un message à partir de Spam/ vers la Boîte de Réception aura l'effet contraire. Cette matrice illustre l'action précise effectuée par le serveur lors du déplacement d'un courriel:

_Destination^Source	`Spam/`	`Trash/`	`Quarantine/`	Boîte Réception / autre
`Spam/`			Traiter comme spam	Traiter comme spam
`Trash/`			(Interdit)
`Quarantine/`	(Interdit)	(Interdit)		(Interdit)
Boîte Réception / autre	Traiter comme not spam		Traiter comme not spam

Certains programmes de courriel IMAP utilisent des noms différents pour Spam/ et Trash/. Pour adresser ce problème, le serveur reconnaît aussi Junk/, Deleted Items/, des variations de casse, et des traductions communes tel que Courrier Indésirable/ et Éléments supprimés/.

Entraîner le filtre manuellement

Vous pouvez également entraîner le filtre Bayes manuellement en utilisant le programme sa-learn sur le serveur.

Pour exécuter ces commandes, assurez-vous d'être loggé sur le bon compte, sur le serveur courriel actif. Dans l'Interface Web, consultez la section "Courriel / Boîtes Courriel" pour voir l'ensemble de vos comptes courriel. Si le nom du compte est yourname et votre serveur courriel est mail123.csoft.net, utilisez:

  $ ssh yourname@mail123.csoft.net

L'utilitaire sa-learn peut lire des courriels contenus dans des fichiers individuel, ou des dossiers entiers. Utilisez l'argument --spam pour indiquer qu'il sagit de spam confirmé:

  $ sa-learn --spam ~/Mail/Maildir/.Spam

Utilisez l'argument --ham pour indiquer du non-spam confirmé. Si votre Boîte de Réception ne contient pas de spam, vous pouvez traiter son contenu avec:

  $ sa-learn --ham ~/Mail/Maildir/cur

Pour afficher des détails à propos de votre base de données Bayes, utilisez l'argument --dump magic:

  $ sa-learn --dump magic

Pour les utilisateurs de mutt

Si vous utilisez l'application mutt, vous pouvez ajouter des raccourcis à votre muttrc afin que des touches spécifiques enregistrent le message sélectionné comme étant soit du spam ou du courrier légitime («ham»).

  set wait_key=no

  # H: Register message as non-spam
  macro index H "|sa-learn --ham --no-rebuild --single"
  macro pager H "|sa-learn --ham --no-rebuild --single"

  # S: Register the message as spam
  macro index S "|sa-learn --spam --no-rebuild --single"
  macro pager S "|sa-learn --spam --no-rebuild --single"

  # R: Rebuild the Bayes database (call last)
  macro index R "|sa-learn --rebuild"
  macro pager R "|sa-learn --rebuild"

Links