NZBGET_FIX_ENCODING/PROBLEME_FICHIER_NON_CORRIGE.md

2.5 KiB

⚠️ CAS SPÉCIAL : Fichier non corrigé

Problème rencontré

Le fichier suivant n'a pas été corrigé :

04-Tout s'arrange à la fin.flac

Alors que d'autres fichiers similaires ont été corrigés avec succès.

Cause probable

Il y a deux variantes du problème d'encodage pour la lettre "à" :

Variante 1 : Ã + espace normal (U+0020)

  • Moins courant
  • Exemple : Ã (Ã suivi d'un espace classique)

Variante 2 : Ã + espace insécable (U+00A0) ⬅️ VOTRE CAS

  • Plus courant
  • Exemple : Ã\xa0 (Ã suivi d'un espace insécable invisible)
  • C'est ce qui se passe avec votre fichier !

Explication technique

En UTF-8, la lettre "à" est encodée avec les octets 0xC3 0xA0.

Quand ces octets sont mal interprétés comme ISO-8859-1 :

  • 0xC3 → devient le caractère "Ã"
  • 0xA0 → devient un espace insécable (non-breaking space)

L'espace insécable est invisible à l'œil nu, mais c'est un caractère différent d'un espace normal !

Solution

Le script a été mis à jour (version corrigée) pour détecter et corriger ce cas spécifique.

Comment vérifier votre fichier

Utilisez le script de diagnostic fourni :

python3 diagnose_filename.py "04-Tout s'arrange à la fin.flac"

Ce script vous montrera :

  • Les octets exacts du nom de fichier
  • Les caractères suspects (comme l'espace insécable)
  • Le résultat de la correction

Réexécuter la correction

Avec la version mise à jour du script :

Option 1 : Test manuel

python3 test_fix_encoding.py /chemin/vers/vos/fichiers
python3 test_fix_encoding.py /chemin/vers/vos/fichiers --fix

Option 2 : Via NZBGet

  1. Remplacez l'ancien FixEncoding.py par la version mise à jour
  2. Dans NZBGet, allez dans History
  3. Sélectionnez le téléchargement concerné
  4. Cliquez sur Post-Process Again
  5. Sélectionnez FixEncoding.py et lancez

Amélioration du script

La nouvelle version utilise une double vérification :

  1. Recherche les patterns connus (dont Ã\xa0)
  2. Teste si la conversion ISO-8859-1 → UTF-8 fonctionne
  3. Compare le résultat avec l'original

Cette approche est plus robuste et détecte même les variantes rares du problème.

Vérification après correction

Après avoir réexécuté le script, votre fichier devrait devenir :

04-Tout s'arrange à la fin.flac

Si le problème persiste, utilisez le script de diagnostic pour obtenir plus d'informations sur la nature exacte du problème d'encodage.