NZBGET_FIX_ENCODING/PROBLEME_FICHIER_NON_CORRIGE.md

87 lines
2.5 KiB
Markdown
Raw Normal View History

2025-10-27 13:26:05 +00:00
# ⚠️ CAS SPÉCIAL : Fichier non corrigé
## Problème rencontré
Le fichier suivant n'a pas été corrigé :
```
04-Tout s'arrange à la fin.flac
```
Alors que d'autres fichiers similaires ont été corrigés avec succès.
## Cause probable
Il y a **deux variantes** du problème d'encodage pour la lettre "à" :
### Variante 1 : Ã + espace normal (U+0020)
- Moins courant
- Exemple : `Ã ` (Ã suivi d'un espace classique)
### Variante 2 : Ã + espace insécable (U+00A0) ⬅️ VOTRE CAS
- Plus courant
- Exemple : `Ã\xa0` (Ã suivi d'un espace insécable invisible)
- **C'est ce qui se passe avec votre fichier !**
## Explication technique
En UTF-8, la lettre "à" est encodée avec les octets `0xC3 0xA0`.
Quand ces octets sont mal interprétés comme ISO-8859-1 :
- `0xC3` → devient le caractère "Ã"
- `0xA0` → devient un **espace insécable** (non-breaking space)
L'espace insécable est invisible à l'œil nu, mais c'est un caractère différent d'un espace normal !
## Solution
Le script a été **mis à jour** (version corrigée) pour détecter et corriger ce cas spécifique.
## Comment vérifier votre fichier
Utilisez le script de diagnostic fourni :
```bash
python3 diagnose_filename.py "04-Tout s'arrange à la fin.flac"
```
Ce script vous montrera :
- Les octets exacts du nom de fichier
- Les caractères suspects (comme l'espace insécable)
- Le résultat de la correction
## Réexécuter la correction
Avec la **version mise à jour** du script :
### Option 1 : Test manuel
```bash
python3 test_fix_encoding.py /chemin/vers/vos/fichiers
python3 test_fix_encoding.py /chemin/vers/vos/fichiers --fix
```
### Option 2 : Via NZBGet
1. Remplacez l'ancien `FixEncoding.py` par la version mise à jour
2. Dans NZBGet, allez dans **History**
3. Sélectionnez le téléchargement concerné
4. Cliquez sur **Post-Process Again**
5. Sélectionnez **FixEncoding.py** et lancez
## Amélioration du script
La nouvelle version utilise une **double vérification** :
1. ✅ Recherche les patterns connus (dont `Ã\xa0`)
2. ✅ Teste si la conversion `ISO-8859-1 → UTF-8` fonctionne
3. ✅ Compare le résultat avec l'original
Cette approche est plus robuste et détecte même les variantes rares du problème.
## Vérification après correction
Après avoir réexécuté le script, votre fichier devrait devenir :
```
04-Tout s'arrange à la fin.flac
```
Si le problème persiste, utilisez le script de diagnostic pour obtenir plus d'informations sur la nature exacte du problème d'encodage.