J'ai essayé différentes méthodes pour écrire tous les caractères Unicode possibles dans un fichier, mais cela me donne une erreur pour la plage 55297-57344. Quel encodage prend en charge cette plage ?UnicodeEncodeError: 'utf-8' codec can't encode characters in position 55297-57344: surrogates not allowed
bb=""
for b in range(0, 1114111):
bb+=chr(b)
with open('allcharacters', 'w', encoding="utf-8") as file:
file.write(bb)
Les points de code U+D800 à U+DFFF sont contenus dans les différents blocs Unicode "Surrogates" . Ils se produisent lorsque le texte UTF-16 contenant du texte dans les plans multilingues supplémentaires est (mal) décodé en UCS-2 ; ils ne doivent jamais aboutir à un fonctionnement normal et ne doivent pas être traités comme des caractères.
Cet article est collecté sur Internet, veuillez indiquer la source lors de la réimpression.
En cas d'infraction, veuillez [email protected] Supprimer.
laisse moi dire quelques mots