Why don't python interpreter use the file coding format for decoding? -


कोड बीले के कारण यूनिकोडडेकोड एरर होगा:

  # - * - कोडिंग: यूटीएफ -8 - * - s = "ä¸æ ????" यू = यू "123" यू = एस + यू   

मुझे पता है क्योंकि अजगर दुभाषिया ascii को डिकोड करने के लिए s उपयोग कर रहा है।

"post-text" itemprop = "text"

>

इम्प्लिकेट डिकोडिंग नहीं कर सकता पता है कि स्रोत एन्कोडिंग क्या इस्तेमाल किया गया था। यह जानकारी स्ट्रिंग्स के साथ संग्रहीत नहीं है।

आयात करने के बाद सभी पायथन को बाइट स्ट्रिंग के साथ 0-255 रेंज में बाइट का प्रतिनिधित्व कर रहा है। आप उस स्ट्रिंग को दूसरे मॉड्यूल से आयात कर सकते हैं या इसे किसी फ़ाइल ऑब्जेक्ट से पढ़ सकते हैं। तथ्य यह है कि पार्सर जानता था कि इन बाइट्स के लिए एन्कोडिंग किस प्रकार उपयोग किया गया था, सादे बाइट स्ट्रिंग्स के लिए भी कोई फर्क नहीं पड़ता।

इस तरह, अंतर्निहित डीकोड पर भरोसा करने के बजाय, बाइट्स को स्पष्ट करना स्पष्ट रूप से को डीकोड करना हमेशा बेहतर होता है। या तो s के लिए एक यूनिकोड शाब्दिक का उपयोग करें, या str.decode ()

  u = s.decode (का उपयोग करके स्पष्ट रूप से डीकोड करें) 'Utf8') + u    

Comments

Popular posts from this blog

ios - Adding an SKSpriteNode to SKScene from a child SKSpriteNode -

Matlab transpose a table vector -

c# - Textbox not clickable but editable -