Why don't python interpreter use the file coding format for decoding? -
कोड बीले के कारण मुझे पता है क्योंकि अजगर दुभाषिया > इम्प्लिकेट डिकोडिंग नहीं कर सकता पता है कि स्रोत एन्कोडिंग क्या इस्तेमाल किया गया था। यह जानकारी स्ट्रिंग्स के साथ संग्रहीत नहीं है। आयात करने के बाद सभी पायथन को बाइट स्ट्रिंग के साथ 0-255 रेंज में बाइट का प्रतिनिधित्व कर रहा है। आप उस स्ट्रिंग को दूसरे मॉड्यूल से आयात कर सकते हैं या इसे किसी फ़ाइल ऑब्जेक्ट से पढ़ सकते हैं। तथ्य यह है कि पार्सर जानता था कि इन बाइट्स के लिए एन्कोडिंग किस प्रकार उपयोग किया गया था, सादे बाइट स्ट्रिंग्स के लिए भी कोई फर्क नहीं पड़ता। इस तरह, अंतर्निहित डीकोड पर भरोसा करने के बजाय, बाइट्स को स्पष्ट करना स्पष्ट रूप से को डीकोड करना हमेशा बेहतर होता है। या तो यूनिकोडडेकोड एरर होगा:
# - * - कोडिंग: यूटीएफ -8 - * - s = "ä¸æ ????" यू = यू "123" यू = एस + यू
ascii को डिकोड करने के लिए
s उपयोग कर रहा है।
s के लिए एक यूनिकोड शाब्दिक का उपयोग करें, या
str.decode ()
u = s.decode (का उपयोग करके स्पष्ट रूप से डीकोड करें) 'Utf8') + u
Comments
Post a Comment