Why don't python interpreter use the file coding format for decoding? -


कोड बीले के कारण यूनिकोडडेकोड एरर होगा:

  # - * - कोडिंग: यूटीएफ -8 - * - s = "䏿 ????" यू = यू "123" यू = एस + यू   

मुझे पता है क्योंकि अजगर दुभाषिया ascii को डिकोड करने के लिए s उपयोग कर रहा है।

"post-text" itemprop = "text"

>

इम्प्लिकेट डिकोडिंग नहीं कर सकता पता है कि स्रोत एन्कोडिंग क्या इस्तेमाल किया गया था। यह जानकारी स्ट्रिंग्स के साथ संग्रहीत नहीं है।

आयात करने के बाद सभी पायथन को बाइट स्ट्रिंग के साथ 0-255 रेंज में बाइट का प्रतिनिधित्व कर रहा है। आप उस स्ट्रिंग को दूसरे मॉड्यूल से आयात कर सकते हैं या इसे किसी फ़ाइल ऑब्जेक्ट से पढ़ सकते हैं। तथ्य यह है कि पार्सर जानता था कि इन बाइट्स के लिए एन्कोडिंग किस प्रकार उपयोग किया गया था, सादे बाइट स्ट्रिंग्स के लिए भी कोई फर्क नहीं पड़ता।

इस तरह, अंतर्निहित डीकोड पर भरोसा करने के बजाय, बाइट्स को स्पष्ट करना स्पष्ट रूप से को डीकोड करना हमेशा बेहतर होता है। या तो s के लिए एक यूनिकोड शाब्दिक का उपयोग करें, या str.decode ()

  u = s.decode (का उपयोग करके स्पष्ट रूप से डीकोड करें) 'Utf8') + u    

Comments

Popular posts from this blog

php - how to change mysql_result($res, 0, "url"); to mysqli -

c# - Textbox not clickable but editable -

Matlab transpose a table vector -