Why don't python interpreter use the file coding format for decoding? -


कोड बीले के कारण यूनिकोडडेकोड एरर होगा:

  # - * - कोडिंग: यूटीएफ -8 - * - s = "䏿 ????" यू = यू "123" यू = एस + यू   

मुझे पता है क्योंकि अजगर दुभाषिया ascii को डिकोड करने के लिए s उपयोग कर रहा है।

"post-text" itemprop = "text"

>

इम्प्लिकेट डिकोडिंग नहीं कर सकता पता है कि स्रोत एन्कोडिंग क्या इस्तेमाल किया गया था। यह जानकारी स्ट्रिंग्स के साथ संग्रहीत नहीं है।

आयात करने के बाद सभी पायथन को बाइट स्ट्रिंग के साथ 0-255 रेंज में बाइट का प्रतिनिधित्व कर रहा है। आप उस स्ट्रिंग को दूसरे मॉड्यूल से आयात कर सकते हैं या इसे किसी फ़ाइल ऑब्जेक्ट से पढ़ सकते हैं। तथ्य यह है कि पार्सर जानता था कि इन बाइट्स के लिए एन्कोडिंग किस प्रकार उपयोग किया गया था, सादे बाइट स्ट्रिंग्स के लिए भी कोई फर्क नहीं पड़ता।

इस तरह, अंतर्निहित डीकोड पर भरोसा करने के बजाय, बाइट्स को स्पष्ट करना स्पष्ट रूप से को डीकोड करना हमेशा बेहतर होता है। या तो s के लिए एक यूनिकोड शाब्दिक का उपयोग करें, या str.decode ()

  u = s.decode (का उपयोग करके स्पष्ट रूप से डीकोड करें) 'Utf8') + u    

Comments

Popular posts from this blog

c# - Textbox not clickable but editable -

Matlab transpose a table vector -

ios - Adding an SKSpriteNode to SKScene from a child SKSpriteNode -