utf 8 - training file language_id.txt for Google Prediction API unusable -


मैं Google Prediction API का अनुसरण कर रहा हूं।

दुर्भाग्य से प्रशिक्षण फ़ाइल को किसी तरह भ्रष्ट लगता है? मैंने Google क्रोम और फ़ायरफ़ॉक्स का उपयोग करके इसे डाउनलोड करने का परीक्षण किया है, एक ही परिणाम, स्क्रीनशॉट देखें:

छवि विवरण दर्ज करें यहाँ

मुझे लगता है, इसलिए मेरे परीक्षण काम नहीं करते हैं और मैं हमेशा अंग्रेजी 1.0 Muy Bueno उदाहरण स्ट्रिंग के लिए स्कोर के रूप में वापस मिलता है। / P>

  ... {"label": "अंग्रेज़ी", "स्कोर": "1.000000"}, ...  

मुझे कहां से से एक प्रयोग करने योग्य language_id.txt परीक्षण फ़ाइल प्राप्त करें या क्या मैं कुछ भी कर सकता हूं?

संपादित करें : मेरा अनुमान है, फाइल को यूटीएफ में संग्रहीत नहीं किया गया है Google सर्वर पर -8 प्रारूप?

फ़ाइल UTF-8 में है, लेकिन यह नहीं है एक एन्कोडिंग घोषित करें, इसलिए किसी ब्राउज़र में इसे देखने से डिफ़ॉल्ट HTTP वर्णसेट, आईएसओ -8859-1 मानता है।

मुझे यकीन नहीं है कि आपको वास्तव में एक दूषित प्रति क्यों मिल रहा है (अगर मैं इसे क्रोम में देखता हूं) , यह भ्रष्ट प्रतीत होता है, लेकिन इसे सहेजकर सही यूटीएफ -8-एन्कोड में परिणाम मिलता है एड फ़ाइल), लेकिन शायद आप इसे डाउनलोड करने के लिए एक अन्य तंत्र की कोशिश कर सकते हैं?


Comments

Popular posts from this blog

Python Equivalent for matlab cart2pol and pol2cart -

Docker - Tomcat and PostgreSQL containers in same host - No Route to host -

sip - Call SipJs to Asterisk 12 -