utf 8 - training file language_id.txt for Google Prediction API unusable -


मैं Google Prediction API का अनुसरण कर रहा हूं।

दुर्भाग्य से प्रशिक्षण फ़ाइल को किसी तरह भ्रष्ट लगता है? मैंने Google क्रोम और फ़ायरफ़ॉक्स का उपयोग करके इसे डाउनलोड करने का परीक्षण किया है, एक ही परिणाम, स्क्रीनशॉट देखें:

छवि विवरण दर्ज करें यहाँ

मुझे लगता है, इसलिए मेरे परीक्षण काम नहीं करते हैं और मैं हमेशा अंग्रेजी 1.0 Muy Bueno उदाहरण स्ट्रिंग के लिए स्कोर के रूप में वापस मिलता है। / P>

  ... {"label": "अंग्रेज़ी", "स्कोर": "1.000000"}, ...  

मुझे कहां से से एक प्रयोग करने योग्य language_id.txt परीक्षण फ़ाइल प्राप्त करें या क्या मैं कुछ भी कर सकता हूं?

संपादित करें : मेरा अनुमान है, फाइल को यूटीएफ में संग्रहीत नहीं किया गया है Google सर्वर पर -8 प्रारूप?

फ़ाइल UTF-8 में है, लेकिन यह नहीं है एक एन्कोडिंग घोषित करें, इसलिए किसी ब्राउज़र में इसे देखने से डिफ़ॉल्ट HTTP वर्णसेट, आईएसओ -8859-1 मानता है।

मुझे यकीन नहीं है कि आपको वास्तव में एक दूषित प्रति क्यों मिल रहा है (अगर मैं इसे क्रोम में देखता हूं) , यह भ्रष्ट प्रतीत होता है, लेकिन इसे सहेजकर सही यूटीएफ -8-एन्कोड में परिणाम मिलता है एड फ़ाइल), लेकिन शायद आप इसे डाउनलोड करने के लिए एक अन्य तंत्र की कोशिश कर सकते हैं?


Comments

Popular posts from this blog

Member with no value in F# -

java - Joda Time Interval Not returning what I expect -

c# - Showing a SelectedItem's Property -