utf 8 - training file language_id.txt for Google Prediction API unusable -


मैं Google Prediction API का अनुसरण कर रहा हूं।

दुर्भाग्य से प्रशिक्षण फ़ाइल को किसी तरह भ्रष्ट लगता है? मैंने Google क्रोम और फ़ायरफ़ॉक्स का उपयोग करके इसे डाउनलोड करने का परीक्षण किया है, एक ही परिणाम, स्क्रीनशॉट देखें:

छवि विवरण दर्ज करें यहाँ

मुझे लगता है, इसलिए मेरे परीक्षण काम नहीं करते हैं और मैं हमेशा अंग्रेजी 1.0 Muy Bueno उदाहरण स्ट्रिंग के लिए स्कोर के रूप में वापस मिलता है। / P>

  ... {"label": "अंग्रेज़ी", "स्कोर": "1.000000"}, ...  

मुझे कहां से से एक प्रयोग करने योग्य language_id.txt परीक्षण फ़ाइल प्राप्त करें या क्या मैं कुछ भी कर सकता हूं?

संपादित करें : मेरा अनुमान है, फाइल को यूटीएफ में संग्रहीत नहीं किया गया है Google सर्वर पर -8 प्रारूप?

फ़ाइल UTF-8 में है, लेकिन यह नहीं है एक एन्कोडिंग घोषित करें, इसलिए किसी ब्राउज़र में इसे देखने से डिफ़ॉल्ट HTTP वर्णसेट, आईएसओ -8859-1 मानता है।

मुझे यकीन नहीं है कि आपको वास्तव में एक दूषित प्रति क्यों मिल रहा है (अगर मैं इसे क्रोम में देखता हूं) , यह भ्रष्ट प्रतीत होता है, लेकिन इसे सहेजकर सही यूटीएफ -8-एन्कोड में परिणाम मिलता है एड फ़ाइल), लेकिन शायद आप इसे डाउनलोड करने के लिए एक अन्य तंत्र की कोशिश कर सकते हैं?


Comments

Popular posts from this blog

sqlite3 - UPDATE a table from the SELECT of another one -

c# - Showing a SelectedItem's Property -

javascript - Render HTML after each iteration in loop -