utf 8 - training file language_id.txt for Google Prediction API unusable -
मैं Google Prediction API का अनुसरण कर रहा हूं।
दुर्भाग्य से प्रशिक्षण फ़ाइल को किसी तरह भ्रष्ट लगता है? मैंने Google क्रोम और फ़ायरफ़ॉक्स का उपयोग करके इसे डाउनलोड करने का परीक्षण किया है, एक ही परिणाम, स्क्रीनशॉट देखें:
मुझे लगता है, इसलिए मेरे परीक्षण काम नहीं करते हैं और मैं हमेशा अंग्रेजी 1.0
Muy Bueno
उदाहरण स्ट्रिंग के लिए स्कोर के रूप में वापस मिलता है। / P>
... {"label": "अंग्रेज़ी", "स्कोर": "1.000000"}, ...
मुझे कहां से से एक प्रयोग करने योग्य language_id.txt परीक्षण फ़ाइल प्राप्त करें या क्या मैं कुछ भी कर सकता हूं?
संपादित करें : मेरा अनुमान है, फाइल को यूटीएफ में संग्रहीत नहीं किया गया है Google सर्वर पर -8 प्रारूप?
फ़ाइल UTF-8 में है, लेकिन यह नहीं है एक एन्कोडिंग घोषित करें, इसलिए किसी ब्राउज़र में इसे देखने से डिफ़ॉल्ट HTTP वर्णसेट, आईएसओ -8859-1 मानता है।
मुझे यकीन नहीं है कि आपको वास्तव में एक दूषित प्रति क्यों मिल रहा है (अगर मैं इसे क्रोम में देखता हूं) , यह भ्रष्ट प्रतीत होता है, लेकिन इसे सहेजकर सही यूटीएफ -8-एन्कोड में परिणाम मिलता है एड फ़ाइल), लेकिन शायद आप इसे डाउनलोड करने के लिए एक अन्य तंत्र की कोशिश कर सकते हैं?
Comments
Post a Comment