Is the default ("automatic") ordering for factors a part of the R specification? Alphabetical? Same on all platforms? -


कभी-कभी हम कुछ डेटा x को आर उदाहरण के साथ पढ़ने योग्य , और फिर स्तर (x $ V1) & lt; - c (...) का उपयोग करके इसके स्तर को संशोधित करें। कॉलम मूल रूप से कारकों में आयात किए जाते हैं यदि हम as.is विकल्प का उपयोग नहीं करते हैं और न ही निर्दिष्ट करते हैं colClasses = "character" । हम एक बड़े डेटाफ्रेम के सभी स्तंभों पर एक साथ स्तरों के परिवर्तन को ध्यान में रखते हुए सोच सकते हैं, लेकिन फिर हम यह सुनिश्चित करना चाहते हैं कि ये सभी कॉलम (जो कि हम यहां समान प्रकार के डेटा को सम्मिलित करने के लिए मानते हैं, जैसे समग्र स्तर)

  1. क्या

    1. क्या आर भाषा, तो क्या यह प्लेटफॉर्म स्वतंत्र है?
    2. क्या यह कुछ वर्णानुक्रमिक सॉर्टिंग है, और यदि हां, तो वर्णमाला के अनुसार?

    उदाहरण के लिए देखें:

    <पूर्व> & gt; X = as.factor (c "3", "$$$ av", "1", "2", "^ ab", "^ ba", "3", "aba", "4", " -ब "," बीए ", '3', 'बीए')) & gt; एक्स [1] 3 $ $ $ ए वी 1 2 ^ एबी ^ बीए 3 एबीए 4-बीए बीए 3 बीए स्तर: 1 2 3 4 ^ एबी-एबीएएए $$$ एआर बीए बीए बीए < कारक का कोड देखें:

      अगर ( 

    लापता (स्तर)) {y & lt; - अद्वितीय (x, nmax = nmax) इंडस्ट्रीज़ & lt; - sort.list (y) y & lt; - as.character (y) स्तर & lt; - अद्वितीय (y [ind])}

    जैसा कि आप देख रहे हैं कि सॉर्टिंग को sort.list के साथ किया जाता है। उस फ़ंक्शन के दस्तावेज में आप पाते हैं:

    चरित्र वैक्टर के लिए सॉर्ट क्रम उपयोग में लोकेल के कोटिंग अनुक्रम पर निर्भर करेगा: तुलना करें।

    और सहायता ("तुलना") में आप पढ़ सकते हैं:

    कॉलेशन ऑर्डर के बारे में कोई धारणा बनाने से सावधान रहें: उदा। ऐस्तोनियन्ज़ ज़ में एस और टी के बीच आता है, और जरूरी नहीं कि वर्ण-दर-वर्ण- डेनिश एए में एक पत्र के रूप में, जेड के बाद। वेल्श एनजी में या एक एकल सॉर्टिंग यूनिट नहीं हो सकती है: यदि यह है तो यह जी का अनुसरण करता है कुछ प्लेटफार्म लोकेल का सम्मान नहीं कर सकते हैं और हमेशा एक 8-बिट लोकेल में बाइट्स के संख्यात्मक क्रम में, या यूटीएफ -8 लोकेल के लिए यूनिकोड कोड-बिन्दु क्रम में सॉर्ट कर सकते हैं (और उसी भाषा के लिए उसी क्रम में क्रमबद्ध नहीं हो सकता है अलग चरित्र सेट) गैर-अक्षरों (स्थान, विराम चिह्न, हाइफ़न, अंश और इसी तरह) का सम्मिलन भी अधिक समस्याग्रस्त है।

    इसलिए, यह लोकेल और कुछ हद तक मंच-आधारित पर निर्भर है। / P>


Comments

Popular posts from this blog

php - Select box validation (in laravel) -

html - Tabindex not working for button -

pandas - Iterate on Groupby Object's fields -