Is the default ("automatic") ordering for factors a part of the R specification? Alphabetical? Same on all platforms? -


कभी-कभी हम कुछ डेटा x को आर उदाहरण के साथ पढ़ने योग्य , और फिर स्तर (x $ V1) & lt; - c (...) का उपयोग करके इसके स्तर को संशोधित करें। कॉलम मूल रूप से कारकों में आयात किए जाते हैं यदि हम as.is विकल्प का उपयोग नहीं करते हैं और न ही निर्दिष्ट करते हैं colClasses = "character" । हम एक बड़े डेटाफ्रेम के सभी स्तंभों पर एक साथ स्तरों के परिवर्तन को ध्यान में रखते हुए सोच सकते हैं, लेकिन फिर हम यह सुनिश्चित करना चाहते हैं कि ये सभी कॉलम (जो कि हम यहां समान प्रकार के डेटा को सम्मिलित करने के लिए मानते हैं, जैसे समग्र स्तर)

  1. क्या

    1. क्या आर भाषा, तो क्या यह प्लेटफॉर्म स्वतंत्र है?
    2. क्या यह कुछ वर्णानुक्रमिक सॉर्टिंग है, और यदि हां, तो वर्णमाला के अनुसार?

    उदाहरण के लिए देखें:

    <पूर्व> & gt; X = as.factor (c "3", "$$$ av", "1", "2", "^ ab", "^ ba", "3", "aba", "4", " -ब "," बीए ", '3', 'बीए')) & gt; एक्स [1] 3 $ $ $ ए वी 1 2 ^ एबी ^ बीए 3 एबीए 4-बीए बीए 3 बीए स्तर: 1 2 3 4 ^ एबी-एबीएएए $$$ एआर बीए बीए बीए < कारक का कोड देखें:

      अगर ( 

    लापता (स्तर)) {y & lt; - अद्वितीय (x, nmax = nmax) इंडस्ट्रीज़ & lt; - sort.list (y) y & lt; - as.character (y) स्तर & lt; - अद्वितीय (y [ind])}

    जैसा कि आप देख रहे हैं कि सॉर्टिंग को sort.list के साथ किया जाता है। उस फ़ंक्शन के दस्तावेज में आप पाते हैं:

    चरित्र वैक्टर के लिए सॉर्ट क्रम उपयोग में लोकेल के कोटिंग अनुक्रम पर निर्भर करेगा: तुलना करें।

    और सहायता ("तुलना") में आप पढ़ सकते हैं:

    कॉलेशन ऑर्डर के बारे में कोई धारणा बनाने से सावधान रहें: उदा। ऐस्तोनियन्ज़ ज़ में एस और टी के बीच आता है, और जरूरी नहीं कि वर्ण-दर-वर्ण- डेनिश एए में एक पत्र के रूप में, जेड के बाद। वेल्श एनजी में या एक एकल सॉर्टिंग यूनिट नहीं हो सकती है: यदि यह है तो यह जी का अनुसरण करता है कुछ प्लेटफार्म लोकेल का सम्मान नहीं कर सकते हैं और हमेशा एक 8-बिट लोकेल में बाइट्स के संख्यात्मक क्रम में, या यूटीएफ -8 लोकेल के लिए यूनिकोड कोड-बिन्दु क्रम में सॉर्ट कर सकते हैं (और उसी भाषा के लिए उसी क्रम में क्रमबद्ध नहीं हो सकता है अलग चरित्र सेट) गैर-अक्षरों (स्थान, विराम चिह्न, हाइफ़न, अंश और इसी तरह) का सम्मिलन भी अधिक समस्याग्रस्त है।

    इसलिए, यह लोकेल और कुछ हद तक मंच-आधारित पर निर्भर है। / P>


Comments

Popular posts from this blog

php - Select box validation (in laravel) -

pandas - Iterate on Groupby Object's fields -

javascript - Render HTML after each iteration in loop -