Is the default ("automatic") ordering for factors a part of the R specification? Alphabetical? Same on all platforms? -


कभी-कभी हम कुछ डेटा x को आर उदाहरण के साथ पढ़ने योग्य , और फिर स्तर (x $ V1) & lt; - c (...) का उपयोग करके इसके स्तर को संशोधित करें। कॉलम मूल रूप से कारकों में आयात किए जाते हैं यदि हम as.is विकल्प का उपयोग नहीं करते हैं और न ही निर्दिष्ट करते हैं colClasses = "character" । हम एक बड़े डेटाफ्रेम के सभी स्तंभों पर एक साथ स्तरों के परिवर्तन को ध्यान में रखते हुए सोच सकते हैं, लेकिन फिर हम यह सुनिश्चित करना चाहते हैं कि ये सभी कॉलम (जो कि हम यहां समान प्रकार के डेटा को सम्मिलित करने के लिए मानते हैं, जैसे समग्र स्तर)

  1. क्या

    1. क्या आर भाषा, तो क्या यह प्लेटफॉर्म स्वतंत्र है?
    2. क्या यह कुछ वर्णानुक्रमिक सॉर्टिंग है, और यदि हां, तो वर्णमाला के अनुसार?

    उदाहरण के लिए देखें:

    <पूर्व> & gt; X = as.factor (c "3", "$$$ av", "1", "2", "^ ab", "^ ba", "3", "aba", "4", " -ब "," बीए ", '3', 'बीए')) & gt; एक्स [1] 3 $ $ $ ए वी 1 2 ^ एबी ^ बीए 3 एबीए 4-बीए बीए 3 बीए स्तर: 1 2 3 4 ^ एबी-एबीएएए $$$ एआर बीए बीए बीए < कारक का कोड देखें:

      अगर ( 

    लापता (स्तर)) {y & lt; - अद्वितीय (x, nmax = nmax) इंडस्ट्रीज़ & lt; - sort.list (y) y & lt; - as.character (y) स्तर & lt; - अद्वितीय (y [ind])}

    जैसा कि आप देख रहे हैं कि सॉर्टिंग को sort.list के साथ किया जाता है। उस फ़ंक्शन के दस्तावेज में आप पाते हैं:

    चरित्र वैक्टर के लिए सॉर्ट क्रम उपयोग में लोकेल के कोटिंग अनुक्रम पर निर्भर करेगा: तुलना करें।

    और सहायता ("तुलना") में आप पढ़ सकते हैं:

    कॉलेशन ऑर्डर के बारे में कोई धारणा बनाने से सावधान रहें: उदा। ऐस्तोनियन्ज़ ज़ में एस और टी के बीच आता है, और जरूरी नहीं कि वर्ण-दर-वर्ण- डेनिश एए में एक पत्र के रूप में, जेड के बाद। वेल्श एनजी में या एक एकल सॉर्टिंग यूनिट नहीं हो सकती है: यदि यह है तो यह जी का अनुसरण करता है कुछ प्लेटफार्म लोकेल का सम्मान नहीं कर सकते हैं और हमेशा एक 8-बिट लोकेल में बाइट्स के संख्यात्मक क्रम में, या यूटीएफ -8 लोकेल के लिए यूनिकोड कोड-बिन्दु क्रम में सॉर्ट कर सकते हैं (और उसी भाषा के लिए उसी क्रम में क्रमबद्ध नहीं हो सकता है अलग चरित्र सेट) गैर-अक्षरों (स्थान, विराम चिह्न, हाइफ़न, अंश और इसी तरह) का सम्मिलन भी अधिक समस्याग्रस्त है।

    इसलिए, यह लोकेल और कुछ हद तक मंच-आधारित पर निर्भर है। / P>


Comments

Popular posts from this blog

php - Select box validation (in laravel) -

java - Joda Time Interval Not returning what I expect -

html - Tabindex not working for button -