Is the default ("automatic") ordering for factors a part of the R specification? Alphabetical? Same on all platforms? -


कभी-कभी हम कुछ डेटा x को आर उदाहरण के साथ पढ़ने योग्य , और फिर स्तर (x $ V1) & lt; - c (...) का उपयोग करके इसके स्तर को संशोधित करें। कॉलम मूल रूप से कारकों में आयात किए जाते हैं यदि हम as.is विकल्प का उपयोग नहीं करते हैं और न ही निर्दिष्ट करते हैं colClasses = "character" । हम एक बड़े डेटाफ्रेम के सभी स्तंभों पर एक साथ स्तरों के परिवर्तन को ध्यान में रखते हुए सोच सकते हैं, लेकिन फिर हम यह सुनिश्चित करना चाहते हैं कि ये सभी कॉलम (जो कि हम यहां समान प्रकार के डेटा को सम्मिलित करने के लिए मानते हैं, जैसे समग्र स्तर)

  1. क्या

    1. क्या आर भाषा, तो क्या यह प्लेटफॉर्म स्वतंत्र है?
    2. क्या यह कुछ वर्णानुक्रमिक सॉर्टिंग है, और यदि हां, तो वर्णमाला के अनुसार?

    उदाहरण के लिए देखें:

    <पूर्व> & gt; X = as.factor (c "3", "$$$ av", "1", "2", "^ ab", "^ ba", "3", "aba", "4", " -ब "," बीए ", '3', 'बीए')) & gt; एक्स [1] 3 $ $ $ ए वी 1 2 ^ एबी ^ बीए 3 एबीए 4-बीए बीए 3 बीए स्तर: 1 2 3 4 ^ एबी-एबीएएए $$$ एआर बीए बीए बीए < कारक का कोड देखें:

      अगर ( 

    लापता (स्तर)) {y & lt; - अद्वितीय (x, nmax = nmax) इंडस्ट्रीज़ & lt; - sort.list (y) y & lt; - as.character (y) स्तर & lt; - अद्वितीय (y [ind])}

    जैसा कि आप देख रहे हैं कि सॉर्टिंग को sort.list के साथ किया जाता है। उस फ़ंक्शन के दस्तावेज में आप पाते हैं:

    चरित्र वैक्टर के लिए सॉर्ट क्रम उपयोग में लोकेल के कोटिंग अनुक्रम पर निर्भर करेगा: तुलना करें।

    और सहायता ("तुलना") में आप पढ़ सकते हैं:

    कॉलेशन ऑर्डर के बारे में कोई धारणा बनाने से सावधान रहें: उदा। ऐस्तोनियन्ज़ ज़ में एस और टी के बीच आता है, और जरूरी नहीं कि वर्ण-दर-वर्ण- डेनिश एए में एक पत्र के रूप में, जेड के बाद। वेल्श एनजी में या एक एकल सॉर्टिंग यूनिट नहीं हो सकती है: यदि यह है तो यह जी का अनुसरण करता है कुछ प्लेटफार्म लोकेल का सम्मान नहीं कर सकते हैं और हमेशा एक 8-बिट लोकेल में बाइट्स के संख्यात्मक क्रम में, या यूटीएफ -8 लोकेल के लिए यूनिकोड कोड-बिन्दु क्रम में सॉर्ट कर सकते हैं (और उसी भाषा के लिए उसी क्रम में क्रमबद्ध नहीं हो सकता है अलग चरित्र सेट) गैर-अक्षरों (स्थान, विराम चिह्न, हाइफ़न, अंश और इसी तरह) का सम्मिलन भी अधिक समस्याग्रस्त है।

    इसलिए, यह लोकेल और कुछ हद तक मंच-आधारित पर निर्भर है। / P>


Comments

Popular posts from this blog

sqlite3 - UPDATE a table from the SELECT of another one -

c# - Showing a SelectedItem's Property -

javascript - Render HTML after each iteration in loop -