Is the default ("automatic") ordering for factors a part of the R specification? Alphabetical? Same on all platforms? -
कभी-कभी हम कुछ डेटा x
को आर उदाहरण के साथ पढ़ने योग्य
, और फिर स्तर (x $ V1) & lt; - c (...)
का उपयोग करके इसके स्तर को संशोधित करें। कॉलम मूल रूप से कारकों में आयात किए जाते हैं यदि हम as.is
विकल्प का उपयोग नहीं करते हैं और न ही निर्दिष्ट करते हैं colClasses = "character"
। हम एक बड़े डेटाफ्रेम के सभी स्तंभों पर एक साथ स्तरों के परिवर्तन को ध्यान में रखते हुए सोच सकते हैं, लेकिन फिर हम यह सुनिश्चित करना चाहते हैं कि ये सभी कॉलम (जो कि हम यहां समान प्रकार के डेटा को सम्मिलित करने के लिए मानते हैं, जैसे समग्र स्तर)
- क्या
-
- क्या आर भाषा, तो क्या यह प्लेटफॉर्म स्वतंत्र है?
- क्या यह कुछ वर्णानुक्रमिक सॉर्टिंग है, और यदि हां, तो वर्णमाला के अनुसार?
उदाहरण के लिए देखें:
<पूर्व>& gt; X = as.factor (c "3", "$$$ av", "1", "2", "^ ab", "^ ba", "3", "aba", "4", " -ब "," बीए ", '3', 'बीए')) & gt; एक्स [1] 3 $ $ $ ए वी 1 2 ^ एबी ^ बीए 3 एबीए 4-बीए बीए 3 बीए स्तर: 1 2 3 4 ^ एबी-एबीएएए $$$ एआर बीए बीए बीए <
कारक
का कोड देखें:अगर (
लापता (स्तर)) {y & lt; - अद्वितीय (x, nmax = nmax) इंडस्ट्रीज़ & lt; - sort.list (y) y & lt; - as.character (y) स्तर & lt; - अद्वितीय (y [ind])}
जैसा कि आप देख रहे हैं कि सॉर्टिंग को
sort.list
के साथ किया जाता है। उस फ़ंक्शन के दस्तावेज में आप पाते हैं:चरित्र वैक्टर के लिए सॉर्ट क्रम उपयोग में लोकेल के कोटिंग अनुक्रम पर निर्भर करेगा: तुलना करें।
और
सहायता ("तुलना") में
आप पढ़ सकते हैं:कॉलेशन ऑर्डर के बारे में कोई धारणा बनाने से सावधान रहें: उदा। ऐस्तोनियन्ज़ ज़ में एस और टी के बीच आता है, और जरूरी नहीं कि वर्ण-दर-वर्ण- डेनिश एए में एक पत्र के रूप में, जेड के बाद। वेल्श एनजी में या एक एकल सॉर्टिंग यूनिट नहीं हो सकती है: यदि यह है तो यह जी का अनुसरण करता है कुछ प्लेटफार्म लोकेल का सम्मान नहीं कर सकते हैं और हमेशा एक 8-बिट लोकेल में बाइट्स के संख्यात्मक क्रम में, या यूटीएफ -8 लोकेल के लिए यूनिकोड कोड-बिन्दु क्रम में सॉर्ट कर सकते हैं (और उसी भाषा के लिए उसी क्रम में क्रमबद्ध नहीं हो सकता है अलग चरित्र सेट) गैर-अक्षरों (स्थान, विराम चिह्न, हाइफ़न, अंश और इसी तरह) का सम्मिलन भी अधिक समस्याग्रस्त है।
इसलिए, यह लोकेल और कुछ हद तक मंच-आधारित पर निर्भर है। / P>
Comments
Post a Comment