Unicode literals in Visual C++ -

निम्न कोड पर विचार करें:

  #include & lt; स्ट्रिंग & gt; # शामिल करें & lt; fstream & gt; # शामिल करें & lt; iomanip & gt; Int main () {std :: string s = "\ xe2 \ x82 \ xac \ u20ac"; Std :: ऑफस्ट्रीम आउट ("test.txt"); बाहर & lt; & lt; S.length () & lt; & lt; ":" & Lt; & lt; S & lt; & lt; std :: endl; बाहर & lt; & lt; std :: endl; out.close (); }

लिनक्स पर जीसीसी 4.8 के तहत (उबंटु 14.04), फ़ाइल test.txt इसमें शामिल है:

  6: € €

विंडोज के अंतर्गत दृश्य सी ++ 2013 में, इसमें यह शामिल है:

  4: € \ x80

( '\ X80' का मतलब है कि एक 8-बिट वर्ण 0x80)।

मैं या तो कंपाइलर को € को std का उपयोग करके आउटपुट करने में असमर्थ हूँ :: wstring ।

दो प्रश्न:

माइक्रोसॉफ्ट कंपाइलर को लगता है कि यह char * के साथ क्या कर रहा है? स्पष्ट रूप से यह सांकेतिक शब्दों में बदलना करने के लिए कुछ कर रहा है, लेकिन जो स्पष्ट नहीं है।
std :: wstring और std :: का उपयोग करके उपरोक्त कोड को फिर से लिखने का सही तरीका क्या है Wofstream ताकि वह दो € वर्णों को आउटपुट कर सके?

इसका कारण यह है कि आप \ u20ac का प्रयोग कर रहे हैं जो कि एक एएससीआईआई स्ट्रिंग में यूनिकोड अक्षर है।

एमएसवीसी एनकोड "\ xe2 \ x82 \ xac \ u20ac " जैसा 0xe2, 0x82, 0xac, 0x80, जैसा कि 4 संकीर्ण वर्ण हैं I यह अनिवार्य रूप से \ u20ac को 0x80 के रूप में एन्कोड करता है क्योंकि यह मानक के लिए यूरो वर्ण को मैप किया गया है

जीसीसी यूनिकोड की शाब्दिक / u20ac को 3-बाइट में कनवर्ट कर रहा है UTF-8 अनुक्रम 0xe2, 0x82, 0xac इसलिए परिणामी स्ट्रिंग को 0xe2, 0x82, 0xac, 0xe2, 0x82, 0xac के रूप में समाप्त होता है।

यदि आप std :: wstring = L "\ xe2 \ x82 \ xac \ u20ac" का उपयोग करते हैं, इसे एमएसवीसी द्वारा 0xe2, 0x00, 0x82, 0x00, 0xac, 0x00, 0xac, 0x20 < / कोड> 4 चौड़े वर्ण हैं, लेकिन जब आप एक यूटीएफ -8 को यूटीएफ -16 के साथ हाथ से बनाते हैं, तो परिणामस्वरूप स्ट्रिंग ज्यादा मायने नहीं रखती। यदि आप std :: wstring = L "\ u20ac \ u20ac" का उपयोग करते हैं, तो आप अपेक्षा करते हुए विस्तृत-स्ट्रिंग में 2 यूनिकोड वर्ण प्राप्त करते हैं।

  अगली समस्या है कि एमएसवीसी की ऑफस्ट्रीम और वोफस्ट्रीम हमेशा एएनएसआई / एएससीआईआई में लिखते हैं। इसे यूटीएफ -8 में लिखने के लिए आपको  & lt; codecvt & gt;  (वीएस 2010 या बाद के संस्करण) का उपयोग करना चाहिए: 
   #include & lt; स्ट्रिंग & gt; # शामिल करें & lt; fstream & gt; # शामिल करें & lt; iomanip & gt; # शामिल करें & lt; codecvt & gt; Int main () {std :: wstring s = L "\ u20ac \ u20ac"; Std :: wofstream आउट ("test.txt"); Std :: लोकेल लोकल (std :: locale :: क्लासिक (), नया std :: codecvt_utf8 & lt; wchar_t & gt;); out.imbue (loc); बाहर & lt; & lt; S.length () & lt; & lt; एल ":" & lt; & lt; S & lt; & lt; std :: endl; बाहर & lt; & lt; std :: endl; out.close (); }  
  और UTF-16 (या अधिक विशेष रूप से यूटीएफ -16LE) लिखना: 
   #include & lt; स्ट्रिंग & gt; # शामिल करें & lt; fstream & gt; # शामिल करें & lt; iomanip & gt; # शामिल करें & lt; codecvt & gt; Int main () {std :: wstring s = L "\ u20ac \ u20ac"; Std :: wofstream आउट ("test.txt", std :: ios :: द्विआधारी); Std :: locale loc (std :: locale :: क्लासिक (), नया std :: codecvt_utf16 & lt; wchar_t, 0x10ffff, std :: little_endian & gt;); out.imbue (loc); बाहर & lt; & lt; S.length () & lt; & lt; एल ":" & lt; & lt; S & lt; & lt; एल "\ r \ n"; बाहर & lt; & lt; एल "\ r \ n"; out.close (); }  
  नोट: UTF-16 के साथ आपको भ्रष्टाचार से बचने के लिए टेक्स्ट मोड की बजाय एक बाइनरी मोड का उपयोग करना है, इसलिए हम  std :: endl  और सही एंड-लाइन-टेक्स्ट फ़ाइल व्यवहार प्राप्त करने के लिए  L "\ r \ n"  का उपयोग करना होगा।






-



02:22


















Get link





Facebook





X





Pinterest





Email





Other Apps




Comments





Post a Comment



Popular posts from this blog




php - Select box validation (in laravel) -



    I have a text that includes text input and selection box. I was trying to apply Laravel validation. I now want to retain user input values if the verification does not succeed.   I'm able to get it on the input box, but not on the selection box.   This is my code    {{form :: select ('vehicles_year'), how the first selected value (in the selection box) will show. $ Model year, '-1', ['id' = & gt; 'Vehicles_year'])}} & lt; Span class = "help-block" id = "vehicles_year_error" & gt; @if ($ errors-> ('vehicles_year')) {{$ errors- & gt; First ('vehicles_year')}} @endif & lt; / Span & gt;    -1 I am the default value key when I am showing the form load.      What I do is that I add the "default" option which is "nothing" Is set to. In the validity rules, I say this value is necessary. If the user does not choose any of the other options, the verification fails.    $ op...





Read more





pandas - Iterate on Groupby Object's fields -



    I want to be able to iterate over a group object:    grouped = Df Groupby ('zzz') question_list = [a, b, c]    How do I get a list of values for:    grouped .grouped.b grouped.c    but using a for-loop?      You can either remove such a key    print Df Groupby ('zzz'). Groups.keys ()    To capture the grouped. You can do this ...    print df.groupby ('Zzz') group ['A']    or you can open the key, For this type of group    key, in df.groupby group ('Zzz'): print key # group key     Is a dataframe related to  





Read more





java - Joda Time Interval Not returning what I expect -



    मेरे पास निम्न प्रोग्राम है    import java.util। *; Import java.text। *; आयात करें org.joda.time। *; सार्वजनिक श्रेणी के स्कोप कंट्रोल {सार्वजनिक स्थिर अंतराल मिलनसार () {दिनांक समय currDate = नया दिनांक समय (2008, 4, 4, 15, 30, 0, 0); दिनांक समय epochDate = नया दिनांकटाइम (2000, 1, 1, 12, 0, 0, 0); अंतराल अंतराल = नया अंतराल (युरोप डेट, करोडेट); वापसी अंतराल; } सार्वजनिक स्थिर शून्य मुख्य (स्ट्रिंग [] आर्ग्स) {डबल दिनबात = मिलते समय ()। ToDurationMillis () / 1000/60/60/24; StdOut.println (daysBtween); }}    मुझे आउटपुट मिल रहा है: 3016.0   लेकिन जो मैं देख रहा हूं वह है: 3016.1458333333   मैं क्या कर रहा हूँ ?      toDurationMillis एक लंबा लौटा देता है, और प्रत्येक प्रभाग को int के रूप में घोषित किया जाता है। जावा इस प्रकार इनट्स को लॉन्ग में परिवर्तित कर देगा और डिवीजन को लंबे समय तक लौटाना होगा। परिणाम को अंत में दोहरे रूप में परिवर्तित करना। डबल्स का उपयोग करके अभिव्यक्ति करने के लिए जावा को बताने के लिए, अभिव्यक्ति के किसी भी घटक को दोहरे रूप में घोषित करें। उदाहरण के लिए:    ...





Read more

Search This Blog

Alcantara

Unicode literals in Visual C++ -

Comments

Post a Comment

Popular posts from this blog

php - Select box validation (in laravel) -

pandas - Iterate on Groupby Object's fields -

java - Joda Time Interval Not returning what I expect -