<div dir="ltr"><div class="gmail_extra">Hi Thomas, thanks for all your work in trying to analyze this problem, it seems it is at least partly in vain, though. I just figured out the problem affects only the summary command (describe, table, levels - all print fine). But below I also did quite a lot of work (before I figured the problem out), may be also in vain, but maybe some of it you will find interesting/useful.<br><br></div><div class="gmail_extra">I did not manage to figure out why the summary program prints it wrong in Rkward. As I said before, it does print correctly in the plain rgui.exe console. <br></div><div class="gmail_extra"><br></div><div class="gmail_extra">Sincerely<br><br></div><div class="gmail_extra">Donatas<br></div><div class="gmail_extra"><div class="gmail_quote"><br>2014-11-10 18:39 GMT+02:00 Thomas Friedrichsmeier <span dir="ltr"><<a href="mailto:thomas.friedrichsmeier@ruhr-uni-bochum.de" target="_blank">thomas.friedrichsmeier@ruhr-uni-bochum.de</a>></span>:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><br>
<br>
I now tried in Windows 7, setting Lithunian localization. I get the same code<br>
pages from Sys.getlocale(). Interestingly, when I try to enter any special<br>
chars, R just strips them off:<br>
<br>
> "Stačiatikių"<br>
[1] "Staciatikiu"<br></blockquote><div></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
Same when entering in the data editor. They appear correctly on typing, but in<br>
R, only a stripped version is stored. Obviously that's not so great, but it's<br>
not the symptoms you're seeing, either. And, importantly, a plain R console<br>
does not even allow me to enter the special chars. They get stripped to the<br>
nearest ascii character while I'm typing.<br></blockquote><div><br></div><div>In my case I can enter the secials characters both in Rkward console and in R console (rgui.exe) fine. I am also on Windows 7, btw. I can also create a data frame, enter special characters, and, surprise!, I they get printed correctly in Rkward console!<br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
So follow-up question: How did you get those data into R in the first place?<br></blockquote><div><br></div><div>Imported those from an spss file. The file, apparently, had an encoding Windows-1257 (or maybe ISO-8859-13, which for most purposes is the same). I could import it in Windows without specifying the import encoding - and it displayed Lithuanian characters fine. But when I tried to do that in Linux (Kubuntu 14.04, RKward 6.2) I had to specify the encoding ISO-8859-13, otherwise the special characters were left out. <br><br></div><div>Here is the import code: <br><br>local({<br>## Prepare<br>require (foreign)<br>## Compute<br>data <- read.spss ("C:/Users/D.Glodenis/Programos/RKWard/workspaces/tm2007+nrtic2014/2014/Religija 2014 03.sav", to.data.frame=TRUE, max.value.labels=1000000)<br><br># set variable labels for use in RKWard<br>labels <- attr (data, "variable.labels");<br>if (!is.null (labels)) {<br>    for (i in 1:length (labels)) {<br>        col <- make.names (names (labels[i]))<br>        if (!is.null (col)) {<br>            rk.set.label (data[[col]], labels[i])<br>        }<br>    }<br>}<br><br>.GlobalEnv$DATA14 <- data        # assign to globalenv()<br>rk.edit (.GlobalEnv$DATA14)<br>## Print result<br>rk.header("Import SPSS data", parameters=list("File", "C:/Users/D.Glodenis/Programos/RKWard/workspaces/tm2007+nrtic2014/2014/Religija 2014 03.sav",<br>    "Import as", "DATA14"))<br>})<br><br></div><div>I changed the import encoding to "ISO8859-13", and it changed nothing. </div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
What does<br>
  Encoding (DATA14$R02)<br>
(or)<br>
  Encoding (levels (DATA$R02))<br>
print?<br></blockquote><div><br></div><div>It is messy! another thing I noticed is, that the problem only appears with one command - summary!:<br><br>> summary(DATA14$R02)<br>            ˙žKatalikų˙ž          ˙žStaĨiatikių˙ž             ˙žSentikių˙ž <br>                 752                   24                    7 <br>...<br></div><div>This is garbage as before. But look at this!<br></div><div><br>> levels(DATA14$R02)<br> [1] "Katalikų"             "Stačiatikių"          "Sentikių"            <br>.....      <br><br></div><div>Now, Encodings:<br></div><div><br>> Encoding (levels (DATA14$R02))<br> [1] "unknown" "unknown" "unknown" "unknown" "unknown" "unknown" "unknown"<br></div><div> [8] "unknown" "unknown" "unknown" "unknown" "unknown"<br><br></div><div>I ran<br></div><div><br>> Encoding (levels (DATA14$R02))<-"ISO8859-13"<br></div><div>## encoding not changed, still "unknown", same garbage in summary() output<br>and:<br></div><div><br></div>> Encoding (levels (DATA14$R02))<-"UTF-8"<br><br>> Encoding (levels(DATA14$R02))<br> [1] "UTF-8"   "UTF-8"   "UTF-8"   "UTF-8"   "UTF-8"   "UTF-8"   "UTF-8"  <br> [8] "unknown" "UTF-8"   "UTF-8"   "UTF-8"   "UTF-8"  <br><br>> levels(DATA14$R02)<br> [1] "˙žKatalik\xf8˙ž"                "˙žSta\xe8iatiki\xf8˙ž"         <br> [3] "˙žSentiki\xf8˙ž"                "˙žEvangelik\xf8 liuteron\xf8˙ž"<br> [5] "˙žEvangelik\xf8 reformat\xf8˙ž" "˙žJud\xebj\xf8˙ž"              <br> [7] "˙žMusulmon\xf8˙ž"               "Kita "                     <br> [9] "˙žNeatsak\xeb˙ž"                "˙žJehovos liudytoj\xf8˙ž"      <br>[11] "˙žBaptist\xf8˙ž"                "˙žPagoni\xf8˙ž"   <br><br><div>> summary(DATA14$R02)<br>               ˙žKatalik\xf8˙ž          ˙žSta\xe8iatiki\xf8˙ž <br>                       752                         24 <br>               ˙žSentiki\xf8˙ž ˙žEvangelik\xf8 liuteron\xf8˙ž <br><br></div><div>- this is similar, but not identical, garbage as before<br></div><div><br></div><div>Changing encoding back (that is, using just any random string) turns the data back into the previous form. <br></div><div><br>> Encoding (levels(DATA14$R02))<-"sdšsdš"<br><br><br><div>I did another experiment. Created an empty data 
frame "test", changed first column var data type to string. Proceeded 
like this: <br><br>> test$var<-c("ąžerty","zūcvęfčm","wįpųlkjėų")<br>> Encoding(test$var)<br>[1] "unknown" "unknown" "unknown"<br>> Encoding(test$var)<- "ISO8859-13"<br></div><div>## I took the string ISO8859-13 from the code of spss import dialog<br></div><div>> Encoding(test$var)<br>[1] "unknown" "unknown" "unknown"<br></div><div>## strange, the iso encoding setting does not work; I also tried "ISO885913" and "ISO-8859-13", "CP1257", "WINDOWS-1257" - no luck<br></div><div>> test$var<br>[1] "ąžerty"    "zūcvęfčm"  "wįpųlkjėų"<br>> Encoding(test$var)<- "UTF-8"<br>> test$var<br>[1] "˙ž\xe0\xfeerty˙ž"          "˙žz\xfbcv\xe6f\xe8m˙ž"     "˙žw\xe1p\xf8lkj\xeb\xf8˙ž"<br>> Encoding(test$var)<br>[1] "UTF-8" "UTF-8" "UTF-8"<br></div><div># changing to UTF8 does work! also "latin1" works.<br></div><br><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
Another interesting bit is that I have absolutely no problem entering and<br>
showing German or French special chars in RKWard (but the R console does not<br>
allow me to enter them, either).<br></blockquote><div><br><br>> What does<br>>> options("encoding")<br>
> print?<br><br>> options("encoding")<br>$encoding<br>[1] "native.enc"<br></div></div><br></div></div>