<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40"><head><meta http-equiv=Content-Type content="text/html; charset=windows-1255"><meta name=Generator content="Microsoft Word 14 (filtered medium)"><style><!--
/* Font Definitions */
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
pre
        {mso-style-priority:99;
        mso-style-link:"HTML Preformatted Char";
        margin:0cm;
        margin-bottom:.0001pt;
        font-size:10.0pt;
        font-family:"Courier New";}
span.EmailStyle17
        {mso-style-type:personal-reply;
        font-family:"Calibri","sans-serif";
        color:#1F497D;}
span.HTMLPreformattedChar
        {mso-style-name:"HTML Preformatted Char";
        mso-style-priority:99;
        mso-style-link:"HTML Preformatted";
        font-family:"Courier New";}
span.synstatement
        {mso-style-name:synstatement;}
span.synconstant
        {mso-style-name:synconstant;}
.MsoChpDefault
        {mso-style-type:export-only;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]--></head><body lang=EN-US link=blue vlink=purple><div class=WordSection1><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>The now-accepted usage of ‘open’ is to use the three-argument form of it. And there you specify the file’s encoding:<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Courier New"'>      open my $fh, &quot;&lt;:encoding(utf8)&quot;, $file_name;<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'> You can also use a pragma to specify that ALL files open statements will  use a given encoding by default as in:<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Courier New"'>        use open ':encoding(iso-8859-1)';<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>But it should be used carefully, see <a href="https://www.socialtext.net/perl5/the_utf8_perlio_layer">https://www.socialtext.net/perl5/the_utf8_perlio_layer</a> . The writer strongly suggests to use it together with ‘ :encoding(utf8)’ for extra validation of the input.<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>Also, if you emit Unicode characters to a file handle, say STDOUT, you are going to see warnings such as “Wide Character in print”. This is because the handle expects just one-Byte characters (e.g., Latin-1). To avoid this you can use the binmode operator on filehandles such as:<o:p></o:p></span></p><p class=MsoNormal style='text-indent:36.0pt'><span style='font-size:10.0pt;font-family:"Courier New"'>binmode(STDOUT, &quot;:utf8&quot;);<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>There are millions of books, articles, blogs and FAQs about perl and Unicode lurking on the net. One not too shabby is</span><span style='font-size:10.0pt;font-family:"Courier New"'> <a href="http://perlgeek.de/en/article/encodings-and-unicode">http://perlgeek.de/en/article/encodings-and-unicode</a> </span><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>and the links there.<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>Happy Perling…<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>Meir                                                                                   <o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span></p><p class=MsoNormal style='margin-left:36.0pt'><b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'>From:</span></b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'> perl-bounces@perl.org.il [mailto:perl-bounces@perl.org.il] <b>On Behalf Of </b>sawyer x<br><b>Sent:</b> </span><span lang=HE dir=RTL style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'>éåí</span><span dir=LTR></span><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'><span dir=LTR></span>&nbsp;</span><span lang=HE dir=RTL style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'>å</span><span dir=LTR></span><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'><span dir=LTR></span> 28 </span><span lang=HE dir=RTL style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'>ãöîáø</span><span dir=LTR></span><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'><span dir=LTR></span> 2012 10:20<br><b>To:</b> Perl in Israel<br><b>Subject:</b> Re: [Israel.pm] use utf8 and hebrew from file<o:p></o:p></span></p><p class=MsoNormal style='margin-left:36.0pt'><o:p>&nbsp;</o:p></p><div><p class=MsoNormal style='mso-margin-top-alt:0cm;margin-right:0cm;margin-bottom:12.0pt;margin-left:36.0pt'>&quot;use utf8;&quot; basically means &quot;I have UTF8 characters in my source code. This is useful if, for example, you define a string in the script with Hebrew characters. You're basically telling perl to read your source code file as UTF8 characters.<o:p></o:p></p><div><p class=MsoNormal style='margin-left:36.0pt'>On Fri, Dec 28, 2012 at 2:52 AM, Shmuel Fomberg &lt;<a href="mailto:shmuelfomberg@gmail.com" target="_blank">shmuelfomberg@gmail.com</a>&gt; wrote:<o:p></o:p></p><div><p class=MsoNormal style='margin-left:36.0pt'>Hi Moshe.<o:p></o:p></p><div><p class=MsoNormal style='margin-left:36.0pt'><o:p>&nbsp;</o:p></p></div><div><p class=MsoNormal style='margin-left:36.0pt'>It is not clear to me what is 'get them', and 'move it out'.<o:p></o:p></p></div><div><p class=MsoNormal style='margin-left:36.0pt'>But generally, when processing utf8 file, use &quot;:utf8&quot; in the open command. declaring &quot;use utf8;&quot; won't have any effect on reading your files.<o:p></o:p></p></div><div><p class=MsoNormal style='margin-left:36.0pt'><o:p>&nbsp;</o:p></p></div><div><p class=MsoNormal style='margin-left:36.0pt'>Shmuel.<o:p></o:p></p></div></div><div><p class=MsoNormal style='mso-margin-top-alt:0cm;margin-right:0cm;margin-bottom:12.0pt;margin-left:36.0pt'><o:p>&nbsp;</o:p></p><div><div><div><p class=MsoNormal style='margin-left:36.0pt'>On Fri, Dec 28, 2012 at 7:28 AM, moshe nahmias &lt;<a href="mailto:moshegrey@ubuntu.com" target="_blank">moshegrey@ubuntu.com</a>&gt; wrote:<o:p></o:p></p></div></div><blockquote style='border:none;border-left:solid #CCCCCC 1.0pt;padding:0cm 0cm 0cm 6.0pt;margin-left:4.8pt;margin-right:0cm'><div><div><div><p class=MsoNormal style='margin-left:36.0pt'>Hi,<br>I was trying to get some strings in Hebrew from a file (the file is utf8, at least as far as I know since I changed it with iconv) but wasn't able to get them while use utf8 was in effect, when I tryed to move it out it suddenly worked like a charm.<br>isn't it supposed to be the other way around? why utf8 is the problem maker in this case?<o:p></o:p></p></div><p class=MsoNormal style='margin-left:36.0pt'><o:p>&nbsp;</o:p></p></div></div><p class=MsoNormal style='margin-left:36.0pt'>_______________________________________________<br>Perl mailing list<br><a href="mailto:Perl@perl.org.il" target="_blank">Perl@perl.org.il</a><br><a href="http://mail.perl.org.il/mailman/listinfo/perl" target="_blank">http://mail.perl.org.il/mailman/listinfo/perl</a><o:p></o:p></p></blockquote></div><p class=MsoNormal style='margin-left:36.0pt'><o:p>&nbsp;</o:p></p></div><p class=MsoNormal style='margin-left:36.0pt'><br>_______________________________________________<br>Perl mailing list<br><a href="mailto:Perl@perl.org.il">Perl@perl.org.il</a><br><a href="http://mail.perl.org.il/mailman/listinfo/perl" target="_blank">http://mail.perl.org.il/mailman/listinfo/perl</a><o:p></o:p></p></div><p class=MsoNormal style='margin-left:36.0pt'><o:p>&nbsp;</o:p></p></div></div></body></html>