]> granicus.if.org Git - mutt/commitdiff
Manual: mention terminal setup for charsets, more unicode pros.
authorRocco Rutte <pdmef@gmx.net>
Tue, 7 Jul 2009 10:53:46 +0000 (12:53 +0200)
committerRocco Rutte <pdmef@gmx.net>
Tue, 7 Jul 2009 10:53:46 +0000 (12:53 +0200)
Closes #3292.

ChangeLog
doc/manual.xml.head

index 75b7b945821f5126f15e2c450cf09d020cd218a5..950cd0d78b29ed2d53d4015cf87036a4329e8ba6 100644 (file)
--- a/ChangeLog
+++ b/ChangeLog
@@ -1,3 +1,12 @@
+2009-07-06 15:28 +0200  Rocco Rutte  <pdmef@gmx.net>  (ccab6c56b557)
+
+       * doc/manual.xml.head: Manual: Add a note about when/why to use utf-8
+
+2009-07-05 18:36 -0700  Brendan Cully  <brendan@kublai.com>  (118b8fef8aae)
+
+       * buffy.c, buffy.h, mx.c: Suppress new mail notification
+       from mailbox just left. Closes #3290.
+
 2009-07-02 20:42 +0200  Rocco Rutte  <pdmef@gmx.net>  (042f2ce0b870)
 
        * doc/manual.xml.head: Manual: minor fixes
index bf244ccec8935be39cb95a5c5cd4d6f7b3b47d57..6ff51f3f3475cb8d8ea0a4745fe07ae591e1dd07 100644 (file)
@@ -4572,7 +4572,8 @@ A <quote>character set</quote> is basically a mapping between bytes and
 glyphs and implies a certain character encoding scheme. For example, for
 the ISO 8859 family of character sets, an encoding of 8bit per character
 is used. For the Unicode character set, different character encodings
-may be used, UTF-8 being the most popular.
+may be used, UTF-8 being the most popular. In UTF-8, a character is
+represented using a variable number of bytes ranging from 1 to 4.
 </para>
 
 <para>
@@ -4598,28 +4599,49 @@ setup itself.
 <para>
 If you happen to work with several character sets on a regular basis,
 it's highly advisable to use Unicode and an UTF-8 locale. Unicode can
-represent nearly all characters in a message at the same time, making
-all conversions superfluous which eliminates the risk of conversion
-errors. It also eliminates potentially wrong expectations about the
-character set between Mutt and external programs.
+represent nearly all characters in a message at the same time.  When not
+using a Unicode locale, it may happen that you receive messages with
+characters not representable in your locale. When displaying such a
+message, or replying to or forwarding it, information may get lost
+possibly rendering the message unusable (not only for you but also for
+the recipient, this breakage is not reversible as lost information
+cannot be guessed).
+</para>
+
+<para>
+A Unicode locale makes all conversions superfluous which eliminates the
+risk of conversion errors. It also eliminates potentially wrong
+expectations about the character set between Mutt and external programs.
+</para>
+
+<para>
+The terminal emulator used also must be properly configured for the
+current locale. Terminal emulators usually do <emphasis>not</emphasis>
+derive the locale from environment variables, they need to be configured
+separately. If the terminal is incorrectly configured, Mutt may display
+random and unexpected characters (question marks, octal codes, or just
+random glyphs), format strings may not work as expected, you may not be
+abled to enter non-ascii characters, and possible more.  Data is always
+represented using bytes and so a correct setup is very important as to
+the machine, all character sets <quote>look</quote> the same.
 </para>
 
 <para>
 Warning: A mismatch between what system and library functions think the
 locale is and what Mutt was told what the locale is may make it behave
-badly with non-ascii input: it will fail at seemingly random
-places. This warning is to be taken seriously since not only local mail
-handling may suffer: sent messages may carry wrong character set
-information the <emphasis>receiver</emphasis> has too deal with. The
-need to set <literal>$charset</literal> directly in most cases points at
-terminal and environment variable setup problems, not Mutt problems.
+badly with non-ascii input: it will fail at seemingly random places.
+This warning is to be taken seriously since not only local mail handling
+may suffer: sent messages may carry wrong character set information the
+<emphasis>receiver</emphasis> has too deal with. The need to set
+<literal>$charset</literal> directly in most cases points at terminal
+and environment variable setup problems, not Mutt problems.
 </para>
 
 <para>
 A list of officially assigned and known character sets can be found at
 <ulink url="http://www.iana.org/assignments/character-sets">IANA</ulink>,
-a list of locally supported locales can be obtained by
-running <literal>locale -a</literal>.
+a list of locally supported locales can be obtained by running
+<literal>locale -a</literal>.
 </para>
 
 </sect1>