]> granicus.if.org Git - python/commitdiff
Merged revisions 81675 via svnmerge from
authorR. David Murray <rdmurray@bitdance.com>
Wed, 16 Jun 2010 02:19:40 +0000 (02:19 +0000)
committerR. David Murray <rdmurray@bitdance.com>
Wed, 16 Jun 2010 02:19:40 +0000 (02:19 +0000)
svn+ssh://pythondev@svn.python.org/python/trunk

........
  r81675 | r.david.murray | 2010-06-03 11:43:20 -0400 (Thu, 03 Jun 2010) | 10 lines

  #5610: use \Z not $ so we don't eat extra chars when body part ends with \r\n.

  If a body part ended with \r\n, feedparser, using '$' to terminate its
  search for the newline, would match on the \r\n, and think that it needed
  to strip two characters in order to account for the line end before the
  boundary.  That made it chop one too many characters off the end of
  the body part.  Using \Z makes the match correct.

  Patch and test by Tony Nelson.
........

Lib/email/feedparser.py
Lib/email/test/test_email.py
Misc/NEWS

index bff17ba16c8a2b21b33de1c5714c24e0aac349f9..a6853c2b6d00d8fd4c93799993c1078b58115da1 100644 (file)
@@ -28,7 +28,7 @@ from email import message
 
 NLCRE = re.compile('\r\n|\r|\n')
 NLCRE_bol = re.compile('(\r\n|\r|\n)')
-NLCRE_eol = re.compile('(\r\n|\r|\n)$')
+NLCRE_eol = re.compile('(\r\n|\r|\n)\Z')
 NLCRE_crack = re.compile('(\r\n|\r|\n)')
 # RFC 2822 $3.6.8 Optional fields.  ftext is %d33-57 / %d59-126, Any character
 # except controls, SP, and ":".
index 79146a3872d792f4883e32bd86f36736eb650264..be0565e6bc83c553c1ddb1587216b31df0240ce9 100644 (file)
@@ -2588,6 +2588,24 @@ Here's the message body
         eq(headers, ['A', 'B', 'CC'])
         eq(msg.get_payload(), 'body')
 
+    def test_CRLFLF_at_end_of_part(self):
+        # issue 5610: feedparser should not eat two chars from body part ending
+        # with "\r\n\n".
+        m = (
+            "From: foo@bar.com\n"
+            "To: baz\n"
+            "Mime-Version: 1.0\n"
+            "Content-Type: multipart/mixed; boundary=BOUNDARY\n"
+            "\n"
+            "--BOUNDARY\n"
+            "Content-Type: text/plain\n"
+            "\n"
+            "body ending with CRLF newline\r\n"
+            "\n"
+            "--BOUNDARY--\n"
+          )
+        msg = email.message_from_string(m)
+        self.assertTrue(msg.get_payload(0).get_payload().endswith('\r\n'))
 
 \f
 class TestBase64(unittest.TestCase):
index f41096a46b9bb06a4823c9f7b9c9076d8d7b13a1..7817276b8ae7718b466d1b8e492f3ced76684ce5 100644 (file)
--- a/Misc/NEWS
+++ b/Misc/NEWS
@@ -432,6 +432,9 @@ C-API
 Library
 -------
 
+- Issue #5610: feedparser no longer eats extra characters at the end of
+  a body part if the body part ends with a \r\n.
+
 - Issue #8986: math.erfc was incorrectly raising OverflowError for
   values between -27.3 and -30.0 on some platforms.