]> granicus.if.org Git - python/commitdiff
Prevent expandtabs() on string and unicode objects from causing a segfault when
authorNeal Norwitz <nnorwitz@gmail.com>
Sat, 9 Jun 2007 04:06:30 +0000 (04:06 +0000)
committerNeal Norwitz <nnorwitz@gmail.com>
Sat, 9 Jun 2007 04:06:30 +0000 (04:06 +0000)
a large width is passed on 32-bit platforms.  Found by Google.

It would be good for people to review this especially carefully and verify
I don't have an off by one error and there is no other way to cause overflow.

Lib/test/test_str.py
Lib/test/test_unicode.py
Misc/NEWS
Objects/stringobject.c
Objects/unicodeobject.c

index 45942a66ef24ce5cf9c38f651e269de2844ae929..18535173457d796ae1690e23c008ae0b897083bf 100644 (file)
@@ -1,4 +1,6 @@
+
 import unittest
+import sys
 from test import test_support, string_tests
 
 
@@ -82,6 +84,15 @@ class StrTest(
         self.assertEqual(str(Foo9("foo")), "string")
         self.assertEqual(unicode(Foo9("foo")), u"not unicode")
 
+    def test_expandtabs_overflows_gracefully(self):
+        # This test only affects 32-bit platforms because expandtabs can only take
+        # an int as the max value, not a 64-bit C long.  If expandtabs is changed
+        # to take a 64-bit long, this test should apply to all platforms.
+        if sys.maxint > (1 << 32):
+            return
+        self.assertRaises(OverflowError, 't\tt\t'.expandtabs, sys.maxint)
+
+
 def test_main():
     test_support.run_unittest(StrTest)
 
index 1bc15ae3b05c9188f25010ddf769975836a8265c..1e4c7d98c38fa103c0767a597f77727c5a7da08b 100644 (file)
@@ -817,8 +817,13 @@ class UnicodeTest(
         self.assertEqual(repr(s1()), '\\n')
         self.assertEqual(repr(s2()), '\\n')
 
-
-
+    def test_expandtabs_overflows_gracefully(self):
+        # This test only affects 32-bit platforms because expandtabs can only take
+        # an int as the max value, not a 64-bit C long.  If expandtabs is changed
+        # to take a 64-bit long, this test should apply to all platforms.
+        if sys.maxint > (1 << 32):
+            return
+        self.assertRaises(OverflowError, u't\tt\t'.expandtabs, sys.maxint)
 
 
 def test_main():
index 4f9d64875090a24c3a741afa400eaa620b01b5dd..22f05abd2ee0c4a9d47c15d815fd51e9c8f733ac 100644 (file)
--- a/Misc/NEWS
+++ b/Misc/NEWS
@@ -12,6 +12,9 @@ What's New in Python 2.5.2c1?
 Core and builtins
 -----------------
 
+- Prevent expandtabs() on string and unicode objects from causing a segfault when
+  a large width is passed on 32-bit platforms.
+
 - Bug #1733488: Fix compilation of bufferobject.c on AIX.
 
 
index 5ae2ca06c06e2e63647e62d79424f8e1f01d5f88..8b546431080fb63b04a7dcede3004c90f597edba 100644 (file)
@@ -3298,7 +3298,7 @@ string_expandtabs(PyStringObject *self, PyObject *args)
 {
     const char *e, *p;
     char *q;
-    Py_ssize_t i, j;
+    Py_ssize_t i, j, old_j;
     PyObject *u;
     int tabsize = 8;
 
@@ -3306,12 +3306,18 @@ string_expandtabs(PyStringObject *self, PyObject *args)
        return NULL;
 
     /* First pass: determine size of output string */
-    i = j = 0;
+    i = j = old_j = 0;
     e = PyString_AS_STRING(self) + PyString_GET_SIZE(self);
     for (p = PyString_AS_STRING(self); p < e; p++)
         if (*p == '\t') {
-           if (tabsize > 0)
+           if (tabsize > 0) {
                j += tabsize - (j % tabsize);
+               if (old_j > j) {
+                   PyErr_SetString(PyExc_OverflowError, "new string is too long");
+                   return NULL;
+               }
+               old_j = j;
+            }
        }
         else {
             j++;
@@ -3321,6 +3327,11 @@ string_expandtabs(PyStringObject *self, PyObject *args)
             }
         }
 
+    if ((i + j) < 0) {
+        PyErr_SetString(PyExc_OverflowError, "new string is too long");
+        return NULL;
+    }
+
     /* Second pass: create output string and fill it */
     u = PyString_FromStringAndSize(NULL, i + j);
     if (!u)
index 00f2018da0c551c43da0a7e1aae7a0ded7c5aeac..0640da8cd6050862187d363a207cb5fe007eea3d 100644 (file)
@@ -5686,7 +5686,7 @@ unicode_expandtabs(PyUnicodeObject *self, PyObject *args)
     Py_UNICODE *e;
     Py_UNICODE *p;
     Py_UNICODE *q;
-    Py_ssize_t i, j;
+    Py_ssize_t i, j, old_j;
     PyUnicodeObject *u;
     int tabsize = 8;
 
@@ -5694,12 +5694,18 @@ unicode_expandtabs(PyUnicodeObject *self, PyObject *args)
        return NULL;
 
     /* First pass: determine size of output string */
-    i = j = 0;
+    i = j = old_j = 0;
     e = self->str + self->length;
     for (p = self->str; p < e; p++)
         if (*p == '\t') {
-           if (tabsize > 0)
+           if (tabsize > 0) {
                j += tabsize - (j % tabsize);
+               if (old_j > j) {
+                   PyErr_SetString(PyExc_OverflowError, "new string is too long");
+                   return NULL;
+               }
+               old_j = j;
+           }
        }
         else {
             j++;
@@ -5709,6 +5715,11 @@ unicode_expandtabs(PyUnicodeObject *self, PyObject *args)
             }
         }
 
+    if ((i + j) < 0) {
+        PyErr_SetString(PyExc_OverflowError, "new string is too long");
+        return NULL;
+    }
+
     /* Second pass: create output string and fill it */
     u = _PyUnicode_New(i + j);
     if (!u)