Fix PyUnicode_Substring() for start >= length and start > end

author Victor Stinner <victor.stinner@gmail.com>

Thu, 3 May 2012 00:32:34 +0000 (02:32 +0200)

committer Victor Stinner <victor.stinner@gmail.com>

Thu, 3 May 2012 00:32:34 +0000 (02:32 +0200)
author Victor Stinner <victor.stinner@gmail.com>
Thu, 3 May 2012 00:32:34 +0000 (02:32 +0200)
committer Victor Stinner <victor.stinner@gmail.com>
Thu, 3 May 2012 00:32:34 +0000 (02:32 +0200)
diff --git a/Objects/unicodeobject.c b/Objects/unicodeobject.c

index f427fd3d11ccf6b17ea2047c3a14a3589357e48d..09b57338a0d266eefd39776376ea038d35af1b8c 100644 (file)
--- a/Objects/unicodeobject.c
+++ b/Objects/unicodeobject.c
@@ -12067,20 +12067,22 @@ PyUnicode_Substring(PyObject *self, Py_ssize_t start, Py_ssize_t end)
      if (PyUnicode_READY(self) == -1)
          return NULL;
  
-    end = Py_MIN(end, PyUnicode_GET_LENGTH(self));
+    length = PyUnicode_GET_LENGTH(self);
+    end = Py_MIN(end, length);
  
-    if (start == 0 && end == PyUnicode_GET_LENGTH(self))
+    if (start == 0 && end == length)
          return unicode_result_unchanged(self);
  
-    length = end - start;
-    if (length == 1)
-        return unicode_getitem(self, start);
-
      if (start < 0 || end < 0) {
          PyErr_SetString(PyExc_IndexError, "string index out of range");
          return NULL;
      }
+    if (start >= length || end < start) {
+        assert(end == length);
+        return PyUnicode_New(0, 0);
+    }
  
+    length = end - start;
      if (PyUnicode_IS_ASCII(self)) {
          data = PyUnicode_1BYTE_DATA(self);
          return unicode_fromascii(data + start, length);
author	Victor Stinner <victor.stinner@gmail.com>
	Thu, 3 May 2012 00:32:34 +0000 (02:32 +0200)
committer	Victor Stinner <victor.stinner@gmail.com>
	Thu, 3 May 2012 00:32:34 +0000 (02:32 +0200)