]> granicus.if.org Git - python/commitdiff
Wrote down the invariants of some common objects whose structure is
authorArmin Rigo <arigo@tunes.org>
Thu, 28 Oct 2004 16:32:00 +0000 (16:32 +0000)
committerArmin Rigo <arigo@tunes.org>
Thu, 28 Oct 2004 16:32:00 +0000 (16:32 +0000)
exposed in header files.  Fixed a few comments in these headers.

As we might have expected, writing down invariants systematically exposed a
(minor) bug.  In this case, function objects have a writeable func_code
attribute, which could be set to code objects with the wrong number of
free variables.  Calling the resulting function segfaulted the interpreter.
Added a corresponding test.

12 files changed:
Include/cellobject.h
Include/funcobject.h
Include/intobject.h
Include/listobject.h
Include/methodobject.h
Include/rangeobject.h
Include/setobject.h
Include/sliceobject.h
Include/stringobject.h
Include/tupleobject.h
Lib/test/test_funcattrs.py
Objects/funcobject.c

index 2a6dcaa483ac3b64f546a0f4972c7da9825cd249..fd186e28c2607eb9b0782ecc412b4aade8541228 100644 (file)
@@ -8,7 +8,7 @@ extern "C" {
 
 typedef struct {
        PyObject_HEAD
-       PyObject *ob_ref;
+       PyObject *ob_ref;       /* Content of the cell or NULL when empty */
 } PyCellObject;
 
 PyAPI_DATA(PyTypeObject) PyCell_Type;
index 758c76dcb9d1e0dcd15c5a5ed668b0d4e4f58349..59c19bb1e70df2d2195b9871fcab94c5638d5b7e 100644 (file)
@@ -7,17 +7,34 @@
 extern "C" {
 #endif
 
+/* Function objects and code objects should not be confused with each other:
+ *
+ * Function objects are created by the execution of the 'def' statement.
+ * They reference a code object in their func_code attribute, which is a
+ * purely syntactic object, i.e. nothing more than a compiled version of some
+ * source code lines.  There is one code object per source code "fragment",
+ * but each code object can be referenced by zero or many function objects
+ * depending only on how many times the 'def' statement in the source was
+ * executed so far.
+ */
+
 typedef struct {
     PyObject_HEAD
-    PyObject *func_code;
-    PyObject *func_globals;
-    PyObject *func_defaults;
-    PyObject *func_closure;
-    PyObject *func_doc;
-    PyObject *func_name;
-    PyObject *func_dict;
-    PyObject *func_weakreflist;
-    PyObject *func_module;
+    PyObject *func_code;       /* A code object */
+    PyObject *func_globals;    /* A dictionary (other mappings won't do) */
+    PyObject *func_defaults;   /* NULL or a tuple */
+    PyObject *func_closure;    /* NULL or a tuple of cell objects */
+    PyObject *func_doc;                /* The __doc__ attribute, can be anything */
+    PyObject *func_name;       /* The __name__ attribute, a string object */
+    PyObject *func_dict;       /* The __dict__ attribute, a dict or NULL */
+    PyObject *func_weakreflist;        /* List of weak references */
+    PyObject *func_module;     /* The __module__ attribute, can be anything */
+
+    /* Invariant:
+     *     func_closure contains the bindings for func_code->co_freevars, so
+     *     PyTuple_Size(func_closure) == PyCode_GetNumFree(func_code)
+     *     (func_closure may be NULL if PyCode_GetNumFree(func_code) == 0).
+     */
 } PyFunctionObject;
 
 PyAPI_DATA(PyTypeObject) PyFunction_Type;
index 61ef0f0f52f5763859ee91e4a173215140eaa004..1bbd59c2f5b03297f411ba642d82ebf36fa1b5d7 100644 (file)
@@ -11,7 +11,7 @@ returns -1 and sets errno to EBADF if the object is not an PyIntObject.
 None of the functions should be applied to nil objects.
 
 The type PyIntObject is (unfortunately) exposed here so we can declare
-_Py_TrueStruct and _Py_ZeroStruct below; don't use this.
+_Py_TrueStruct and _Py_ZeroStruct in boolobject.h; don't use this.
 */
 
 #ifndef Py_INTOBJECT_H
index e4867a5ed000c6d916ae1928b583a92d79ad802e..0999a8218764732791eebf40c973d1f28d9da200 100644 (file)
@@ -31,6 +31,9 @@ typedef struct {
      *     len(list) == ob_size
      *     ob_item == NULL implies ob_size == allocated == 0
      * list.sort() temporarily sets allocated to -1 to detect mutations.
+     *
+     * Items must normally not be NULL, except during construction when
+     * the list is not yet visible outside the function that builds it.
      */
     int allocated;
 } PyListObject;
index 0f605499ee9a3091de2a68b94d6d23cff239be20..9736dc3f1a2cc519a06485e3509d738cf37e4156 100644 (file)
@@ -7,6 +7,10 @@
 extern "C" {
 #endif
 
+/* This is about the type 'builtin_function_or_method',
+   not Python methods in user-defined classes.  See classobject.h
+   for the latter. */
+
 PyAPI_DATA(PyTypeObject) PyCFunction_Type;
 
 #define PyCFunction_Check(op) ((op)->ob_type == &PyCFunction_Type)
@@ -31,10 +35,11 @@ PyAPI_FUNC(int) PyCFunction_GetFlags(PyObject *);
 PyAPI_FUNC(PyObject *) PyCFunction_Call(PyObject *, PyObject *, PyObject *);
 
 struct PyMethodDef {
-    char       *ml_name;
-    PyCFunction  ml_meth;
-    int                 ml_flags;
-    char       *ml_doc;
+    char       *ml_name;       /* The name of the built-in function/method */
+    PyCFunction  ml_meth;      /* The C function that implements it */
+    int                 ml_flags;      /* Combination of METH_xxx flags, which mostly
+                                  describe the args expected by the C func */
+    char       *ml_doc;        /* The __doc__ attribute, or NULL */
 };
 typedef struct PyMethodDef PyMethodDef;
 
@@ -75,9 +80,9 @@ PyAPI_FUNC(PyObject *) Py_FindMethodInChain(PyMethodChain *, PyObject *,
 
 typedef struct {
     PyObject_HEAD
-    PyMethodDef *m_ml;
-    PyObject    *m_self;
-    PyObject    *m_module;
+    PyMethodDef *m_ml; /* Description of the C function to call */
+    PyObject    *m_self; /* Passed as 'self' arg to the C func, can be NULL */
+    PyObject    *m_module; /* The __module__ attribute, can be anything */
 } PyCFunctionObject;
 
 #ifdef __cplusplus
index b6f571ba32b640df61b13b9c9ff4b2ea1177698c..50aa0619e1a285960c3ebe5a7fc8f6932c3fb0be 100644 (file)
@@ -7,6 +7,9 @@
 extern "C" {
 #endif
 
+/* This is about the type 'xrange', not the built-in function range(), which
+   returns regular lists. */
+
 /*
 A range object represents an integer range.  This is an immutable object;
 a range cannot change its value after creation.
index abbd8477ad83bcd277c8f9f6627520c0e88d6d45..cc2d6832bce9a570c8bb4c6af6eb6958b44c7175 100644 (file)
@@ -16,6 +16,14 @@ typedef struct {
        PyObject *data;
        long hash;      /* only used by frozenset objects */
        PyObject *weakreflist; /* List of weak references */
+
+       /* Invariants:
+        *     data is a dictionary whose values are all True.
+        *     data points to the same dict for the whole life of the set.
+        * For frozensets only:
+        *     data is immutable.
+        *     hash is the hash of the frozenset or -1 if not computed yet.
+        */
 } PySetObject;
 
 PyAPI_DATA(PyTypeObject) PySet_Type;
index 1fb123a94f19d3b2ef3f5b4d3af00932a30d48ef..fc80254dd51ee30f04eb82c3a731e35a10ce0c77 100644 (file)
@@ -16,12 +16,12 @@ PyAPI_DATA(PyObject) _Py_EllipsisObject; /* Don't use this directly */
 
 A slice object containing start, stop, and step data members (the
 names are from range).  After much talk with Guido, it was decided to
-let these be any arbitrary python type. 
+let these be any arbitrary python type.  Py_None stands for omitted values.
 */
 
 typedef struct {
     PyObject_HEAD
-    PyObject *start, *stop, *step;
+    PyObject *start, *stop, *step;     /* not NULL */
 } PySliceObject;
 
 PyAPI_DATA(PyTypeObject) PySlice_Type;
index 3deea8f5d82b3572f55dd537448ae4e7e4ee131b..0c7e5b6d2c540ee610f062a8b6e781df058912f7 100644 (file)
@@ -37,6 +37,15 @@ typedef struct {
     long ob_shash;
     int ob_sstate;
     char ob_sval[1];
+
+    /* Invariants:
+     *     ob_sval contains space for 'ob_size+1' elements.
+     *     ob_sval[ob_size] == 0.
+     *     ob_shash is the hash of the string or -1 if not computed yet.
+     *     ob_sstate != 0 iff the string object is in stringobject.c's
+     *       'interned' dictionary; in this case the two references
+     *       from 'interned' to this object are *not counted* in ob_refcnt.
+     */
 } PyStringObject;
 
 #define SSTATE_NOT_INTERNED 0
index f1839fe98cda2d2098e06bd65caa5ee807415f7f..6b60d62da89b1b310f236230d3ca9107c5b1deb6 100644 (file)
@@ -8,9 +8,11 @@ extern "C" {
 #endif
 
 /*
-Another generally useful object type is an tuple of object pointers.
-This is a mutable type: the tuple items can be changed (but not their
-number).  Out-of-range indices or non-tuple objects are ignored.
+Another generally useful object type is a tuple of object pointers.
+For Python, this is an immutable type.  C code can change the tuple items
+(but not their number), and even use tuples are general-purpose arrays of
+object references, but in general only brand new tuples should be mutated,
+not ones that might already have been exposed to Python code.
 
 *** WARNING *** PyTuple_SetItem does not increment the new item's reference
 count, but does decrement the reference count of the item it replaces,
@@ -22,6 +24,11 @@ returned item's reference count.
 typedef struct {
     PyObject_VAR_HEAD
     PyObject *ob_item[1];
+
+    /* ob_item contains space for 'ob_size' elements.
+     * Items must normally not be NULL, except during construction when
+     * the tuple is not yet visible outside the function that builds it.
+     */
 } PyTupleObject;
 
 PyAPI_DATA(PyTypeObject) PyTuple_Type;
index 381412fb7b9e8c7542d232405fc700e1701091c8..1acfeb5e65bad684b8962a2dccf06049b8652589 100644 (file)
@@ -218,11 +218,11 @@ d[foo]
 
 # Test all predefined function attributes systematically
 
-def cantset(obj, name, value):
+def cantset(obj, name, value, exception=(AttributeError, TypeError)):
     verify(hasattr(obj, name)) # Otherwise it's probably a typo
     try:
         setattr(obj, name, value)
-    except (AttributeError, TypeError):
+    except exception:
         pass
     else:
         raise TestFailed, "shouldn't be able to set %s to %r" % (name, value)
@@ -279,11 +279,20 @@ def test_func_name():
 
 
 def test_func_code():
+    a = b = 24
     def f(): pass
     def g(): print 12
+    def f1(): print a
+    def g1(): print b
+    def f2(): print a, b
     verify(type(f.func_code) is types.CodeType)
     f.func_code = g.func_code
     cantset(f, "func_code", None)
+    # can't change the number of free vars
+    cantset(f,  "func_code", f1.func_code, exception=ValueError)
+    cantset(f1, "func_code",  f.func_code, exception=ValueError)
+    cantset(f1, "func_code", f2.func_code, exception=ValueError)
+    f1.func_code = g1.func_code
 
 def test_func_defaults():
     def f(a, b): return (a, b)
index c46887c96b553b9a993c01eec25545d04bac1390..c7f7c9d23df0dbd836ff84ae0a87c41122f4736b 100644 (file)
@@ -230,6 +230,7 @@ static int
 func_set_code(PyFunctionObject *op, PyObject *value)
 {
        PyObject *tmp;
+       int nfree, nclosure;
 
        if (restricted())
                return -1;
@@ -240,6 +241,17 @@ func_set_code(PyFunctionObject *op, PyObject *value)
                                "func_code must be set to a code object");
                return -1;
        }
+       nfree = PyCode_GetNumFree((PyCodeObject *)value);
+       nclosure = (op->func_closure == NULL ? 0 :
+                   PyTuple_GET_SIZE(op->func_closure));
+       if (nclosure != nfree) {
+               PyErr_Format(PyExc_ValueError,
+                            "%s() requires a code object with %d free vars,"
+                            " not %d",
+                            PyString_AsString(op->func_name),
+                            nclosure, nfree);
+               return -1;
+       }
        tmp = op->func_code;
        Py_INCREF(value);
        op->func_code = value;