]> granicus.if.org Git - apache/blob - include/util_filter.h
Add new struct element: name...
[apache] / include / util_filter.h
1 /* Licensed to the Apache Software Foundation (ASF) under one or more
2  * contributor license agreements.  See the NOTICE file distributed with
3  * this work for additional information regarding copyright ownership.
4  * The ASF licenses this file to You under the Apache License, Version 2.0
5  * (the "License"); you may not use this file except in compliance with
6  * the License.  You may obtain a copy of the License at
7  *
8  *     http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16
17 /**
18  * @file util_filter.h
19  * @brief Apache filter library
20  */
21
22 #ifndef AP_FILTER_H
23 #define AP_FILTER_H
24
25 #include "apr.h"
26 #include "apr_buckets.h"
27
28 #include "httpd.h"
29
30 #if APR_HAVE_STDARG_H
31 #include <stdarg.h>
32 #endif
33
34 #ifdef __cplusplus
35 extern "C" {
36 #endif
37
38 /**
39  * @brief input filtering modes
40  */
41 typedef enum {
42     /** The filter should return at most readbytes data. */
43     AP_MODE_READBYTES,
44     /** The filter should return at most one line of CRLF data.
45      *  (If a potential line is too long or no CRLF is found, the 
46      *   filter may return partial data).
47      */
48     AP_MODE_GETLINE,
49     /** The filter should implicitly eat any CRLF pairs that it sees. */
50     AP_MODE_EATCRLF,
51     /** The filter read should be treated as speculative and any returned
52      *  data should be stored for later retrieval in another mode. */
53     AP_MODE_SPECULATIVE,
54     /** The filter read should be exhaustive and read until it can not
55      *  read any more.
56      *  Use this mode with extreme caution.
57      */
58     AP_MODE_EXHAUSTIVE,
59     /** The filter should initialize the connection if needed,
60      *  NNTP or FTP over SSL for example.
61      */
62     AP_MODE_INIT
63 } ap_input_mode_t;
64
65 /**
66  * @defgroup APACHE_CORE_FILTER Filter Chain
67  * @ingroup  APACHE_CORE
68  *
69  * Filters operate using a "chaining" mechanism. The filters are chained
70  * together into a sequence. When output is generated, it is passed through
71  * each of the filters on this chain, until it reaches the end (or "bottom")
72  * and is placed onto the network.
73  *
74  * The top of the chain, the code generating the output, is typically called
75  * a "content generator." The content generator's output is fed into the
76  * filter chain using the standard Apache output mechanisms: ap_rputs(),
77  * ap_rprintf(), ap_rwrite(), etc.
78  *
79  * Each filter is defined by a callback. This callback takes the output from
80  * the previous filter (or the content generator if there is no previous
81  * filter), operates on it, and passes the result to the next filter in the
82  * chain. This pass-off is performed using the ap_fc_* functions, such as
83  * ap_fc_puts(), ap_fc_printf(), ap_fc_write(), etc.
84  *
85  * When content generation is complete, the system will pass an "end of
86  * stream" marker into the filter chain. The filters will use this to flush
87  * out any internal state and to detect incomplete syntax (for example, an
88  * unterminated SSI directive).
89  */
90
91 /* forward declare the filter type */
92 typedef struct ap_filter_t ap_filter_t;
93
94 /**
95  * @name Filter callbacks
96  *
97  * This function type is used for filter callbacks. It will be passed a
98  * pointer to "this" filter, and a "bucket" containing the content to be
99  * filtered.
100  *
101  * In filter->ctx, the callback will find its context. This context is
102  * provided here, so that a filter may be installed multiple times, each
103  * receiving its own per-install context pointer.
104  *
105  * Callbacks are associated with a filter definition, which is specified
106  * by name. See ap_register_input_filter() and ap_register_output_filter()
107  * for setting the association between a name for a filter and its 
108  * associated callback (and other information).
109  *
110  * If the initialization function argument passed to the registration
111  * functions is non-NULL, it will be called iff the filter is in the input
112  * or output filter chains and before any data is generated to allow the
113  * filter to prepare for processing.
114  *
115  * The *bucket structure (and all those referenced by ->next and ->prev)
116  * should be considered "const". The filter is allowed to modify the
117  * next/prev to insert/remove/replace elements in the bucket list, but
118  * the types and values of the individual buckets should not be altered.
119  *
120  * For the input and output filters, the return value of a filter should be
121  * an APR status value.  For the init function, the return value should
122  * be an HTTP error code or OK if it was successful.
123  * 
124  * @ingroup filter
125  * @{
126  */
127 typedef apr_status_t (*ap_out_filter_func)(ap_filter_t *f,
128                                            apr_bucket_brigade *b);
129 typedef apr_status_t (*ap_in_filter_func)(ap_filter_t *f,
130                                           apr_bucket_brigade *b, 
131                                           ap_input_mode_t mode,
132                                           apr_read_type_e block,
133                                           apr_off_t readbytes);
134 typedef int (*ap_init_filter_func)(ap_filter_t *f);
135
136 typedef union ap_filter_func {
137     ap_out_filter_func out_func;
138     ap_in_filter_func in_func;
139 } ap_filter_func;
140
141 /** @} */
142
143 /**
144  * Filters have different types/classifications. These are used to group
145  * and sort the filters to properly sequence their operation.
146  *
147  * The types have a particular sort order, which allows us to insert them
148  * into the filter chain in a determistic order. Within a particular grouping,
149  * the ordering is equivalent to the order of calls to ap_add_*_filter().
150  */
151 typedef enum {
152     /** These filters are used to alter the content that is passed through
153      *  them. Examples are SSI or PHP. */
154     AP_FTYPE_RESOURCE     = 10,
155     /** These filters are used to alter the content as a whole, but after all
156      *  AP_FTYPE_RESOURCE filters are executed.  These filters should not
157      *  change the content-type.  An example is deflate.  */
158     AP_FTYPE_CONTENT_SET  = 20,
159     /** These filters are used to handle the protocol between server and
160      *  client.  Examples are HTTP and POP. */
161     AP_FTYPE_PROTOCOL     = 30,
162     /** These filters implement transport encodings (e.g., chunking). */
163     AP_FTYPE_TRANSCODE    = 40,
164     /** These filters will alter the content, but in ways that are
165      *  more strongly associated with the connection.  Examples are
166      *  splitting an HTTP connection into multiple requests and
167      *  buffering HTTP responses across multiple requests.
168      *
169      *  It is important to note that these types of filters are not
170      *  allowed in a sub-request. A sub-request's output can certainly
171      *  be filtered by ::AP_FTYPE_RESOURCE filters, but all of the "final
172      *  processing" is determined by the main request. */
173     AP_FTYPE_CONNECTION  = 50,
174     /** These filters don't alter the content.  They are responsible for
175      *  sending/receiving data to/from the client. */
176     AP_FTYPE_NETWORK     = 60
177 } ap_filter_type;
178
179 /**
180  * This is the request-time context structure for an installed filter (in
181  * the output filter chain). It provides the callback to use for filtering,
182  * the request this filter is associated with (which is important when
183  * an output chain also includes sub-request filters), the context for this
184  * installed filter, and the filter ordering/chaining fields.
185  *
186  * Filter callbacks are free to use ->ctx as they please, to store context
187  * during the filter process. Generally, this is superior over associating
188  * the state directly with the request. A callback should not change any of
189  * the other fields.
190  */
191
192 typedef struct ap_filter_rec_t ap_filter_rec_t;
193 typedef struct ap_filter_provider_t ap_filter_provider_t;
194
195 /**
196  * @brief This structure is used for recording information about the
197  * registered filters. It associates a name with the filter's callback
198  * and filter type.
199  *
200  * At the moment, these are simply linked in a chain, so a ->next pointer
201  * is available.
202  *
203  * It is used for any filter that can be inserted in the filter chain.
204  * This may be either a httpd-2.0 filter or a mod_filter harness.
205  * In the latter case it contains dispatch, provider and protocol information.
206  * In the former case, the new fields (from dispatch) are ignored.
207  */
208 struct ap_filter_rec_t {
209     /** The registered name for this filter */
210     const char *name;
211
212     /** The function to call when this filter is invoked. */
213     ap_filter_func filter_func;
214
215     /** The function to call before the handlers are invoked. Notice
216      * that this function is called only for filters participating in
217      * the http protocol. Filters for other protocols are to be
218      * initialized by the protocols themselves.
219      */
220     ap_init_filter_func filter_init_func;
221
222     /** The type of filter, either AP_FTYPE_CONTENT or AP_FTYPE_CONNECTION.  
223      * An AP_FTYPE_CONTENT filter modifies the data based on information 
224      * found in the content.  An AP_FTYPE_CONNECTION filter modifies the 
225      * data based on the type of connection.
226      */
227     ap_filter_type ftype;
228
229     /** The next filter_rec in the list */
230     struct ap_filter_rec_t *next;
231
232     /** Providers for this filter */
233     ap_filter_provider_t *providers;
234
235     /** Trace level for this filter */
236     int debug;
237
238     /** Protocol flags for this filter */
239     unsigned int proto_flags;
240 };
241
242 /**
243  * @brief The representation of a filter chain.  
244  *
245  * Each request has a list
246  * of these structures which are called in turn to filter the data.  Sub
247  * requests get an exact copy of the main requests filter chain.
248  */
249 struct ap_filter_t {
250     /** The internal representation of this filter.  This includes
251      *  the filter's name, type, and the actual function pointer.
252      */
253     ap_filter_rec_t *frec;
254
255     /** A place to store any data associated with the current filter */
256     void *ctx;
257
258     /** The next filter in the chain */
259     ap_filter_t *next;
260
261     /** The request_rec associated with the current filter.  If a sub-request
262      *  adds filters, then the sub-request is the request associated with the
263      *  filter.
264      */
265     request_rec *r;
266
267     /** The conn_rec associated with the current filter.  This is analogous
268      *  to the request_rec, except that it is used for connection filters.
269      */
270     conn_rec *c;
271 };
272
273 /**
274  * Get the current bucket brigade from the next filter on the filter
275  * stack.  The filter returns an apr_status_t value.  If the bottom-most 
276  * filter doesn't read from the network, then ::AP_NOBODY_READ is returned.
277  * The bucket brigade will be empty when there is nothing left to get.
278  * @param filter The next filter in the chain
279  * @param bucket The current bucket brigade.  The original brigade passed
280  *               to ap_get_brigade() must be empty.
281  * @param mode   The way in which the data should be read
282  * @param block  How the operations should be performed
283  *               ::APR_BLOCK_READ, ::APR_NONBLOCK_READ
284  * @param readbytes How many bytes to read from the next filter.
285  */
286 AP_DECLARE(apr_status_t) ap_get_brigade(ap_filter_t *filter, 
287                                         apr_bucket_brigade *bucket, 
288                                         ap_input_mode_t mode,
289                                         apr_read_type_e block, 
290                                         apr_off_t readbytes);
291
292 /**
293  * Pass the current bucket brigade down to the next filter on the filter
294  * stack.  The filter returns an apr_status_t value.  If the bottom-most 
295  * filter doesn't write to the network, then ::AP_NOBODY_WROTE is returned.
296  * The caller relinquishes ownership of the brigade.
297  * @param filter The next filter in the chain
298  * @param bucket The current bucket brigade
299  */
300 AP_DECLARE(apr_status_t) ap_pass_brigade(ap_filter_t *filter,
301                                          apr_bucket_brigade *bucket);
302
303 /**
304  * This function is used to register an input filter with the system. 
305  * After this registration is performed, then a filter may be added 
306  * into the filter chain by using ap_add_input_filter() and simply 
307  * specifying the name.
308  *
309  * @param name The name to attach to the filter function
310  * @param filter_func The filter function to name
311  * @param filter_init The function to call before the filter handlers 
312                       are invoked
313  * @param ftype The type of filter function, either ::AP_FTYPE_CONTENT or
314  *              ::AP_FTYPE_CONNECTION
315  * @see add_input_filter()
316  */
317 AP_DECLARE(ap_filter_rec_t *) ap_register_input_filter(const char *name,
318                                           ap_in_filter_func filter_func,
319                                           ap_init_filter_func filter_init,
320                                           ap_filter_type ftype);
321
322 /** @deprecated @see ap_register_output_filter_protocol */
323 AP_DECLARE(ap_filter_rec_t *) ap_register_output_filter(const char *name,
324                                             ap_out_filter_func filter_func,
325                                             ap_init_filter_func filter_init,
326                                             ap_filter_type ftype);
327
328 /* For httpd-?.? I suggest replacing the above with
329 #define ap_register_output_filter(name,ffunc,init,ftype) \
330              ap_register_output_filter_protocol(name,ffunc,init,ftype,0)
331 */
332
333 /**
334  * This function is used to register an output filter with the system. 
335  * After this registration is performed, then a filter may be added 
336  * directly to the filter chain by using ap_add_output_filter() and
337  * simply specifying the name, or as a provider under mod_filter.
338  *
339  * @param name The name to attach to the filter function
340  * @param filter_func The filter function to name
341  * @param filter_init The function to call before the filter handlers 
342  *                    are invoked
343  * @param ftype The type of filter function, either ::AP_FTYPE_CONTENT or
344  *              ::AP_FTYPE_CONNECTION
345  * @param proto_flags Protocol flags: logical OR of AP_FILTER_PROTO_* bits
346  * @return the filter rec
347  * @see ap_add_output_filter()
348  */
349 AP_DECLARE(ap_filter_rec_t *) ap_register_output_filter_protocol(
350                                             const char *name,
351                                             ap_out_filter_func filter_func,
352                                             ap_init_filter_func filter_init,
353                                             ap_filter_type ftype,
354                                             unsigned int proto_flags);
355
356 /**
357  * Adds a named filter into the filter chain on the specified request record.
358  * The filter will be installed with the specified context pointer.
359  *
360  * Filters added in this way will always be placed at the end of the filters
361  * that have the same type (thus, the filters have the same order as the
362  * calls to ap_add_filter). If the current filter chain contains filters
363  * from another request, then this filter will be added before those other
364  * filters.
365  * 
366  * To re-iterate that last comment.  This function is building a FIFO
367  * list of filters.  Take note of that when adding your filter to the chain.
368  *
369  * @param name The name of the filter to add
370  * @param ctx Context data to provide to the filter
371  * @param r The request to add this filter for (or NULL if it isn't associated with a request)
372  * @param c The connection to add the fillter for
373  */
374 AP_DECLARE(ap_filter_t *) ap_add_input_filter(const char *name, void *ctx,
375                                               request_rec *r, conn_rec *c);
376
377 /**
378  * Variant of ap_add_input_filter() that accepts a registered filter handle
379  * (as returned by ap_register_input_filter()) rather than a filter name
380  *
381  * @param f The filter handle to add
382  * @param ctx Context data to provide to the filter
383  * @param r The request to add this filter for (or NULL if it isn't associated with a request)
384  * @param c The connection to add the fillter for
385  */
386 AP_DECLARE(ap_filter_t *) ap_add_input_filter_handle(ap_filter_rec_t *f,
387                                                      void *ctx,
388                                                      request_rec *r,
389                                                      conn_rec *c);
390
391 /**
392  * Returns the filter handle for use with ap_add_input_filter_handle.
393  *
394  * @param name The filter name to look up
395  */
396 AP_DECLARE(ap_filter_rec_t *) ap_get_input_filter_handle(const char *name);
397
398 /**
399  * Add a filter to the current request.  Filters are added in a FIFO manner.
400  * The first filter added will be the first filter called.
401  * @param name The name of the filter to add
402  * @param ctx Context data to set in the filter
403  * @param r The request to add this filter for (or NULL if it isn't associated with a request)
404  * @param c The connection to add this filter for
405  * @note If adding a connection-level output filter (i.e. where the type
406  * is >= AP_FTYPE_CONNECTION) during processing of a request, the request
407  * object r must be passed in to ensure the filter chains are modified
408  * correctly.  f->r will still be initialized as NULL in the new filter.
409  */
410 AP_DECLARE(ap_filter_t *) ap_add_output_filter(const char *name, void *ctx, 
411                                                request_rec *r, conn_rec *c);
412
413 /**
414  * Variant of ap_add_output_filter() that accepts a registered filter handle
415  * (as returned by ap_register_output_filter()) rather than a filter name
416  *
417  * @param f The filter handle to add
418  * @param r The request to add this filter for (or NULL if it isn't associated with a request)
419  * @param c The connection to add the filter for
420  * @note If adding a connection-level output filter (i.e. where the type
421  * is >= AP_FTYPE_CONNECTION) during processing of a request, the request
422  * object r must be passed in to ensure the filter chains are modified
423  * correctly.  f->r will still be initialized as NULL in the new filter.
424  */
425 AP_DECLARE(ap_filter_t *) ap_add_output_filter_handle(ap_filter_rec_t *f,
426                                                       void *ctx,
427                                                       request_rec *r,
428                                                       conn_rec *c);
429
430 /**
431  * Returns the filter handle for use with ap_add_output_filter_handle.
432  *
433  * @param name The filter name to look up
434  */
435 AP_DECLARE(ap_filter_rec_t *) ap_get_output_filter_handle(const char *name);
436
437 /**
438  * Remove an input filter from either the request or connection stack
439  * it is associated with.
440  * @param f The filter to remove
441  */
442
443 AP_DECLARE(void) ap_remove_input_filter(ap_filter_t *f);
444
445 /**
446  * Remove an output filter from either the request or connection stack
447  * it is associated with.
448  * @param f The filter to remove
449  */
450
451 AP_DECLARE(void) ap_remove_output_filter(ap_filter_t *f);
452
453 /* The next two filters are for abstraction purposes only.  They could be
454  * done away with, but that would require that we break modules if we ever
455  * want to change our filter registration method.  The basic idea, is that
456  * all filters have a place to store data, the ctx pointer.  These functions
457  * fill out that pointer with a bucket brigade, and retrieve that data on
458  * the next call.  The nice thing about these functions, is that they
459  * automatically concatenate the bucket brigades together for you.  This means
460  * that if you have already stored a brigade in the filters ctx pointer, then
461  * when you add more it will be tacked onto the end of that brigade.  When
462  * you retrieve data, if you pass in a bucket brigade to the get function,
463  * it will append the current brigade onto the one that you are retrieving.
464  */
465
466 /**
467  * prepare a bucket brigade to be setaside.  If a different brigade was 
468  * set-aside earlier, then the two brigades are concatenated together.
469  * @param f The current filter
470  * @param save_to The brigade that was previously set-aside.  Regardless, the
471  *             new bucket brigade is returned in this location.
472  * @param b The bucket brigade to save aside.  This brigade is always empty
473  *          on return
474  * @param p Ensure that all data in the brigade lives as long as this pool
475  */
476 AP_DECLARE(apr_status_t) ap_save_brigade(ap_filter_t *f,
477                                          apr_bucket_brigade **save_to,
478                                          apr_bucket_brigade **b, apr_pool_t *p);    
479
480 /**
481  * Flush function for apr_brigade_* calls.  This calls ap_pass_brigade
482  * to flush the brigade if the brigade buffer overflows.
483  * @param bb The brigade to flush
484  * @param ctx The filter to pass the brigade to
485  * @note this function has nothing to do with FLUSH buckets. It is simply
486  * a way to flush content out of a brigade and down a filter stack.
487  */
488 AP_DECLARE_NONSTD(apr_status_t) ap_filter_flush(apr_bucket_brigade *bb,
489                                                 void *ctx);
490
491 /**
492  * Flush the current brigade down the filter stack.
493  * @param f The filter we are passing to
494  * @param bb The brigade to flush
495  */
496 AP_DECLARE(apr_status_t) ap_fflush(ap_filter_t *f, apr_bucket_brigade *bb);
497
498 /**
499  * Write a buffer for the current filter, buffering if possible.
500  * @param f the filter we are writing to
501  * @param bb The brigade to buffer into
502  * @param data The data to write
503  * @param nbyte The number of bytes in the data
504  */
505 #define ap_fwrite(f, bb, data, nbyte) \
506         apr_brigade_write(bb, ap_filter_flush, f, data, nbyte)
507
508 /**
509  * Write a buffer for the current filter, buffering if possible.
510  * @param f the filter we are writing to
511  * @param bb The brigade to buffer into
512  * @param str The string to write
513  */
514 #define ap_fputs(f, bb, str) \
515         apr_brigade_puts(bb, ap_filter_flush, f, str)
516
517 /**
518  * Write a character for the current filter, buffering if possible.
519  * @param f the filter we are writing to
520  * @param bb The brigade to buffer into
521  * @param c The character to write
522  */
523 #define ap_fputc(f, bb, c) \
524         apr_brigade_putc(bb, ap_filter_flush, f, c)
525
526 /**
527  * Write an unspecified number of strings to the current filter
528  * @param f the filter we are writing to
529  * @param bb The brigade to buffer into
530  * @param ... The strings to write
531  */
532 AP_DECLARE_NONSTD(apr_status_t) ap_fputstrs(ap_filter_t *f,
533                                             apr_bucket_brigade *bb,
534                                             ...)
535 #if defined(__GNUC__) && __GNUC__ >= 4
536     __attribute__((sentinel))
537 #endif
538 ;
539
540 /**
541  * Output data to the filter in printf format
542  * @param f the filter we are writing to
543  * @param bb The brigade to buffer into
544  * @param fmt The format string
545  * @param ... The argumets to use to fill out the format string
546  */
547 AP_DECLARE_NONSTD(apr_status_t) ap_fprintf(ap_filter_t *f,
548                                            apr_bucket_brigade *bb,
549                                            const char *fmt,
550                                            ...)
551         __attribute__((format(printf,3,4)));                                    
552
553 /**
554  * set protocol requirements for an output content filter
555  * (only works with AP_FTYPE_RESOURCE and AP_FTYPE_CONTENT_SET)
556  * @param f the filter in question
557  * @param proto_flags Logical OR of AP_FILTER_PROTO_* bits
558  */
559 AP_DECLARE(void) ap_filter_protocol(ap_filter_t* f, unsigned int proto_flags);
560
561 /** Filter changes contents (so invalidating checksums/etc) */
562 #define AP_FILTER_PROTO_CHANGE 0x1
563
564 /** Filter changes length of contents (so invalidating content-length/etc) */
565 #define AP_FILTER_PROTO_CHANGE_LENGTH 0x2
566
567 /** Filter requires complete input and can't work on byteranges */
568 #define AP_FILTER_PROTO_NO_BYTERANGE 0x4
569
570 /** Filter should not run in a proxy */
571 #define AP_FILTER_PROTO_NO_PROXY 0x8
572
573 /** Filter makes output non-cacheable */
574 #define AP_FILTER_PROTO_NO_CACHE 0x10
575
576 /** Filter is incompatible with "Cache-Control: no-transform" */
577 #define AP_FILTER_PROTO_TRANSFORM 0x20
578
579 #ifdef __cplusplus
580 }
581 #endif
582
583 #endif  /* !AP_FILTER_H */