]> granicus.if.org Git - apache/blob - modules/http/http_request.c
* Notice a timeout as an error message. This might be valuable for detecting
[apache] / modules / http / http_request.c
1 /* Licensed to the Apache Software Foundation (ASF) under one or more
2  * contributor license agreements.  See the NOTICE file distributed with
3  * this work for additional information regarding copyright ownership.
4  * The ASF licenses this file to You under the Apache License, Version 2.0
5  * (the "License"); you may not use this file except in compliance with
6  * the License.  You may obtain a copy of the License at
7  *
8  *     http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16
17 /*
18  * http_request.c: functions to get and process requests
19  *
20  * Rob McCool 3/21/93
21  *
22  * Thoroughly revamped by rst for Apache.  NB this file reads
23  * best from the bottom up.
24  *
25  */
26
27 #include "apr_strings.h"
28 #include "apr_file_io.h"
29 #include "apr_fnmatch.h"
30
31 #define APR_WANT_STRFUNC
32 #include "apr_want.h"
33
34 #define CORE_PRIVATE
35 #include "ap_config.h"
36 #include "httpd.h"
37 #include "http_config.h"
38 #include "http_request.h"
39 #include "http_core.h"
40 #include "http_protocol.h"
41 #include "http_log.h"
42 #include "http_main.h"
43 #include "util_filter.h"
44 #include "util_charset.h"
45 #include "scoreboard.h"
46
47 #include "mod_core.h"
48
49 #if APR_HAVE_STDARG_H
50 #include <stdarg.h>
51 #endif
52
53 /*****************************************************************
54  *
55  * Mainline request processing...
56  */
57
58 /* XXX A cleaner and faster way to do this might be to pass the request_rec
59  * down the filter chain as a parameter.  It would need to change for
60  * subrequest vs. main request filters; perhaps the subrequest filter could
61  * make the switch.
62  */
63 static void update_r_in_filters(ap_filter_t *f,
64                                 request_rec *from,
65                                 request_rec *to)
66 {
67     while (f) {
68         if (f->r == from) {
69             f->r = to;
70         }
71         f = f->next;
72     }
73 }
74
75 AP_DECLARE(void) ap_die(int type, request_rec *r)
76 {
77     int error_index = ap_index_of_response(type);
78     char *custom_response = ap_response_code_string(r, error_index);
79     int recursive_error = 0;
80     request_rec *r_1st_err = r;
81
82     if (type == AP_FILTER_ERROR) {
83         return;
84     }
85
86     if (type == DONE) {
87         ap_finalize_request_protocol(r);
88         return;
89     }
90
91     /*
92      * The following takes care of Apache redirects to custom response URLs
93      * Note that if we are already dealing with the response to some other
94      * error condition, we just report on the original error, and give up on
95      * any attempt to handle the other thing "intelligently"...
96      */
97     if (r->status != HTTP_OK) {
98         recursive_error = type;
99
100         while (r_1st_err->prev && (r_1st_err->prev->status != HTTP_OK))
101             r_1st_err = r_1st_err->prev;  /* Get back to original error */
102
103         if (r_1st_err != r) {
104             /* The recursive error was caused by an ErrorDocument specifying
105              * an internal redirect to a bad URI.  ap_internal_redirect has
106              * changed the filter chains to point to the ErrorDocument's
107              * request_rec.  Back out those changes so we can safely use the
108              * original failing request_rec to send the canned error message.
109              *
110              * ap_send_error_response gets rid of existing resource filters
111              * on the output side, so we can skip those.
112              */
113             update_r_in_filters(r_1st_err->proto_output_filters, r, r_1st_err);
114             update_r_in_filters(r_1st_err->input_filters, r, r_1st_err);
115         }
116
117         custom_response = NULL; /* Do NOT retry the custom thing! */
118     }
119
120     r->status = type;
121
122     /*
123      * This test is done here so that none of the auth modules needs to know
124      * about proxy authentication.  They treat it like normal auth, and then
125      * we tweak the status.
126      */
127     if (HTTP_UNAUTHORIZED == r->status && PROXYREQ_PROXY == r->proxyreq) {
128         r->status = HTTP_PROXY_AUTHENTICATION_REQUIRED;
129     }
130
131     /* If we don't want to keep the connection, make sure we mark that the
132      * connection is not eligible for keepalive.  If we want to keep the
133      * connection, be sure that the request body (if any) has been read.
134      */
135     if (ap_status_drops_connection(r->status)) {
136         r->connection->keepalive = AP_CONN_CLOSE;
137     }
138
139     /*
140      * Two types of custom redirects --- plain text, and URLs. Plain text has
141      * a leading '"', so the URL code, here, is triggered on its absence
142      */
143
144     if (custom_response && custom_response[0] != '"') {
145
146         if (ap_is_url(custom_response)) {
147             /*
148              * The URL isn't local, so lets drop through the rest of this
149              * apache code, and continue with the usual REDIRECT handler.
150              * But note that the client will ultimately see the wrong
151              * status...
152              */
153             r->status = HTTP_MOVED_TEMPORARILY;
154             apr_table_setn(r->headers_out, "Location", custom_response);
155         }
156         else if (custom_response[0] == '/') {
157             const char *error_notes;
158             r->no_local_copy = 1;       /* Do NOT send HTTP_NOT_MODIFIED for
159                                          * error documents! */
160             /*
161              * This redirect needs to be a GET no matter what the original
162              * method was.
163              */
164             apr_table_setn(r->subprocess_env, "REQUEST_METHOD", r->method);
165
166             /*
167              * Provide a special method for modules to communicate
168              * more informative (than the plain canned) messages to us.
169              * Propagate them to ErrorDocuments via the ERROR_NOTES variable:
170              */
171             if ((error_notes = apr_table_get(r->notes,
172                                              "error-notes")) != NULL) {
173                 apr_table_setn(r->subprocess_env, "ERROR_NOTES", error_notes);
174             }
175             r->method = apr_pstrdup(r->pool, "GET");
176             r->method_number = M_GET;
177             ap_internal_redirect(custom_response, r);
178             return;
179         }
180         else {
181             /*
182              * Dumb user has given us a bad url to redirect to --- fake up
183              * dying with a recursive server error...
184              */
185             recursive_error = HTTP_INTERNAL_SERVER_ERROR;
186             ap_log_rerror(APLOG_MARK, APLOG_ERR, 0, r,
187                         "Invalid error redirection directive: %s",
188                         custom_response);
189         }
190     }
191     ap_send_error_response(r_1st_err, recursive_error);
192 }
193
194 static void check_pipeline(conn_rec *c)
195 {
196     /* ### is zero correct? that means "read one line" */
197     if (c->keepalive != AP_CONN_CLOSE) {
198         apr_bucket_brigade *bb = apr_brigade_create(c->pool, c->bucket_alloc);
199         if (ap_get_brigade(c->input_filters, bb, AP_MODE_EATCRLF,
200                        APR_NONBLOCK_READ, 0) != APR_SUCCESS) {
201             c->data_in_input_filters = 0;  /* we got APR_EOF or an error */
202         }
203         else {
204             c->data_in_input_filters = 1;
205         }
206     }
207 }
208
209
210 void ap_process_async_request(request_rec *r)
211 {
212     int access_status;
213     apr_bucket_brigade *bb;
214     apr_bucket *b;
215     conn_rec *c = r->connection;
216
217     /* Give quick handlers a shot at serving the request on the fast
218      * path, bypassing all of the other Apache hooks.
219      *
220      * This hook was added to enable serving files out of a URI keyed
221      * content cache ( e.g., Mike Abbott's Quick Shortcut Cache,
222      * described here: http://oss.sgi.com/projects/apache/mod_qsc.html )
223      *
224      * It may have other uses as well, such as routing requests directly to
225      * content handlers that have the ability to grok HTTP and do their
226      * own access checking, etc (e.g. servlet engines).
227      *
228      * Use this hook with extreme care and only if you know what you are
229      * doing.
230      */
231     if (ap_extended_status)
232         ap_time_process_request(r->connection->sbh, START_PREQUEST);
233     access_status = ap_run_quick_handler(r, 0);  /* Not a look-up request */
234     if (access_status == DECLINED) {
235         access_status = ap_process_request_internal(r);
236         if (access_status == OK) {
237             access_status = ap_invoke_handler(r);
238         }
239     }
240
241     if (access_status == DONE) {
242         /* e.g., something not in storage like TRACE */
243         access_status = OK;
244     }
245
246     if (access_status == OK) {
247         ap_finalize_request_protocol(r);
248     }
249     else {
250         r->status = HTTP_OK;
251         ap_die(access_status, r);
252     }
253
254     /* Send an EOR bucket through the output filter chain.  When
255      * this bucket is destroyed, the request will be logged and
256      * its pool will be freed
257      */
258     bb = apr_brigade_create(r->connection->pool, r->connection->bucket_alloc);
259     b = ap_bucket_eor_create(r->connection->bucket_alloc, r);
260     APR_BRIGADE_INSERT_HEAD(bb, b);
261     ap_pass_brigade(r->connection->output_filters, bb);
262
263     /* From here onward, it is no longer safe to reference r
264      * or r->pool, because r->pool may have been destroyed
265      * already by the EOR bucket's cleanup function.
266      */
267
268     c->cs->state = CONN_STATE_WRITE_COMPLETION;
269     check_pipeline(c);
270     if (ap_extended_status)
271         ap_time_process_request(c->sbh, STOP_PREQUEST);
272 }
273
274 void ap_process_request(request_rec *r)
275 {
276     apr_bucket_brigade *bb;
277     apr_bucket *b;
278     conn_rec *c = r->connection;
279     apr_status_t rv;
280
281     ap_process_async_request(r);
282
283     if (!c->data_in_input_filters) {
284         bb = apr_brigade_create(c->pool, c->bucket_alloc);
285         b = apr_bucket_flush_create(c->bucket_alloc);
286         APR_BRIGADE_INSERT_HEAD(bb, b);
287         rv = ap_pass_brigade(c->output_filters, bb);
288         if (rv == APR_TIMEUP) {
289             /*
290              * Notice a timeout as an error message. This might be
291              * valuable for detecting clients with broken network
292              * connections or possible DoS attacks.
293              *
294              * It is still save to use r / r->pool here as the eor bucket
295              * could not have been destroyed in the event of a timeout.
296              */
297             ap_log_rerror(APLOG_MARK, APLOG_ERR, rv, r,
298                           "Timeout while writing data for URI %s to the"
299                           " client", r->unparsed_uri);
300         }
301     }
302     if (ap_extended_status) {
303         ap_time_process_request(c->sbh, STOP_PREQUEST);
304     }
305 }
306
307 static apr_table_t *rename_original_env(apr_pool_t *p, apr_table_t *t)
308 {
309     const apr_array_header_t *env_arr = apr_table_elts(t);
310     const apr_table_entry_t *elts = (const apr_table_entry_t *) env_arr->elts;
311     apr_table_t *new = apr_table_make(p, env_arr->nalloc);
312     int i;
313
314     for (i = 0; i < env_arr->nelts; ++i) {
315         if (!elts[i].key)
316             continue;
317         apr_table_setn(new, apr_pstrcat(p, "REDIRECT_", elts[i].key, NULL),
318                   elts[i].val);
319     }
320
321     return new;
322 }
323
324 static request_rec *internal_internal_redirect(const char *new_uri,
325                                                request_rec *r) {
326     int access_status;
327     request_rec *new;
328
329     if (ap_is_recursion_limit_exceeded(r)) {
330         ap_die(HTTP_INTERNAL_SERVER_ERROR, r);
331         return NULL;
332     }
333
334     new = (request_rec *) apr_pcalloc(r->pool, sizeof(request_rec));
335
336     new->connection = r->connection;
337     new->server     = r->server;
338     new->pool       = r->pool;
339
340     /*
341      * A whole lot of this really ought to be shared with http_protocol.c...
342      * another missing cleanup.  It's particularly inappropriate to be
343      * setting header_only, etc., here.
344      */
345
346     new->method          = r->method;
347     new->method_number   = r->method_number;
348     new->allowed_methods = ap_make_method_list(new->pool, 2);
349     ap_parse_uri(new, new_uri);
350
351     new->request_config = ap_create_request_config(r->pool);
352
353     new->per_dir_config = r->server->lookup_defaults;
354
355     new->prev = r;
356     r->next   = new;
357
358     /* Must have prev and next pointers set before calling create_request
359      * hook.
360      */
361     ap_run_create_request(new);
362
363     /* Inherit the rest of the protocol info... */
364
365     new->the_request = r->the_request;
366
367     new->allowed         = r->allowed;
368
369     new->status          = r->status;
370     new->assbackwards    = r->assbackwards;
371     new->header_only     = r->header_only;
372     new->protocol        = r->protocol;
373     new->proto_num       = r->proto_num;
374     new->hostname        = r->hostname;
375     new->request_time    = r->request_time;
376     new->main            = r->main;
377
378     new->headers_in      = r->headers_in;
379     new->headers_out     = apr_table_make(r->pool, 12);
380     new->err_headers_out = r->err_headers_out;
381     new->subprocess_env  = rename_original_env(r->pool, r->subprocess_env);
382     new->notes           = apr_table_make(r->pool, 5);
383     new->allowed_methods = ap_make_method_list(new->pool, 2);
384
385     new->htaccess        = r->htaccess;
386     new->no_cache        = r->no_cache;
387     new->expecting_100   = r->expecting_100;
388     new->no_local_copy   = r->no_local_copy;
389     new->read_length     = r->read_length;     /* We can only read it once */
390     new->vlist_validator = r->vlist_validator;
391
392     new->proto_output_filters  = r->proto_output_filters;
393     new->proto_input_filters   = r->proto_input_filters;
394
395     new->output_filters  = new->proto_output_filters;
396     new->input_filters   = new->proto_input_filters;
397
398     if (new->main) {
399         /* Add back the subrequest filter, which we lost when
400          * we set output_filters to include only the protocol
401          * output filters from the original request.
402          */
403         ap_add_output_filter_handle(ap_subreq_core_filter_handle,
404                                     NULL, new, new->connection);
405     }
406
407     update_r_in_filters(new->input_filters, r, new);
408     update_r_in_filters(new->output_filters, r, new);
409
410     apr_table_setn(new->subprocess_env, "REDIRECT_STATUS",
411                    apr_itoa(r->pool, r->status));
412
413     /*
414      * XXX: hmm.  This is because mod_setenvif and mod_unique_id really need
415      * to do their thing on internal redirects as well.  Perhaps this is a
416      * misnamed function.
417      */
418     if ((access_status = ap_run_post_read_request(new))) {
419         ap_die(access_status, new);
420         return NULL;
421     }
422
423     return new;
424 }
425
426 /* XXX: Is this function is so bogus and fragile that we deep-6 it? */
427 AP_DECLARE(void) ap_internal_fast_redirect(request_rec *rr, request_rec *r)
428 {
429     /* We need to tell POOL_DEBUG that we're guaranteeing that rr->pool
430      * will exist as long as r->pool.  Otherwise we run into troubles because
431      * some values in this request will be allocated in r->pool, and others in
432      * rr->pool.
433      */
434     apr_pool_join(r->pool, rr->pool);
435     r->proxyreq = rr->proxyreq;
436     r->no_cache = (r->no_cache && rr->no_cache);
437     r->no_local_copy = (r->no_local_copy && rr->no_local_copy);
438     r->mtime = rr->mtime;
439     r->uri = rr->uri;
440     r->filename = rr->filename;
441     r->canonical_filename = rr->canonical_filename;
442     r->path_info = rr->path_info;
443     r->args = rr->args;
444     r->finfo = rr->finfo;
445     r->handler = rr->handler;
446     ap_set_content_type(r, rr->content_type);
447     r->content_encoding = rr->content_encoding;
448     r->content_languages = rr->content_languages;
449     r->per_dir_config = rr->per_dir_config;
450     /* copy output headers from subrequest, but leave negotiation headers */
451     r->notes = apr_table_overlay(r->pool, rr->notes, r->notes);
452     r->headers_out = apr_table_overlay(r->pool, rr->headers_out,
453                                        r->headers_out);
454     r->err_headers_out = apr_table_overlay(r->pool, rr->err_headers_out,
455                                            r->err_headers_out);
456     r->subprocess_env = apr_table_overlay(r->pool, rr->subprocess_env,
457                                           r->subprocess_env);
458
459     r->output_filters = rr->output_filters;
460     r->input_filters = rr->input_filters;
461
462     if (r->main) {
463         ap_add_output_filter_handle(ap_subreq_core_filter_handle,
464                                     NULL, r, r->connection);
465     }
466     else if (r->output_filters->frec == ap_subreq_core_filter_handle) {
467         ap_remove_output_filter(r->output_filters);
468         r->output_filters = r->output_filters->next;
469     }
470
471     /* If any filters pointed at the now-defunct rr, we must point them
472      * at our "new" instance of r.  In particular, some of rr's structures
473      * will now be bogus (say rr->headers_out).  If a filter tried to modify
474      * their f->r structure when it is pointing to rr, the real request_rec
475      * will not get updated.  Fix that here.
476      */
477     update_r_in_filters(r->input_filters, rr, r);
478     update_r_in_filters(r->output_filters, rr, r);
479 }
480
481 AP_DECLARE(void) ap_internal_redirect(const char *new_uri, request_rec *r)
482 {
483     request_rec *new = internal_internal_redirect(new_uri, r);
484     int access_status;
485
486     /* ap_die was already called, if an error occured */
487     if (!new) {
488         return;
489     }
490
491     access_status = ap_run_quick_handler(new, 0);  /* Not a look-up request */
492     if (access_status == DECLINED) {
493         access_status = ap_process_request_internal(new);
494         if (access_status == OK) {
495             access_status = ap_invoke_handler(new);
496         }
497     }
498     if (access_status == OK) {
499         ap_finalize_request_protocol(new);
500     }
501     else {
502         ap_die(access_status, new);
503     }
504 }
505
506 /* This function is designed for things like actions or CGI scripts, when
507  * using AddHandler, and you want to preserve the content type across
508  * an internal redirect.
509  */
510 AP_DECLARE(void) ap_internal_redirect_handler(const char *new_uri, request_rec *r)
511 {
512     int access_status;
513     request_rec *new = internal_internal_redirect(new_uri, r);
514
515     /* ap_die was already called, if an error occured */
516     if (!new) {
517         return;
518     }
519
520     if (r->handler)
521         ap_set_content_type(new, r->content_type);
522     access_status = ap_process_request_internal(new);
523     if (access_status == OK) {
524         if ((access_status = ap_invoke_handler(new)) != 0) {
525             ap_die(access_status, new);
526             return;
527         }
528         ap_finalize_request_protocol(new);
529     }
530     else {
531         ap_die(access_status, new);
532     }
533 }
534
535 AP_DECLARE(void) ap_allow_methods(request_rec *r, int reset, ...)
536 {
537     const char *method;
538     va_list methods;
539
540     /*
541      * Get rid of any current settings if requested; not just the
542      * well-known methods but any extensions as well.
543      */
544     if (reset) {
545         ap_clear_method_list(r->allowed_methods);
546     }
547
548     va_start(methods, reset);
549     while ((method = va_arg(methods, const char *)) != NULL) {
550         ap_method_list_add(r->allowed_methods, method);
551     }
552     va_end(methods);
553 }
554
555 AP_DECLARE(void) ap_allow_standard_methods(request_rec *r, int reset, ...)
556 {
557     int method;
558     va_list methods;
559     apr_int64_t mask;
560
561     /*
562      * Get rid of any current settings if requested; not just the
563      * well-known methods but any extensions as well.
564      */
565     if (reset) {
566         ap_clear_method_list(r->allowed_methods);
567     }
568
569     mask = 0;
570     va_start(methods, reset);
571     while ((method = va_arg(methods, int)) != -1) {
572         mask |= (AP_METHOD_BIT << method);
573     }
574     va_end(methods);
575
576     r->allowed_methods->method_mask |= mask;
577 }