]> granicus.if.org Git - apache/blob - docs/manual/caching.xml.fr
Updates.
[apache] / docs / manual / caching.xml.fr
1 <?xml version="1.0" encoding="ISO-8859-1" ?>
2 <!DOCTYPE manualpage SYSTEM "style/manualpage.dtd">
3 <?xml-stylesheet type="text/xsl" href="style/manual.fr.xsl"?>
4 <!-- French translation : Lucien GENTIS -->
5 <!-- Reviewed by : Vincent Deffontaines -->
6 <!-- English Revision : 1174747 -->
7
8 <!--
9  Licensed to the Apache Software Foundation (ASF) under one or more
10  contributor license agreements.  See the NOTICE file distributed with
11  this work for additional information regarding copyright ownership.
12  The ASF licenses this file to You under the Apache License, Version 2.0
13  (the "License"); you may not use this file except in compliance with
14  the License.  You may obtain a copy of the License at
15
16      http://www.apache.org/licenses/LICENSE-2.0
17
18  Unless required by applicable law or agreed to in writing, software
19  distributed under the License is distributed on an "AS IS" BASIS,
20  WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
21  See the License for the specific language governing permissions and
22  limitations under the License.
23 -->
24
25 <manualpage metafile="caching.xml.meta">
26
27   <title>Guide de la mise en cache</title>
28
29   <summary>
30     <p>Ce document compl&egrave;te la documentation de r&eacute;f&eacute;rence des modules
31     <module>mod_cache</module>, <module>mod_cache_disk</module>,
32     <module>mod_file_cache</module> et du programme <a
33     href="programs/htcacheclean.html">htcacheclean</a>.
34     Il d&eacute;crit l'utilisation des fonctionnalit&eacute;s de mise en
35     cache du serveur HTTP Apache
36     pour acc&eacute;l&eacute;rer les services web et proxy, tout en &eacute;vitant les probl&egrave;mes
37     courants et les erreurs de configuration.</p>
38   </summary>
39
40   <section id="introduction">
41     <title>Introduction</title>
42
43     <p>Depuis la version 2.2 du serveur HTTP Apache, les modules
44     <module>mod_cache</module>
45     et <module>mod_file_cache</module> ne sont plus jug&eacute;s exp&eacute;rimentaux
46     et on consid&egrave;re qu'ils peuvent &ecirc;tre utilis&eacute;s en production. Ces
47     architectures de mise en cache constituent un puissant concept
48     d'acc&eacute;l&eacute;ration de la gestion HTTP, tant comme serveur web originel
49     que comme mandataire.</p>
50
51     <p>Le module <module>mod_cache</module> et son module de soutien
52     <module>mod_cache_disk</module>
53     permettent une mise en cache intelligente du point de vue HTTP.
54     Le contenu proprement dit est stock&eacute; dans le cache,
55     et mod_cache tente d'honorer tous les en-t&ecirc;tes HTTP et les options
56     qui d&eacute;finissent la possibilit&eacute; de mise en cache du contenu. Il g&egrave;re non
57     seulement le contenu local, mais aussi le contenu mandat&eacute;.
58     <module>mod_cache</module>
59     est con&ccedil;u pour des configurations de mise en cache simples ou complexes,
60     dans lesquels vous traitez de contenu mandat&eacute;, de contenu local dynamique
61     ou avez besoin d'acc&eacute;l&eacute;rer l'acc&egrave;s &agrave; des fichiers locaux qui sont modifi&eacute;s
62     au cours du temps.</p>
63
64     <p>Le module <module>mod_file_cache</module> quant &agrave; lui, constitue une
65     forme de mise en cache plus basique, mais quelques fois int&eacute;ressante.
66     Plut&ocirc;t que de g&eacute;rer la complexit&eacute; de s'assurer de mani&egrave;re active de la
67     possibilit&eacute; de mise en cache d'URLs,
68     <module>mod_file_cache</module> fournit des m&eacute;thodes pour la gestion
69     et l'&eacute;dition de fichiers en m&eacute;moire afin de maintenir un cache de fichiers
70     dans l'&eacute;tat o&ugrave; ils &eacute;taient la derni&egrave;re
71     fois qu'httpd a d&eacute;marr&eacute;.
72     En tant que tel, <module>mod_file_cache</module> a &eacute;t&eacute; con&ccedil;u pour am&eacute;liorer
73     le temps d'acc&egrave;s &agrave; des fichiers locaux statiques qui ne sont modifi&eacute;s
74     que rarement.</p>
75
76     <p>Etant donn&eacute; que <module>mod_file_cache</module> constitue une
77     impl&eacute;mentation de mise en cache relativement simple, mises &agrave; part les
78     sections sp&eacute;cifiques sur les directives <directive
79     module="mod_file_cache">CacheFile</directive> et <directive
80     module="mod_file_cache">MMapFile</directive>, les explications fournies
81     dans ce guide concernent l'architecture de mise en cache du
82     module <module>mod_cache</module>.</p>
83
84     <p>Pour tirer parti efficacement de ce document, les bases de HTTP doivent
85     vous &ecirc;tre famili&egrave;res, et vous devez avoir lu les sections
86     <a href="urlmapping.html">Mise en correspondance des
87     URLs avec le syst&egrave;me de fichiers</a> et
88     <a href="content-negotiation.html">N&eacute;gociation sur le contenu</a>
89     du guide de l'utilisateur.</p>
90
91   </section>
92
93   <section id="overview">
94
95     <title>Vue d'ensemble de la mise en cache</title>
96
97     <related>
98       <modulelist>
99         <module>mod_cache</module>
100         <module>mod_cache_disk</module>
101         <module>mod_file_cache</module>
102       </modulelist>
103       <directivelist>
104         <directive module="mod_cache">CacheEnable</directive>
105         <directive module="mod_cache">CacheDisable</directive>
106         <directive module="mod_file_cache">CacheFile</directive>
107         <directive module="mod_file_cache">MMapFile</directive>
108         <directive module="core">UseCanonicalName</directive>
109         <directive module="mod_negotiation">CacheNegotiatedDocs</directive>
110       </directivelist>
111     </related>
112
113     <p><module>mod_cache</module> peut faire intervenir deux phases
114     principales pendant la dur&eacute;e de vie d'une requ&ecirc;te.
115     En premier lieu, <module>mod_cache</module>
116     est un module de mise en correspondance d'URLs, ce qui signifie que si
117     une URL a &eacute;t&eacute; mise en cache, et que la version du cache de cette URL n'est
118     pas arriv&eacute;e &agrave; expiration, la requ&ecirc;te sera trait&eacute;e directement par
119     <module>mod_cache</module>.</p>
120
121     <p>Ceci entra&icirc;ne que toutes autres actions qui se d&eacute;rouleraient normalement
122     au cours du processus de traitement d'une requ&ecirc;te -- par exemple un
123     traitement effectu&eacute; par <module>mod_proxy</module>, ou
124     <module>mod_rewrite</module> --
125     ne seront pas effectu&eacute;es.  Mais c'est justement l'int&eacute;r&ecirc;t
126     de la mise en cache pr&eacute;alable du contenu.</p>
127
128     <p>Si l'URL ne se trouve pas dans le cache, <module>mod_cache</module>
129     va ajouter un <a href="filter.html">filtre</a> au traitement de la requ&ecirc;te.
130     Une fois le contenu localis&eacute; par httpd selon la conception courante, le
131     filtre sera ex&eacute;cut&eacute; en m&ecirc;me temps que le contenu sera servi.
132     S'il est d&eacute;termin&eacute; que le contenu peut &ecirc;tre mis en cache,
133     il sera sauvegard&eacute; dans le cache pour une utilisation future.</p>
134
135     <p>Si l'URL se trouve dans le cache, mais est arriv&eacute;e &agrave; expiration,
136     le filtre est quand-m&ecirc;me ajout&eacute;, mais <module>mod_cache</module> va cr&eacute;er
137     une requ&ecirc;te conditionnelle en arri&egrave;re-plan, pour d&eacute;terminer si la version
138     du cache est encore &agrave; jour. Si la version du cache est encore &agrave; jour, ses
139     meta-informations seront mises &agrave; jour et la requ&ecirc;te sera servie &agrave; partir du
140     cache. Si la version du contenu n'est plus &agrave; jour, elle sera supprim&eacute;e et le
141     filtre va sauvegarder le contenu mis &agrave; jour dans le cache
142     au moment o&ugrave; il sera servi.</p>
143
144     <section>
145       <title>Am&eacute;lioration du taux de pr&eacute;sence dans le cache</title>
146
147       <p>Lors de la mise en cache de contenu g&eacute;n&eacute;r&eacute; localement, le
148       positionnement de la directive
149       <directive module="core">UseCanonicalName</directive> &agrave;
150       <code>On</code> peut am&eacute;liorer de mani&egrave;re spectaculaire le taux de
151       pr&eacute;sence dans le cache. Ceci est du au fait que le nom d'h&ocirc;te de l'h&ocirc;te
152       virtuel qui sert le contenu constitue une partie de la cl&eacute; de cache.
153       Avec <directive module="core">UseCanonicalName</directive> positionn&eacute;e
154       &agrave; <code>On</code>,
155       les h&ocirc;tes virtuels poss&eacute;dant plusieurs noms de serveur ou alias ne
156       g&eacute;n&eacute;reront pas d'entit&eacute;s de cache diff&eacute;rentes, et le contenu sera mis en
157       cache en faisant r&eacute;f&eacute;rence au nom d'h&ocirc;te canonique.</p>
158
159       <p>Les documents mis en cache ne seront servis qu'en r&eacute;ponse &agrave; des
160       requ&ecirc;tes de type URL, car la mise en cache est effectu&eacute;e lors de la phase
161       de traduction de l'URL en nom de fichier.
162       En g&eacute;n&eacute;ral, cela n'a que peu d'effet, &agrave; moins que vous n'utilisiez les
163       <a href="howto/ssi.html">Inclusions C&ocirc;t&eacute; Serveur (SSI)</a>;</p>
164
165       <example>
166 &lt;!-- L'inclusion suivante peut &ecirc;tre mise en cache --&gt;<br />
167 &lt;!--#include virtual="/footer.html" --&gt;<br />
168 <br />
169 &lt;!-- L'inclusion suivante ne peut pas &ecirc;tre mise en cache --&gt;<br />
170 &lt;!--#include file="/path/to/footer.html" --&gt; <br />
171       </example>
172
173       <p>Si vous utilisez les SSI, et voulez b&eacute;n&eacute;ficier de la vitesse de
174       service depuis le cache, vous devez utiliser des inclusions de type
175       <code>virtual</code>.</p>
176     </section>
177
178     <section>
179       <title>P&eacute;riodes d'expiration</title>
180
181       <p>La p&eacute;riode d'expiration par d&eacute;faut pour les entit&eacute;s du cache est
182       d'une heure; elle peut cependant &ecirc;tre facilement modifi&eacute;e &agrave; l'aide de
183       la directive <directive
184       module="mod_cache">CacheDefaultExpire</directive>. Cette valeur par
185       d&eacute;faut n'est utilis&eacute;e que lorsque la source originale du contenu ne
186       pr&eacute;cise pas de p&eacute;riode d'expiration ou d'heure de derni&egrave;re
187       modification.</p>
188
189       <p>Si une r&eacute;ponse ne contient pas d'en-t&ecirc;te <code>Expires</code> mais
190       inclut un en-t&ecirc;te <code>Last-Modified</code>, <module>mod_cache</module>
191       peut d&eacute;duire une p&eacute;riode d'expiration en se basant sur la valeur de la
192       directive <directive
193       module="mod_cache">CacheLastModifiedFactor</directive>.</p>
194
195       <p>La p&eacute;riode d'expiration des contenus locaux peut &ecirc;tre ajust&eacute;e finement
196       en utilisant le module <module>mod_expires</module>.</p>
197
198       <p>On peut aussi contr&ocirc;ler la p&eacute;riode d'expiration maximale en utilisant
199       la directive <directive module="mod_cache">CacheMaxExpire</directive>.</p>
200
201     </section>
202
203     <section>
204       <title>Guide succinct des requ&ecirc;tes conditionnelles</title>
205
206       <p>Lorsqu'un contenu est arriv&eacute; &agrave; expiration dans le cache et fait
207       l'objet d'une nouvelle demande d'acc&egrave;s, plut&ocirc;t que traiter directement
208       la requ&ecirc;te originale, httpd pr&eacute;f&egrave;re utiliser une
209       requ&ecirc;te conditionnelle.</p>
210
211       <p>HTTP propose toute une panoplie d'en-t&ecirc;tes qui permettent &agrave; un client,
212       ou au cache de distinguer les diff&eacute;rentes versions d'un m&ecirc;me contenu. Par
213       exemple, si une ressource a &eacute;t&eacute; servie avec un en-t&ecirc;te "Etag:", il est
214       possible de cr&eacute;er une requ&ecirc;te conditionnelle contenant un en-t&ecirc;te
215       "If-None-Match:". Si une ressource a &eacute;t&eacute; servie avec un en-t&ecirc;te
216       "Last-Modified:", il est possible de cr&eacute;er une requ&ecirc;te conditionnelle
217       contenant un en-t&ecirc;te "If-Modified-Since:", etc....</p>
218
219       <p>Lorsqu'une telle requ&ecirc;te conditionnelle est cr&eacute;&eacute;e, la reponse diff&egrave;re
220       selon que le contenu satisfait ou non aux conditions. Si une requ&ecirc;te est
221       cr&eacute;&eacute;e avec un en-t&ecirc;te "If-Modified-Since:", et le contenu n'a pas &eacute;t&eacute;
222       modifi&eacute; depuis le moment indiqu&eacute; dans la requ&ecirc;te, alors un laconique
223       "304 Not Modified" est retourn&eacute;.</p>
224
225       <p>Si le contenu a &eacute;t&eacute; modifi&eacute;, il est servi comme si la requ&ecirc;te n'avait
226       pas &eacute;t&eacute; conditionnelle &agrave; l'origine.</p>
227
228       <p>Les b&eacute;n&eacute;fices des requ&ecirc;tes conditionnelles pour ce qui concerne la
229       mise en cache sont de deux sortes. Premi&egrave;rement, quand une telle requ&ecirc;te
230       est envoy&eacute;e au processus en arri&egrave;re-plan, il sera ais&eacute; de d&eacute;terminer
231       si le contenu que devra servir le processus en arri&egrave;re-plan correspond
232       au contenu stock&eacute; dans le cache, sans &ecirc;tre oblig&eacute; de transmettre la
233       totalit&eacute; de la ressource.</p>
234
235       <p>Deuxi&egrave;mement, les requ&ecirc;tes conditionnelles sont en g&eacute;n&eacute;ral moins
236       co&ucirc;teuses en ressources pour le processus en arri&egrave;re-plan.
237       Pour ce qui est des fichiers
238       statiques, l'action type est un appel &agrave; <code>stat()</code> ou un appel
239       syst&egrave;me similaire, pour d&eacute;terminer si la taille du fichier ou sa date de
240       modification ont chang&eacute;. Ainsi, m&ecirc;me si httpd met en cache le contenu
241       local, un contenu arriv&eacute; &agrave; expiration pourra &ecirc;tre servi plus rapidement
242       depuis le cache s'il n'a pas &eacute;t&eacute; modifi&eacute;, parce que la lecture depuis le
243       cache est plus rapide que la lecture depuis le processus en arri&egrave;re-plan
244       (&agrave; comparer &agrave; la diff&eacute;rence de vitesse entre la lecture depuis un cache en
245       m&eacute;moire avec <module>mod_cache_disk</module> et la lecture depuis un disque).</p>
246     </section>
247
248     <section>
249       <title>Que peut-on mettre en cache ?</title>
250
251       <p>Comme mentionn&eacute; plus haut, les deux styles de mise en
252       cache de httpd
253       fonctionnent diff&eacute;remment; la mise en cache de
254       <module>mod_file_cache</module> conserve les contenus des fichiers
255       tels qu'ils &eacute;taient au d&eacute;marrage de httpd. Quand une requ&ecirc;te pour un
256       fichier mis en cache par ce module est envoy&eacute;e, elle est intercept&eacute;e
257       et le fichier mis en cache est servi.</p>
258
259       <p>La mise en cache de <module>mod_cache</module>, quant &agrave; elle, est
260       plus complexe. Lors du traitement d'une requ&ecirc;te, le module de mise en
261       cache d&eacute;terminera si le contenu peut &ecirc;tre mis en cache, s'il ne l'a
262       pas d&eacute;j&agrave; &eacute;t&eacute; auparavant. Les conditions qui permettent de d&eacute;terminer
263       la possibilit&eacute; de mise en cache d'une r&eacute;ponse sont :</p>
264
265       <ol>
266         <li>La mise en cache doit &ecirc;tre activ&eacute;e pour cette URL. Voir les
267         directives <directive
268         module="mod_cache">CacheEnable</directive> et <directive
269         module="mod_cache">CacheDisable</directive>.</li>
270
271         <li>La reponse doit avoir un code de statut HTTP de 200, 203, 300, 301
272         ou 410.</li>
273
274         <li>La requ&ecirc;te doit &ecirc;tre de type HTTP GET.</li>
275
276         <li>Si la requ&ecirc;te contient un en-t&ecirc;te "Authorization:", la r&eacute;ponse ne
277         sera pas mise en cache.</li>
278
279         <li>Si la r&eacute;ponse contient un en-t&ecirc;te "Authorization:", elle doit aussi
280         contenir une option "s-maxage", "must-revalidate" ou "public"
281         dans l'en-t&ecirc;te "Cache-Control:".</li>
282
283         <li>Si l'URL contient une cha&icirc;ne de requ&ecirc;te
284         (provenant par exemple d'une m&eacute;thode GET de formulaire HTML), elle ne
285         sera pas mise en cache, &agrave; moins que la r&eacute;ponse ne
286         sp&eacute;cifie explicitement un d&eacute;lai d'expiration via un
287         en-t&ecirc;te "Expires:" ou une directive max-age ou s-maxage de
288         l'en-t&ecirc;te "Cache-Control:" comme indiqu&eacute; dans les
289         sections 13.2.1. et 13.9 de la RFC2616.</li>
290
291         <li>Si la r&eacute;ponse a un statut de 200 (OK), elle doit aussi contenir
292         au moins un des en-t&ecirc;tes "Etag", "Last-Modified" ou
293         "Expires", ou une directive max-age ou s-maxage de
294         l'en-t&ecirc;te "Cache-Control:", &agrave; moins que la directive
295         <directive module="mod_cache">CacheIgnoreNoLastMod</directive>
296         ne pr&eacute;cise d'autres contraintes.</li>
297
298         <li>Si la r&eacute;ponse contient l'option "private" dans un en-t&ecirc;te
299         "Cache-Control:", elle ne sera pas mise en cache &agrave; moins que la
300         directive
301         <directive module="mod_cache">CacheStorePrivate</directive>
302         ne pr&eacute;cise d'autres contraintes.</li>
303
304         <li>De m&ecirc;me, si la r&eacute;ponse contient l'option "no-store" dans un en-t&ecirc;te
305         "Cache-Control:", elle ne sera pas mise en cache &agrave; moins que la
306         directive
307         <directive module="mod_cache">CacheStoreNoStore</directive>
308         n'ait &eacute;t&eacute; utilis&eacute;e.</li>
309
310         <li>Une r&eacute;ponse ne sera pas mise en cache si elle comporte un en-t&ecirc;te
311         "Vary:" contenant le caract&egrave;re "*" qui correspond &agrave; toute
312         cha&icirc;ne de caract&egrave;res.</li>
313       </ol>
314     </section>
315
316     <section>
317       <title>Qu'est ce qui ne doit pas &ecirc;tre mis en cache ?</title>
318
319       <p>En bref, tout contenu qui varie beaucoup avec le temps, ou en fonction
320       de particularit&eacute;s de la requ&ecirc;te qui ne sont pas couvertes par la
321       n&eacute;gociation HTTP, ne doit pas &ecirc;tre mis en cache.</p>
322
323       <p>Un contenu dynamique qui varie en fonction de l'adresse IP du
324       demandeur, ou est modifi&eacute; toutes les 5 minutes, ne devra en g&eacute;n&eacute;ral
325       pas &ecirc;tre mis en cache.</p>
326
327       <p>Si par contre le contenu servi diff&egrave;re en fonction de la valeur de
328       divers en-t&ecirc;tes HTTP, il se peut que l'on puisse le mettre en cache
329       intelligemment en utilisant un en-t&ecirc;te "Vary".</p>
330     </section>
331
332     <section>
333       <title>Contenu variable et/ou n&eacute;goci&eacute;</title>
334
335       <p>Si <module>mod_cache</module> re&ccedil;oit une r&eacute;ponse contenant un en-t&ecirc;te
336       "Vary", lorsqu'un contenu a &eacute;t&eacute; demand&eacute; par un processus d'arri&egrave;re-plan,
337       il va s'efforcer de la traiter intelligemment. Si possible,
338       <module>mod_cache</module> va d&eacute;tecter les en-t&ecirc;tes attribu&eacute;s dans la
339       r&eacute;ponse "Vary" &agrave; l'occasion des futures demandes, et servir une r&eacute;ponse
340       correcte &agrave; partir du cache.</p>
341
342       <p>Si par exemple, une r&eacute;ponse est re&ccedil;ue avec l'en-t&ecirc;te Vary suivant,</p>
343
344       <example>
345 Vary: negotiate,accept-language,accept-charset
346       </example>
347
348       <p><module>mod_cache</module> ne servira aux demandeurs que le contenu
349       mis en cache qui correspond au contenu des en-t&ecirc;tes accept-language et
350       accept-charset de la requ&ecirc;te originale.</p>
351     </section>
352
353   </section>
354
355   <section id="security">
356     <title>Consid&eacute;rations sur la s&eacute;curit&eacute;</title>
357
358     <section>
359       <title>Autorisation et contr&ocirc;le d'acc&egrave;s</title>
360
361       <p>Utiliser <module>mod_cache</module> revient sensiblement &agrave; la m&ecirc;me
362       chose qu'avoir un mandataire inverse int&eacute;gr&eacute; (reverse-proxy). Les requ&ecirc;tes
363       seront servies par le module de mise en cache sauf si ce dernier
364       d&eacute;termine qu'un processus d'arri&egrave;re-plan doit &ecirc;tre appel&eacute;. La mise en
365       cache de ressources locales modifie consid&eacute;rablement le mod&egrave;le de
366       s&eacute;curit&eacute; de httpd.</p>
367
368       <p>Comme le parcours de la hi&eacute;rarchie d'un syst&egrave;me de fichiers pour
369       examiner le contenu d'&eacute;ventuels fichiers
370       <code>.htaccess</code> serait une op&eacute;ration tr&egrave;s co&ucirc;teuse en ressources,
371       annulant partiellement de ce fait l'int&eacute;r&ecirc;t de la mise en cache
372       (acc&eacute;l&eacute;rer le traitement des requ&ecirc;tes),
373       <module>mod_cache</module> ne se pr&eacute;occupe pas de savoir s'il a
374       l'autorisation de servir une entit&eacute; mise en cache. En d'autres termes,
375       si <module>mod_cache</module> a mis en cache un certain contenu, ce
376       dernier sera servi &agrave; partir du cache tant qu'il ne sera pas arriv&eacute; &agrave;
377       expiration.</p>
378
379       <p>Si par exemple, votre configuration autorise l'acc&egrave;s &agrave; une ressource
380       en fonction de l'adresse IP, vous devez vous assurer que ce contenu n'est
381       pas mis en cache. Ceci est possible en utilisant la directive
382       <directive module="mod_cache">CacheDisable</directive>, ou le module
383       <module>mod_expires</module>. Livr&eacute; &agrave; lui-m&ecirc;me,
384       <module>mod_cache</module> - pratiquement comme un mandataire inverse -
385       mettrait en cache le contenu lors de son service, et le servirait ensuite
386       &agrave; tout client, vers n'importe quelle adresse IP.</p>
387     </section>
388
389     <section>
390       <title>Piratages locaux</title>
391
392       <p>Etant donn&eacute; que les requ&ecirc;tes des utilisateurs finaux peuvent &ecirc;tre
393       servies depuis le cache, ce dernier est une cible potentielle pour ceux
394       qui veulent d&eacute;figurer un contenu ou interf&eacute;rer avec lui. Il est important
395       de garder &agrave; l'esprit que l'utilisateur sous lequel tourne
396       httpd doit
397       toujours avoir l'acc&egrave;s en &eacute;criture dans le cache. Ceci est en contraste
398       total avec la recommandation usuelle d'interdire &agrave; l'utilisateur sous
399       lequel tourne Apache
400       l'acc&egrave;s en &eacute;criture &agrave; tout contenu.</p>
401
402       <p>Si l'utilisateur sous lequel tourne Apache est compromis,
403       par exemple &agrave; cause d'une
404       faille de s&eacute;curit&eacute; dans un processus CGI, il est possible que le cache
405       fasse l'objet d'une attaque. Il est relativement ais&eacute; d'ins&eacute;rer ou de
406       modifier une entit&eacute; dans le cache en utilisant le module
407       <module>mod_cache_disk</module>.</p>
408
409       <p>Cela repr&eacute;sente un risque relativement &eacute;l&eacute;v&eacute; par rapport aux autres
410       types d'attaques qu'il est possible de mener sous l'utilisateur apache.
411       Si vous utilisez <module>mod_cache_disk</module>, vous devez garder ceci
412       &agrave; l'esprit : effectuez toujours les mises &agrave; jour de
413       httpdquand des
414       correctifs de s&eacute;curit&eacute; sont annonc&eacute;s et ex&eacute;cutez les processus CGI sous
415       un utilisateur autre qu'apache en utilisant
416       <a href="suexec.html">suEXEC</a> dans la mesure du possible.</p>
417
418     </section>
419
420     <section>
421       <title>Empoisonnement du cache (Cache Poisoning)</title>
422
423       <p>Si vous utilisez httpd comme serveur mandataire avec mise en cache,
424       vous vous exposez aussi &agrave; un &eacute;ventuel "Empoisonnement du
425       cache" (Cache poisoning). L'empoisonnement du cache est un terme g&eacute;n&eacute;ral
426       pour d&eacute;signer les attaques au cours desquelles l'attaquant fait en sorte
427       que le serveur mandataire renvoie &agrave; un contenu incorrect (et souvent
428       ind&eacute;sirable) suite &agrave; en provenance du serveur d'arri&egrave;re-plan.
429       </p>
430
431       <p>Par exemple, si les serveur DNS qu'utilise votre syst&egrave;me o&ugrave; tourne
432       httpd sont vuln&eacute;rables &agrave; l'empoisonnement du cache des DNS, un attaquant
433       pourra contr&ocirc;ler vers o&ugrave; httpd se connecte lorsqu'il demande un contenu
434       depuis le serveur d'origine.
435       Un autre exemple est constitu&eacute; par les attaques ainsi nomm&eacute;es
436       "Dissimulation de requ&ecirc;tes HTTP" (HTTP request-smuggling).</p>
437
438       <p>Ce document n'est pas le bon endroit pour une discussion approfondie
439       &agrave; propos de la Dissimulation de requ&ecirc;tes HTTP (utilisez plut&ocirc;t votre
440       moteur de recherche favori); il est cependant important de savoir qu'il
441       est possible d'&eacute;laborer une s&eacute;rie de requ&ecirc;tes, et d'exploiter une
442       vuln&eacute;rabilit&eacute; d'un serveur web d'origine de telle fa&ccedil;on que l'attaquant
443       puisse contr&ocirc;ler enti&egrave;rement le contenu renvoy&eacute; par le mandataire.</p>
444     </section>
445   </section>
446
447   <section id="filehandle">
448     <title>Mise en cache de la gestion de fichier</title>
449
450     <related>
451       <modulelist>
452         <module>mod_file_cache</module>
453       </modulelist>
454       <directivelist>
455         <directive module="mod_file_cache">CacheFile</directive>
456       </directivelist>
457     </related>
458
459     <p>Le fait d'ouvrir un fichier peut en lui-m&ecirc;me introduire un d&eacute;lai,
460     en particulier dans les syst&egrave;mes de fichiers r&eacute;partis
461     sur le r&eacute;seau. httpd
462     peut s'affranchir de ce d&eacute;lai en maintenant
463     un cache des descripteurs de fichiers
464     ouverts pour ce qui concerne les fichiers souvent
465     acc&eacute;d&eacute;s. httpd propose
466     actuellement une impl&eacute;mentation de mise en cache de la
467     gestion de fichier.</p>
468
469     <section>
470       <title>Directive CacheFile</title>
471
472       <p>La forme la plus &eacute;l&eacute;mentaire de mise en cache que
473       propose httpd est
474       fournie par le module <module>mod_file_cache</module>.
475       Plut&ocirc;t que de mettre en cache le contenu des fichiers, ce cache maintient
476       une table des descripteurs de fichiers ouverts. Les fichiers &agrave; mettre en
477       cache de cette mani&egrave;re sont sp&eacute;cifi&eacute;s dans le fichier de configuration
478       en utilisant la directive
479       <directive module="mod_file_cache">CacheFile</directive>.</p>
480
481       <p>La directive
482       <directive module="mod_file_cache">CacheFile</directive> demande
483       &agrave; httpd
484       d'ouvrir le fichier lors de son d&eacute;marrage et de r&eacute;utiliser le descripteur
485       de fichier &eacute;labor&eacute; &agrave; cette occasion pour tous les
486       acc&egrave;s ult&eacute;rieurs &agrave; ce fichier.</p>
487
488       <example>
489       CacheFile /usr/local/apache2/htdocs/index.html
490       </example>
491
492       <p>Si vous avez l'intention de mettre en cache un grand nombre de
493       fichiers de cette mani&egrave;re, vous devez vous assurer que le nombre maximum
494       de fichiers ouverts par votre syst&egrave;me d'exploitation est correctement
495       d&eacute;fini.</p>
496
497       <p>Bien que l'utilisation de la directive
498       <directive module="mod_file_cache">CacheFile</directive>
499       n'entra&icirc;ne pas la mise en cache du contenu du fichier, cela ne signifie
500       pas qu'en cas de modification du fichier pendant
501       l'ex&eacute;cution de httpd,
502       ces changements seront pris en compte. Le fichier sera toujours servi
503       dans l'&eacute;tat o&ugrave; il &eacute;tait quand httpd a d&eacute;marr&eacute;.</p>
504
505       <p>Si le fichier est supprim&eacute; pendant l'ex&eacute;cution de
506       httpd, ce dernier
507       continuera &agrave; maintenir un descripteur de fichier ouvert et &agrave; servir le
508       fichier dans l'&eacute;tat o&ugrave; il &eacute;tait quand httpd a d&eacute;marr&eacute;. Cela signifie
509       aussi habituellement que malgr&eacute; le fait que le fichier ait &eacute;t&eacute; supprim&eacute;,
510       et ne soit
511       plus accessible par le syst&egrave;me de fichiers, l'espace lib&eacute;r&eacute; ne sera
512       restitu&eacute; qu'&agrave; l'arr&ecirc;t de httpd quand le
513       descripteur de fichier sera ferm&eacute;.</p>
514     </section>
515
516
517   </section>
518
519   <section id="inmemory">
520     <title>Mise en cache en m&eacute;moire</title>
521
522      <related>
523       <modulelist>
524         <module>mod_file_cache</module>
525       </modulelist>
526       <directivelist>
527         <directive module="mod_cache">CacheEnable</directive>
528         <directive module="mod_cache">CacheDisable</directive>
529         <directive module="mod_file_cache">MMapFile</directive>
530       </directivelist>
531     </related>
532
533     <p>Servir un contenu directement depuis la m&eacute;moire syst&egrave;me est
534     universellement reconnu comme la m&eacute;thode la plus rapide. Lire des fichiers
535     depuis un contr&ocirc;leur de disque ou pire, depuis un r&eacute;seau distant est plus
536     lent de plusieurs ordres de grandeur. Les contr&ocirc;leurs de disque r&eacute;alisent
537     en g&eacute;n&eacute;ral des op&eacute;rations m&eacute;caniques, et l'acc&egrave;s au r&eacute;seau est limit&eacute; par la
538     bande passante dont vous disposez. Par contre, les temps d'acc&egrave;s &agrave; la
539     m&eacute;moire sont de l'ordre de la nano-seconde.</p>
540
541     <p>Cependant la m&eacute;moire syst&egrave;me n'est pas bon march&eacute;; &agrave; capacit&eacute; &eacute;gale,
542     c'est de loin le type de stockage le plus co&ucirc;teux et il est important de
543     s'assurer qu'elle est utilis&eacute;e efficacement. Le fait de mettre en cache
544     des fichiers en m&eacute;moire diminue d'autant la quantit&eacute; de m&eacute;moire syst&egrave;me
545     disponible. Comme nous le verrons plus loin, ce n'est pas un probl&egrave;me en
546     soi dans le cas de la mise en cache par l'interm&eacute;diaire du syst&egrave;me
547     d'exploitation, mais si l'on utilise la mise en cache en m&eacute;moire propre &agrave;
548     httpd, il faut prendre garde &agrave; ne pas allouer trop de m&eacute;moire au cache.
549     Sinon le syst&egrave;me sera contraint d'utiliser le swap, ce qui d&eacute;gradera
550     sensiblement les performances.</p>
551
552     <section>
553       <title>Mise en cache par l'interm&eacute;diaire du syst&egrave;me d'exploitation</title>
554
555       <p>Dans la plupart des syst&egrave;mes d'exploitation modernes, c'est le noyau
556       qui g&egrave;re directement la mise en cache en m&eacute;moire des donn&eacute;es relatives
557       aux fichiers. C'est une fonctionnalit&eacute; puissante, et les syst&egrave;mes
558       d'exploitation s'en acquittent fort bien pour la plus grande partie.
559       Consid&eacute;rons par exemple, dans le cas de Linux, la diff&eacute;rence entre le
560       temps n&eacute;cessaire &agrave; la premi&egrave;re lecture d'un fichier et le temps
561       n&eacute;cessaire &agrave; sa deuxi&egrave;me lecture;</p>
562
563       <example><pre>
564 colm@coroebus:~$ time cat testfile &gt; /dev/null
565 real    0m0.065s
566 user    0m0.000s
567 sys     0m0.001s
568 colm@coroebus:~$ time cat testfile &gt; /dev/null
569 real    0m0.003s
570 user    0m0.003s
571 sys     0m0.000s</pre>
572       </example>
573
574       <p>M&ecirc;me pour ce petit fichier, il y a une grande diff&eacute;rence entre les
575       temps n&eacute;cessaires pour lire le fichier. Ceci est du au fait que le
576       noyau a mis en cache le contenu du fichier en m&eacute;moire.</p>
577
578       <p>Du fait de toujours pouvoir disposer de m&eacute;moire syst&egrave;me, vous pouvez
579       &ecirc;tre assur&eacute; qu'il y aura de plus en plus de contenus de fichiers stock&eacute;s
580       dans ce cache. Ceci peut s'av&eacute;rer une m&eacute;thode de mise en cache en m&eacute;moire
581       tr&egrave;s efficace, et ne n&eacute;cessite aucune configuration suppl&eacute;mentaire
582       de httpd.</p>
583
584       <p>De plus, comme le syst&egrave;me d'exploitation sait si des fichiers
585       ont &eacute;t&eacute;
586       supprim&eacute;s ou modifi&eacute;s, il peut effacer automatiquement des contenus de
587       fichiers du cache lorsque cela s'av&egrave;re n&eacute;cessaire. Ceci constitue un gros
588       avantage par rapport &agrave; la mise en cache en m&eacute;moire
589       de httpd qui n'a
590       aucune possibilit&eacute; de savoir si un fichier a &eacute;t&eacute; modifi&eacute;.</p>
591     </section>
592
593     <p>En d&eacute;pit des performances et des avantages de la mise en cache
594     automatique par le syst&egrave;me d'exploitation, la mise en cache en m&eacute;moire
595     peut &ecirc;tre effectu&eacute;e plus efficacement par httpd dans certaines
596     circonstances.</p>
597
598     <section>
599       <title>Mise en cache &agrave; l'aide de la directive MMapFile</title>
600
601       <p>La directive <directive module="mod_file_cache">MMapFile</directive>
602       fournie par le module <module>mod_file_cache</module> vous permet de
603       demander &agrave; httpd de charger un contenu de fichier statique en m&eacute;moire
604       lors de son d&eacute;marrage (&agrave; l'aide de l'appel
605       syst&egrave;me mmap). httpd
606       utilisera le contenu charg&eacute; en m&eacute;moire pour satisfaire ult&eacute;rieurement
607       toutes les demandes d'acc&egrave;s &agrave; ce fichier.</p>
608
609       <example>
610       MMapFile /usr/local/apache2/htdocs/index.html
611       </example>
612
613       <p>Comme dans le cas de la directive
614       <directive module="mod_file_cache">CacheFile</directive>, toute
615       modification du fichier ne sera plus prise en compte par httpd une fois
616       ce dernier d&eacute;marr&eacute;.</p>
617
618       <p> La directive
619       <directive module="mod_file_cache">MMapFile</directive> ne gardant
620       pas la trace de la quantit&eacute; de m&eacute;moire qu'elle alloue, vous devez prendre
621       garde de ne pas en abuser. Chaque processus enfant de httpd utilisant
622       sa propre r&eacute;plique de la m&eacute;moire allou&eacute;e, il est donc d'une importance
623       critique de s'assurer que les fichiers charg&eacute;s ne sont pas d'une taille
624       trop importante afin d'&eacute;pargner au syst&egrave;me l'utilisation du swap.</p>
625     </section>
626
627
628   </section>
629
630   <section id="disk">
631     <title>Mise en cache sur disque</title>
632
633      <related>
634       <modulelist>
635         <module>mod_cache_disk</module>
636       </modulelist>
637       <directivelist>
638         <directive module="mod_cache">CacheEnable</directive>
639         <directive module="mod_cache">CacheDisable</directive>
640       </directivelist>
641     </related>
642
643     <p>Le module <module>mod_cache_disk</module> fournit un m&eacute;canisme de mise
644     en cache sur disque au module <module>mod_cache</module>. Cette mise en cache est
645     intelligente et le contenu ne sera servi qu'&agrave; partir du cache tant qu'il
646     sera consid&eacute;r&eacute; comme valide.</p>
647
648     <p>Typiquement, le module sera configur&eacute; comme suit :</p>
649
650     <example>
651 CacheRoot   /var/cache/apache/<br />
652 CacheEnable disk /<br />
653 CacheDirLevels 2<br />
654 CacheDirLength 1
655     </example>
656
657     <p>Il est important de savoir que, les fichiers mis en cache &eacute;tant stock&eacute;s
658     localement, la mise en cache par l'interm&eacute;diaire du syst&egrave;me d'exploitation
659     sera en g&eacute;n&eacute;ral aussi appliqu&eacute;e &agrave; leurs acc&egrave;s. Si bien que m&ecirc;me si les
660     fichiers sont stock&eacute;s sur disque, s'il font l'objet d'acc&egrave;s fr&eacute;quents,
661     il est probable que le syst&egrave;me d'exploitation s'appliquera &agrave; ce qu'ils
662     soient servis &agrave; partir de la m&eacute;moire.</p>
663
664     <section>
665       <title>Comprendre le stockage dans le cache</title>
666
667       <p>Pour stocker des entit&eacute;s dans le cache,
668       le module <module>mod_cache_disk</module> cr&eacute;e une empreinte (hash) de 22
669       caract&egrave;res de l'URL qui a fait l'objet d'une requ&ecirc;te. Cette empreinte
670       comprend le nom d'h&ocirc;te, le protocole, le port, le chemin et tout argument
671       de type CGI associ&eacute; &agrave; l'URL, afin d'&ecirc;tre sur que plusieurs URLs
672       n'interf&egrave;rent pas entre elles.</p>
673
674       <p>Chaque position de l'empreinte peut contenir un caract&egrave;re
675       choisi parmi 64 caract&egrave;res diff&eacute;rents, il y a donc
676       64^22 possibilit&eacute;s pour une empreinte. Par exemple, une URL peut poss&eacute;der
677       l'empreinte <code>xyTGxSMO2b68mBCykqkp1w</code>. Cette empreinte est
678       utilis&eacute;e pour pr&eacute;fixer les noms de fichiers sp&eacute;cifiques &agrave; cette URL &agrave;
679       l'int&eacute;rieur du cache; cependant, elle est tout d'abord plac&eacute;e dans les
680       r&eacute;pertoires du cache selon les directives
681       <directive module="mod_cache_disk">CacheDirLevels</directive> et
682       <directive module="mod_cache_disk">CacheDirLength</directive>.</p>
683
684       <p>La directive
685       <directive module="mod_cache_disk">CacheDirLevels</directive>
686       d&eacute;finit le nombre de niveaux de sous-r&eacute;pertoires, et
687       <directive module="mod_cache_disk">CacheDirLength</directive>
688       le nombre de caract&egrave;res composant le nom des sous-r&eacute;pertoires. Dans
689       l'exemple donn&eacute; plus haut, l'empreinte se trouvera &agrave; :
690       <code>/var/cache/apache/x/y/TGxSMO2b68mBCykqkp1w</code>.</p>
691
692       <p>Cette technique a pour but principal de r&eacute;duire le nombre de
693       sous-r&eacute;pertoires ou de fichiers contenus dans un r&eacute;pertoire particulier,
694       car le fonctionnement de la plupart des syst&egrave;mes de fichiers est ralenti
695       quand ce nombre augmente. Avec la valeur "1" pour la directive
696       <directive module="mod_cache_disk">CacheDirLength</directive>,
697       il peut y avoir au plus 64 sous-r&eacute;pertoires &agrave; un niveau quelconque.
698       Avec la valeur "2", il peut y en avoir 64 * 64, etc...
699       A moins d'avoir une bonne raison pour ne pas le faire, l'utilisation de
700       la valeur "1" pour la directive
701       <directive module="mod_cache_disk">CacheDirLength</directive>
702       est recommand&eacute;e.</p>
703
704       <p>Le param&eacute;trage de la directive
705       <directive module="mod_cache_disk">CacheDirLevels</directive>
706       d&eacute;pend du nombre de fichiers que vous pensez stocker dans le cache.
707       Avec une valeur de "2" comme dans l'exemple donn&eacute; plus haut,
708       4096 sous-r&eacute;pertoires peuvent &ecirc;tre cr&eacute;&eacute;s au total. Avec 1 million de
709       fichiers dans le cache, cela &eacute;quivaut &agrave; environ 245 URLs mises en cache
710       dans chaque r&eacute;pertoire.</p>
711
712       <p>Chaque URL n&eacute;cessite au moins deux fichiers dans le cache. Ce sont en
713       g&eacute;n&eacute;ral un fichier ".header", qui contient des meta-informations &agrave; propos
714       de l'URL, comme la date de son arriv&eacute;e &agrave; expiration,
715       et un fichier ".data" qui est la copie exacte du contenu &agrave; servir.</p>
716
717       <p>Dans le cas d'un contenu n&eacute;goci&eacute; via l'en-t&ecirc;te "Vary", un r&eacute;pertoire
718       ".vary" sera cr&eacute;&eacute; pour l'URL en question. Ce r&eacute;pertoire contiendra de
719       multiples fichiers ".data" correspondant aux diff&eacute;rents contenus
720       n&eacute;goci&eacute;s.</p>
721     </section>
722
723     <section>
724       <title>Maintenance du cache sur disque</title>
725
726       <p>Bien que le module <module>mod_cache_disk</module> supprime un contenu
727       du cache lorsqu'il est arriv&eacute; &agrave; expiration, il ne maintient aucune
728       information &agrave; propos de la taille totale du cache ou de l'espace restant
729       disponible.</p>
730
731       <p>Par contre l'utilitaire
732       <a href="programs/htcacheclean.html">htcacheclean</a> fourni avec
733       httpd
734       vous permet, comme son nom l'indique, de nettoyer le cache p&eacute;riodiquement.
735       D&eacute;terminer la fr&eacute;quence &agrave; laquelle lancer <a
736       href="programs/htcacheclean.html">htcacheclean</a> et la taille souhait&eacute;e
737       pour le cache est une t&acirc;che relativement complexe et il vous faudra de
738       nombreux essais et erreurs pour arriver &agrave; s&eacute;lectionner des valeurs
739       optimales.</p>
740
741       <p><a href="programs/htcacheclean.html">htcacheclean</a> op&egrave;re selon deux
742       modes. Il peut s'ex&eacute;cuter comme d&eacute;mon r&eacute;sident, ou &ecirc;tre lanc&eacute;
743       p&eacute;riodiquement par cron. <a
744       href="programs/htcacheclean.html">htcacheclean</a> peut mettre une heure
745       ou plus pour traiter de tr&egrave;s grands caches (plusieurs dizaines de
746       Gigaoctets) et si vous l'ex&eacute;cutez &agrave; partir de cron, il vous est
747       conseill&eacute; de d&eacute;terminer la dur&eacute;e typique d'un traitement, afin d'&eacute;viter
748       d'ex&eacute;cuter plusieurs instances &agrave; la fois.</p>
749
750       <p class="figure">
751       <img src="images/caching_fig1.gif" alt="" width="600"
752           height="406" /><br />
753       <a id="figure1" name="figure1"><dfn>Figure 1</dfn></a>: Croissance
754       typique du cache / s&eacute;quence de nettoyage.</p>
755
756       <p>Comme <module>mod_cache_disk</module> ne tient pas compte de l'espace
757       utilis&eacute; dans le cache, vous devez vous assurer que
758       <a href="programs/htcacheclean.html">htcacheclean</a> est configur&eacute; de
759       fa&ccedil;on &agrave; laisser suffisamment d'"espace de croissance"
760       &agrave; la suite d'un nettoyage.</p>
761     </section>
762
763   </section>
764
765 </manualpage>