1 <?xml version="1.0" encoding="ISO-8859-1" ?>
2 <!DOCTYPE manualpage SYSTEM "style/manualpage.dtd">
3 <?xml-stylesheet type="text/xsl" href="style/manual.fr.xsl"?>
4 <!-- French translation : Lucien GENTIS -->
5 <!-- Reviewed by : Vincent Deffontaines -->
6 <!-- English Revision : 572617 -->
9 Licensed to the Apache Software Foundation (ASF) under one or more
10 contributor license agreements. See the NOTICE file distributed with
11 this work for additional information regarding copyright ownership.
12 The ASF licenses this file to You under the Apache License, Version 2.0
13 (the "License"); you may not use this file except in compliance with
14 the License. You may obtain a copy of the License at
16 http://www.apache.org/licenses/LICENSE-2.0
18 Unless required by applicable law or agreed to in writing, software
19 distributed under the License is distributed on an "AS IS" BASIS,
20 WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
21 See the License for the specific language governing permissions and
22 limitations under the License.
25 <manualpage metafile="caching.xml.meta">
27 <title>Guide de la mise en cache</title>
30 <p>Ce document complète la documentation de référence des modules
31 <module>mod_cache</module>,
32 <module>mod_disk_cache</module>, <module>mod_mem_cache</module>,
33 <module>mod_file_cache</module> et du programme <a
34 href="programs/htcacheclean.html">htcacheclean</a>.
35 Il décrit l'utilisation des fonctionnalités de mise en cache d'Apache
36 pour accélérer les services web et proxy, tout en évitant les problèmes
37 courants et les erreurs de configuration.</p>
40 <section id="introduction">
41 <title>Introduction</title>
43 <p>Depuis la version 2.2 du serveur HTTP Apache, les modules
44 <module>mod_cache</module>
45 et <module>mod_file_cache</module> ne sont plus jugés expérimentaux
46 et on considère qu'ils peuvent être utilisés en production. Ces
47 architectures de mise en cache constituent un puissant concept
48 d'accélération de la gestion HTTP, tant comme serveur web originel
49 que comme mandataire.</p>
51 <p>Le module <module>mod_cache</module> et ses modules de soutien
52 <module>mod_mem_cache</module> et <module>mod_disk_cache</module>
53 permettent une mise en cache intelligente du point de vue HTTP.
54 Le contenu proprement dit est stocké dans le cache,
55 et mod_cache tente d'honorer tous les en-têtes HTTP et les options
56 qui définissent la possibilité de mise en cache du contenu. Il gère non
57 seulement le contenu local, mais aussi le contenu mandaté.
58 <module>mod_cache</module>
59 est conçu pour des configurations de mise en cache simples ou complexes,
60 dans lesquels vous traitez de contenu mandaté, de contenu local dynamique
61 ou avez besoin d'accélérer l'accès à des fichiers locaux qui sont modifiés
62 au cours du temps.</p>
64 <p>Le module <module>mod_file_cache</module> quant à lui, constitue une
65 forme de mise en cache plus basique, mais quelques fois intéressante.
66 Plutôt que de gérer la complexité de s'assurer de manière active de la
67 possibilité de mise en cache d'URLs,
68 <module>mod_file_cache</module> fournit des méthodes pour la gestion
69 et l'édition de fichiers en mémoire afin de maintenir un cache de fichiers
70 dans l'état où ils étaient la dernière fois qu'Apache a démarré.
71 En tant que tel, <module>mod_file_cache</module> a été conçu pour améliorer
72 le temps d'accès à des fichiers locaux statiques qui ne sont modifiés
75 <p>Etant donné que <module>mod_file_cache</module> constitue une
76 implémentation de mise en cache relativement simple, mises à part les
77 sections spécifiques sur les directives <directive
78 module="mod_file_cache">CacheFile</directive> et <directive
79 module="mod_file_cache">MMapStatic</directive>, les explications fournies
80 dans ce guide concernent l'architecture de mise en cache du
81 module <module>mod_cache</module>.</p>
83 <p>Pour tirer parti efficacement de ce document, les bases de HTTP doivent
84 vous être familières, et vous devez avoir lu les sections
85 <a href="urlmapping.html">Mise en correspondance des
86 URLs avec le système de fichiers</a> et
87 <a href="content-negotiation.html">Négociation sur le contenu</a>
88 du guide de l'utilisateur.</p>
92 <section id="overview">
94 <title>Vue d'ensemble de la mise en cache</title>
98 <module>mod_cache</module>
99 <module>mod_mem_cache</module>
100 <module>mod_disk_cache</module>
101 <module>mod_file_cache</module>
104 <directive module="mod_cache">CacheEnable</directive>
105 <directive module="mod_cache">CacheDisable</directive>
106 <directive module="mod_file_cache">MMapStatic</directive>
107 <directive module="mod_file_cache">CacheFile</directive>
108 <directive module="mod_file_cache">CacheFile</directive>
109 <directive module="core">UseCanonicalName</directive>
110 <directive module="mod_negotiation">CacheNegotiatedDocs</directive>
114 <p><module>mod_cache</module> peut faire intervenir deux phases
115 principales pendant la durée de vie d'une requête.
116 En premier lieu, <module>mod_cache</module>
117 est un module de mise en correspondance d'URLs, ce qui signifie que si
118 une URL a été mise en cache, et que la version du cache de cette URL n'est
119 pas arrivée à expiration, la requête sera traitée directement par
120 <module>mod_cache</module>.</p>
122 <p>Ceci entraîne que toutes autres actions qui se dérouleraient normalement
123 au cours du processus de traitement d'une requête -- par exemple un
124 traitement effectué par <module>mod_proxy</module>, ou
125 <module>mod_rewrite</module> --
126 ne seront pas effectuées. Mais c'est justement l'intérêt
127 de la mise en cache préalable du contenu.</p>
129 <p>Si l'URL ne se trouve pas dans le cache, <module>mod_cache</module>
130 va ajouter un <a href="filter.html">filtre</a> au traitement de la requête.
131 Une fois le contenu localisé par Apache selon la conception courante, le
132 filtre sera exécuté en même temps que le contenu sera servi.
133 S'il est déterminé que le contenu peut être mis en cache,
134 il sera sauvegardé dans le cache pour une utilisation future.</p>
136 <p>Si l'URL se trouve dans le cache, mais est arrivée à expiration,
137 le filtre est quand-même ajouté, mais <module>mod_cache</module> va créer
138 une requête conditionnelle en arrière-plan, pour déterminer si la version
139 du cache est encore à jour. Si la version du cache est encore à jour, ses
140 meta-informations seront mises à jour et la requête sera servie à partir du
141 cache. Si la version du contenu n'est plus à jour, elle sera supprimée et le
142 filtre va sauvegarder le contenu mis à jour dans le cache
143 au moment où il sera servi.</p>
146 <title>Amélioration du taux de présence dans le cache</title>
148 <p>Lors de la mise en cache de contenu généré localement, le
149 positionnement de la directive
150 <directive module="core">UseCanonicalName</directive> à
151 <code>On</code> peut améliorer de manière spectaculaire le taux de
152 présence dans le cache. Ceci est du au fait que le nom d'hôte de l'hôte
153 virtuel qui sert le contenu constitue une partie de la clé de cache.
154 Avec <directive module="core">UseCanonicalName</directive> positionnée
155 à <code>On</code>,
156 les hôtes virtuels possédant plusieurs noms de serveur ou alias ne
157 généreront pas d'entités de cache différentes, et le contenu sera mis en
158 cache en faisant référence au nom d'hôte canonique.</p>
160 <p>Les documents mis en cache ne seront servis qu'en réponse à des
161 requêtes de type URL, car la mise en cache est effectuée lors de la phase
162 de traduction de l'URL en nom de fichier.
163 En général, cela n'a que peu d'effet, à moins que vous n'utilisiez les
164 <a href="howto/ssi.html">Inclusions Côté Serveur (SSI)</a>;</p>
168 <!-- L'inclusion suivante peut être mise en cache -->
169 <!--#include virtual="/footer.html" -->
171 <!-- L'inclusion suivante ne peut pas être mise en cache -->
172 <!--#include file="/path/to/footer.html" --></pre>
175 <p>Si vous utilisez les SSI, et voulez bénéficier de la vitesse de
176 service depuis le cache, vous devez utiliser des inclusions de type
177 <code>virtual</code>.</p>
181 <title>Périodes d'expiration</title>
183 <p>La période d'expiration par défaut pour les entités du cache est
184 d'une heure; elle peut cependant être facilement modifiée à l'aide de
185 la directive <directive
186 module="mod_cache">CacheDefaultExpire</directive>. Cette valeur par
187 défaut n'est utilisée que lorsque la source originale du contenu ne
188 précise pas de période d'expiration ou d'heure de dernière
191 <p>Si une réponse ne contient pas d'en-tête <code>Expires</code> mais
192 inclut un en-tête <code>Last-Modified</code>, <module>mod_cache</module>
193 peut déduire une période d'expiration en se basant sur la valeur de la
195 module="mod_cache">CacheLastModifiedFactor</directive>.</p>
197 <p>La période d'expiration des contenus locaux peut être ajustée finement
198 en utilisant le module <module>mod_expires</module>.</p>
200 <p>On peut aussi contrôler la période d'expiration maximale en utilisant
201 la directive <directive module="mod_cache">CacheMaxExpire</directive>.</p>
206 <title>Guide succinct des requêtes conditionnelles</title>
208 <p>Lorsqu'un contenu est arrivé à expiration dans le cache et fait
209 l'objet d'une nouvelle demande d'accès, plutôt que traiter directement
210 la requête originale, Apache préfère utiliser une
211 requête conditionnelle.</p>
213 <p>HTTP propose toute une panoplie d'en-têtes qui permettent à un client,
214 ou au cache de distinguer les différentes versions d'un même contenu. Par
215 exemple, si une ressource a été servie avec un en-tête "Etag:", il est
216 possible de créer une requête conditionnelle contenant un en-tête
217 "If-None-Match:". Si une ressource a été servie avec un en-tête
218 "Last-Modified:", il est possible de créer une requête conditionnelle
219 contenant un en-tête "If-Modified-Since:", etc....</p>
221 <p>Lorsqu'une telle requête conditionnelle est créée, la reponse diffère
222 selon que le contenu satisfait ou non aux conditions. Si une requête est
223 créée avec un en-tête "If-Modified-Since:", et le contenu n'a pas été
224 modifié depuis le moment indiqué dans la requête, alors un laconique
225 "304 Not Modified" est retourné.</p>
227 <p>Si le contenu a été modifié, il est servi comme si la requête n'avait
228 pas été conditionnelle à l'origine.</p>
230 <p>Les bénéfices des requêtes conditionnelles pour ce qui concerne la
231 mise en cache sont de deux sortes. Premièrement, quand une telle requête
232 est envoyée au processus en arrière-plan, il sera aisé de déterminer
233 si le contenu que devra servir le processus en arrière-plan correspond
234 au contenu stocké dans le cache, sans être obligé de transmettre la
235 totalité de la ressource.</p>
237 <p>Deuxièmement, les requêtes conditionnelles sont en général moins
238 coûteuses en ressources pour le processus en arrière-plan.
239 Pour ce qui est des fichiers
240 statiques, l'action type est un appel à <code>stat()</code> ou un appel
241 système similaire, pour déterminer si la taille du fichier ou sa date de
242 modification ont changé. Ainsi, même si Apache met en cache le contenu
243 local, un contenu arrivé à expiration pourra être servi plus rapidement
244 depuis le cache s'il n'a pas été modifié, parce que la lecture depuis le
245 cache est plus rapide que la lecture depuis le processus en arrière-plan
246 (à comparer à la différence de vitesse entre la lecture depuis un cache en
247 mémoire et la lecture depuis un disque).</p>
251 <title>Que peut-on mettre en cache ?</title>
253 <p>Comme mentionné plus haut, les deux styles de mise en cache d'Apache
254 fonctionnent différemment; la mise en cache de
255 <module>mod_file_cache</module> conserve les contenus des fichiers
256 tels qu'ils étaient au démarrage d'Apache. Quand une requête pour un
257 fichier mis en cache par ce module est envoyée, elle est interceptée
258 et le fichier mis en cache est servi.</p>
260 <p>La mise en cache de <module>mod_cache</module>, quant à elle, est
261 plus complexe. Lors du traitement d'une requête, le module de mise en
262 cache déterminera si le contenu peut être mis en cache, s'il ne l'a
263 pas déjà été auparavant. Les conditions qui permettent de déterminer
264 la possibilité de mise en cache d'une réponse sont :</p>
267 <li>La mise en cache doit être activée pour cette URL. Voir les
268 directives <directive
269 module="mod_cache">CacheEnable</directive> et <directive
270 module="mod_cache">CacheDisable</directive>.</li>
272 <li>La reponse doit avoir un code de statut HTTP de 200, 203, 300, 301
275 <li>La requête doit être de type HTTP GET.</li>
277 <li>Si la requête contient un en-tête "Authorization:", la réponse ne
278 sera pas mise en cache.</li>
280 <li>Si la réponse contient un en-tête "Authorization:", elle doit aussi
281 contenir une option "s-maxage", "must-revalidate" ou "public"
282 dans l'en-tête "Cache-Control:".</li>
284 <li>Si l'URL contenait une requête sous forme de chaîne de caractères
285 (provenant par exemple d'une méthode GET de formulaire HTML), elle ne
286 sera pas mise en cache à moins que la réponse ne contienne un en-tête
287 "Expires:", comme précisé dans la RFC2616 section 13.9.</li>
289 <li>Si la réponse a un statut de 200 (OK), elle doit aussi contenir
290 au moins un des en-têtes "Etag", "Last-Modified" ou
291 "Expires", à moins que la directive
292 <directive module="mod_cache">CacheIgnoreNoLastMod</directive>
293 ne précise d'autres contraintes.</li>
295 <li>Si la réponse contient l'option "private" dans un en-tête
296 "Cache-Control:", elle ne sera pas mise en cache à moins que la
298 <directive module="mod_cache">CacheStorePrivate</directive>
299 ne précise d'autres contraintes.</li>
301 <li>De même, si la réponse contient l'option "no-store" dans un en-tête
302 "Cache-Control:", elle ne sera pas mise en cache à moins que la
304 <directive module="mod_cache">CacheStoreNoStore</directive>
305 n'ait été utilisée.</li>
307 <li>Une réponse ne sera pas mise en cache si elle comporte un en-tête
308 "Vary:" contenant le caractère "*" qui correspond à toute
309 chaîne de caractères.</li>
314 <title>Qu'est ce qui ne doit pas être mis en cache ?</title>
316 <p>En bref, tout contenu qui varie beaucoup avec le temps, ou en fonction
317 de particularités de la requête qui ne sont pas couvertes par la
318 négociation HTTP, ne doit pas être mis en cache.</p>
320 <p>Un contenu dynamique qui varie en fonction de l'adresse IP du
321 demandeur, ou est modifié toutes les 5 minutes, ne devra en général
322 pas être mis en cache.</p>
324 <p>Si par contre le contenu servi diffère en fonction de la valeur de
325 divers en-têtes HTTP, il se peut que l'on puisse le mettre en cache
326 intelligemment en utilisant un en-tête "Vary".</p>
330 <title>Contenu variable et/ou négocié</title>
332 <p>Si <module>mod_cache</module> reçoit une réponse contenant un en-tête
333 "Vary", lorsqu'un contenu a été demandé par un processus d'arrière-plan,
334 il va s'efforcer de la traiter intelligemment. Si possible,
335 <module>mod_cache</module> va détecter les en-têtes attribués dans la
336 réponse "Vary" à l'occasion des futures demandes, et servir une réponse
337 correcte à partir du cache.</p>
339 <p>Si par exemple, une réponse est reçue avec l'en-tête Vary suivant,</p>
342 Vary: negotiate,accept-language,accept-charset
345 <p><module>mod_cache</module> ne servira aux demandeurs que le contenu
346 mis en cache qui correspond au contenu des en-têtes accept-language et
347 accept-charset de la requête originale.</p>
352 <section id="security">
353 <title>Considérations sur la sécurité</title>
356 <title>Autorisation et contrôle d'accès</title>
358 <p>Utiliser <module>mod_cache</module> revient sensiblement à la même
359 chose qu'avoir un mandataire inverse intégré (reverse-proxy). Les requêtes
360 seront servies par le module de mise en cache sauf si ce dernier
361 détermine qu'un processus d'arrière-plan doit être appelé. La mise en
362 cache de ressources locales modifie considérablement le modèle de
363 sécurité d'Apache.</p>
365 <p>Comme le parcours de la hiérarchie d'un système de fichiers pour
366 examiner le contenu d'éventuels fichiers
367 <code>.htaccess</code> serait une opération très coûteuse en ressources,
368 annulant partiellement de ce fait l'intérêt de la mise en cache
369 (accélérer le traitement des requêtes),
370 <module>mod_cache</module> ne se préoccupe pas de savoir s'il a
371 l'autorisation de servir une entité mise en cache. En d'autres termes,
372 si <module>mod_cache</module> a mis en cache un certain contenu, ce
373 dernier sera servi à partir du cache tant qu'il ne sera pas arrivé à
376 <p>Si par exemple, votre configuration autorise l'accès à une ressource
377 en fonction de l'adresse IP, vous devez vous assurer que ce contenu n'est
378 pas mis en cache. Ceci est possible en utilisant la directive
379 <directive module="mod_cache">CacheDisable</directive>, ou le module
380 <module>mod_expires</module>. Livré à lui-même,
381 <module>mod_cache</module> - pratiquement comme un mandataire inverse -
382 mettrait en cache le contenu lors de son service, et le servirait ensuite
383 à tout client, vers n'importe quelle adresse IP.</p>
387 <title>Piratages locaux</title>
389 <p>Etant donné que les requêtes des utilisateurs finaux peuvent être
390 servies depuis le cache, ce dernier est une cible potentielle pour ceux
391 qui veulent défigurer un contenu ou interférer avec lui. Il est important
392 de garder à l'esprit que l'utilisateur sous lequel tourne Apache doit
393 toujours avoir l'accès en écriture dans le cache. Ceci est en contraste
394 total avec la recommandation usuelle d'interdire à l'utilisateur sous
396 l'accès en écriture à tout contenu.</p>
398 <p>Si l'utilisateur sous lequel tourne Apache est compromis,
399 par exemple à cause d'une
400 faille de sécurité dans un processus CGI, il est possible que le cache
401 fasse l'objet d'une attaque. Il est relativement aisé d'insérer ou de
402 modifier une entité dans le cache en utilisant le module
403 <module>mod_disk_cache</module>.</p>
405 <p>Cela représente un risque relativement élévé par rapport aux autres
406 types d'attaques qu'il est possible de mener sous l'utilisateur apache.
407 Si vous utilisez <module>mod_disk_cache</module>, vous devez garder ceci
408 à l'esprit : effectuez toujours les mises à jour d'Apache quand des
409 correctifs de sécurité sont annoncés et exécutez les processus CGI sous
410 un utilisateur autre qu'apache en utilisant
411 <a href="suexec.html">suEXEC</a> dans la mesure du possible.</p>
416 <title>Empoisonnement du cache (Cache Poisoning)</title>
418 <p>Si vous utilisez Apache comme serveur mandataire avec mise en cache,
419 vous vous exposez aussi à un éventuel "Empoisonnement du
420 cache" (Cache poisoning). L'empoisonnement du cache est un terme général
421 pour désigner les attaques au cours desquelles l'attaquant fait en sorte
422 que le serveur mandataire renvoie à un contenu incorrect (et souvent
423 indésirable) suite à en provenance du serveur d'arrière-plan.
426 <p>Par exemple, si les serveur DNS qu'utilise votre système où tourne
427 Apache sont vulnérables à l'empoisonnement du cache des DNS, un attaquant
428 pourra contrôler vers où Apache se connecte lorsqu'il demande un contenu
429 depuis le serveur d'origine.
430 Un autre exemple est constitué par les attaques ainsi nommées
431 "Dissimulation de requêtes HTTP" (HTTP request-smuggling).</p>
433 <p>Ce document n'est pas le bon endroit pour une discussion approfondie
434 à propos de la Dissimulation de requêtes HTTP (utilisez plutôt votre
435 moteur de recherche favori); il est cependant important de savoir qu'il
436 est possible d'élaborer une série de requêtes, et d'exploiter une
437 vulnérabilité d'un serveur web d'origine de telle façon que l'attaquant
438 puisse contrôler entièrement le contenu renvoyé par le mandataire.</p>
442 <section id="filehandle">
443 <title>Mise en cache de la gestion de fichier</title>
447 <module>mod_file_cache</module>
448 <module>mod_mem_cache</module>
451 <directive module="mod_file_cache">CacheFile</directive>
452 <directive module="mod_cache">CacheEnable</directive>
453 <directive module="mod_cache">CacheDisable</directive>
457 <p>Le fait d'ouvrir un fichier peut en lui-même introduire un délai,
458 en particulier dans les systèmes de fichiers répartis sur le réseau. Apache
459 peut s'affranchir de ce délai en maintenant
460 un cache des descripteurs de fichiers
461 ouverts pour ce qui concerne les fichiers souvent accédés. Apache propose
462 actuellement deux implémentations différentes de mise en cache de la
463 gestion de fichier.</p>
466 <title>Directive CacheFile</title>
468 <p>La forme la plus élémentaire de mise en cache que propose Apache est
469 fournie par le module <module>mod_file_cache</module>.
470 Plutôt que de mettre en cache le contenu des fichiers, ce cache maintient
471 une table des descripteurs de fichiers ouverts. Les fichiers à mettre en
472 cache de cette manière sont spécifiés dans le fichier de configuration
473 en utilisant la directive
474 <directive module="mod_file_cache">CacheFile</directive>.</p>
477 <directive module="mod_file_cache">CacheFile</directive> demande à Apache
478 d'ouvrir le fichier lors de son démarrage et de réutiliser le descripteur
479 de fichier élaboré à cette occasion pour tous les
480 accès ultérieurs à ce fichier.</p>
483 <pre>CacheFile /usr/local/apache2/htdocs/index.html</pre>
486 <p>Si vous avez l'intention de mettre en cache un grand nombre de
487 fichiers de cette manière, vous devez vous assurer que le nombre maximum
488 de fichiers ouverts par votre système d'exploitation est correctement
491 <p>Bien que l'utilisation de la directive
492 <directive module="mod_file_cache">CacheFile</directive>
493 n'entraîne pas la mise en cache du contenu du fichier, cela ne signifie
494 pas qu'en cas de modification du fichier pendant l'exécution d'Apache,
495 ces changements seront pris en compte. Le fichier sera toujours servi
496 dans l'état où il était quand Apache a démarré.</p>
498 <p>Si le fichier est supprimé pendant l'exécution d'Apache, ce dernier
499 continuera à maintenir un descripteur de fichier ouvert et à servir le
500 fichier dans l'état où il était quand Apache a démarré. Cela signifie
501 aussi habituellement que malgré le fait que le fichier ait été supprimé,
503 plus accessible par le système de fichiers, l'espace libéré ne sera
504 restitué qu'à l'arrêt d'Apache quand le
505 descripteur de fichier sera fermé.</p>
509 <title>Directive CacheEnable</title>
511 <p>Le module <module>mod_mem_cache</module> propose aussi son propre
512 schéma de mise en cache de la gestion de fichier, qui peut être activé
513 à l'aide de la directive
514 <directive module="mod_cache">CacheEnable</directive>.</p>
517 <pre>CacheEnable fd /</pre>
520 <p>A l'instar de tout ce qui concerne le module
521 <module>mod_cache</module>, ce mode de mise en cache de la gestion de
522 fichier est intelligent, et les descripteurs ne seront plus maintenus
523 lorsque le contenu mis en cache sera arrivé à expiration.</p>
527 <section id="inmemory">
528 <title>Mise en cache en mémoire</title>
532 <module>mod_mem_cache</module>
533 <module>mod_file_cache</module>
536 <directive module="mod_cache">CacheEnable</directive>
537 <directive module="mod_cache">CacheDisable</directive>
538 <directive module="mod_file_cache">MMapStatic</directive>
542 <p>Servir un contenu directement depuis la mémoire système est
543 universellement reconnu comme la méthode la plus rapide. Lire des fichiers
544 depuis un contrôleur de disque ou pire, depuis un réseau distant est plus
545 lent de plusieurs ordres de grandeur. Les contrôleurs de disque réalisent
546 en général des opérations mécaniques, et l'accès au réseau est limité par la
547 bande passante dont vous disposez. Par contre, les temps d'accès à la
548 mémoire sont de l'ordre de la nano-seconde.</p>
550 <p>Cependant la mémoire système n'est pas bon marché; à capacité égale,
551 c'est de loin le type de stockage le plus coûteux et il est important de
552 s'assurer qu'elle est utilisée efficacement. Le fait de mettre en cache
553 des fichiers en mémoire diminue d'autant la quantité de mémoire système
554 disponible. Comme nous le verrons plus loin, ce n'est pas un problème en
555 soi dans le cas de la mise en cache par l'intermédiaire du système
556 d'exploitation, mais si l'on utilise la mise en cache en mémoire propre à
557 Apache, il faut prendre garde à ne pas allouer trop de mémoire au cache.
558 Sinon le système sera contraint d'utiliser le swap, ce qui dégradera
559 sensiblement les performances.</p>
562 <title>Mise en cache par l'intermédiaire du système d'exploitation</title>
564 <p>Dans la plupart des systèmes d'exploitation modernes, c'est le noyau
565 qui gère directement la mise en cache en mémoire des données relatives
566 aux fichiers. C'est une fonctionnalité puissante, et les systèmes
567 d'exploitation s'en acquittent fort bien pour la plus grande partie.
568 Considérons par exemple, dans le cas de Linux, la différence entre le
569 temps nécessaire à la première lecture d'un fichier et le temps
570 nécessaire à sa deuxième lecture;</p>
573 colm@coroebus:~$ time cat testfile > /dev/null
577 colm@coroebus:~$ time cat testfile > /dev/null
583 <p>Même pour ce petit fichier, il y a une grande différence entre les
584 temps nécessaires pour lire le fichier. Ceci est du au fait que le
585 noyau a mis en cache le contenu du fichier en mémoire.</p>
587 <p>Du fait de toujours pouvoir disposer de mémoire système, vous pouvez
588 être assuré qu'il y aura de plus en plus de contenus de fichiers stockés
589 dans ce cache. Ceci peut s'avérer une méthode de mise en cache en mémoire
590 très efficace, et ne nécessite aucune configuration supplémentaire
593 <p>De plus, comme le système d'exploitation sait si des fichiers
594 ont été
595 supprimés ou modifiés, il peut effacer automatiquement des contenus de
596 fichiers du cache lorsque cela s'avère nécessaire. Ceci constitue un gros
597 avantage par rapport à la mise en cache en mémoire d'Apache qui n'a
598 aucune possibilité de savoir si un fichier a été modifié.</p>
601 <p>En dépit des performances et des avantages de la mise en cache
602 automatique par le système d'exploitation, la mise en cache en mémoire
603 peut être effectuée plus efficacement par Apache dans certaines
606 <p>En premier lieu, un système d'exploitation ne peut mettre en cache que
607 les fichiers dont il a connaissance. Si vous exécutez Apache en tant que
608 serveur mandataire, les fichiers que vous mettez en cache ne sont pas
609 stockés en local mais sur un serveur distant. Si vous voulez tout de même
610 bénéficier de la vitesse incomparable procurée par la mise en cache en
611 mémoire, la mise en cache propre à Apache sera nécessaire.</p>
614 <title>Mise en cache à l'aide de la directive MMapStatic</title>
616 <p>La directive <directive module="mod_file_cache">MMapStatic</directive>
617 fournie par le module <module>mod_file_cache</module> vous permet de
618 demander à Apache de charger un contenu de fichier statique en mémoire
619 lors de son démarrage (à l'aide de l'appel système mmap). Apache
620 utilisera le contenu chargé en mémoire pour satisfaire ultérieurement
621 toutes les demandes d'accès à ce fichier.</p>
624 <pre>MMapStatic /usr/local/apache2/htdocs/index.html</pre>
627 <p>Comme dans le cas de la directive
628 <directive module="mod_file_cache">CacheFile</directive>, toute
629 modification du fichier ne sera plus prise en compte par Apache une fois
630 ce dernier démarré.</p>
633 <directive module="mod_file_cache">MMapStatic</directive> ne gardant
634 pas la trace de la quantité de mémoire qu'elle alloue, vous devez prendre
635 garde de ne pas en abuser. Chaque processus enfant d'Apache utilisant
636 sa propre réplique de la mémoire allouée, il est donc d'une importance
637 critique de s'assurer que les fichiers chargés ne sont pas d'une taille
638 trop importante afin d'épargner au système l'utilisation du swap.</p>
642 <title>Mise en cache à l'aide du module mod_mem_cache</title>
644 <p>Le module <module>mod_mem_cache</module> propose une mise en cache en
645 mémoire intelligente du point de vue du protocole HTTP. Il utilise aussi
646 directement le "tas" de la mémoire, ce qui signifie que même si
647 <var>MMap</var> n'est pas supporté par votre système,
648 <module>mod_mem_cache</module> pourra quand-même effectuer
649 la mise en cache.</p>
651 <p>La mise en cache selon cette méthode est activée comme suit :</p>
654 # Activation de la mise en cache en mémoire
657 # Limite la taille du cache à 1 Mégaoctet
658 MCacheSize 1024</pre>
664 <title>Mise en cache sur disque</title>
668 <module>mod_disk_cache</module>
671 <directive module="mod_cache">CacheEnable</directive>
672 <directive module="mod_cache">CacheDisable</directive>
676 <p>Le module <module>mod_disk_cache</module> fournit un mécanisme de mise
677 en cache sur disque au module <module>mod_cache</module>. Comme dans le cas
678 du module <module>mod_mem_cache</module>, cette mise en cache est
679 intelligente et le contenu ne sera servi qu'à partir du cache tant qu'il
680 sera considéré comme valide.</p>
682 <p>Typiquement, le module sera configuré comme suit :</p>
686 CacheRoot /var/cache/apache/
689 CacheDirLength 1</pre>
692 <p>Il est important de savoir que, les fichiers mis en cache étant stockés
693 localement, la mise en cache par l'intermédiaire du système d'exploitation
694 sera en général aussi appliquée à leurs accès. Si bien que même si les
695 fichiers sont stockés sur disque, s'il font l'objet d'accès fréquents,
696 il est probable que le système d'exploitation s'appliquera à ce qu'ils
697 soient servis à partir de la mémoire.</p>
700 <title>Comprendre le stockage dans le cache</title>
702 <p>Pour stocker des entités dans le cache,
703 le module <module>mod_disk_cache</module> crée une empreinte (hash) de 22
704 caractères de l'URL qui a fait l'objet d'une requête. Cette empreinte
705 comprend le nom d'hôte, le protocole, le port, le chemin et tout argument
706 de type CGI associé à l'URL, afin d'être sur que plusieurs URLs
707 n'interfèrent pas entre elles.</p>
709 <p>Chaque position de l'empreinte peut contenir un caractère
710 choisi parmi 64 caractères différents, il y a donc
711 64^22 possibilités pour une empreinte. Par exemple, une URL peut posséder
712 l'empreinte <code>xyTGxSMO2b68mBCykqkp1w</code>. Cette empreinte est
713 utilisée pour préfixer les noms de fichiers spécifiques à cette URL à
714 l'intérieur du cache; cependant, elle est tout d'abord placée dans les
715 répertoires du cache selon les directives
716 <directive module="mod_disk_cache">CacheDirLevels</directive> et
717 <directive module="mod_disk_cache">CacheDirLength</directive>.</p>
720 <directive module="mod_disk_cache">CacheDirLevels</directive>
721 définit le nombre de niveaux de sous-répertoires, et
722 <directive module="mod_disk_cache">CacheDirLength</directive>
723 le nombre de caractères composant le nom des sous-répertoires. Dans
724 l'exemple donné plus haut, l'empreinte se trouvera à :
725 <code>/var/cache/apache/x/y/TGxSMO2b68mBCykqkp1w</code>.</p>
727 <p>Cette technique a pour but principal de réduire le nombre de
728 sous-répertoires ou de fichiers contenus dans un répertoire particulier,
729 car le fonctionnement de la plupart des systèmes de fichiers est ralenti
730 quand ce nombre augmente. Avec la valeur "1" pour la directive
731 <directive module="mod_disk_cache">CacheDirLength</directive>,
732 il peut y avoir au plus 64 sous-répertoires à un niveau quelconque.
733 Avec la valeur "2", il peut y en avoir 64 * 64, etc...
734 A moins d'avoir une bonne raison pour ne pas le faire, l'utilisation de
735 la valeur "1" pour la directive
736 <directive module="mod_disk_cache">CacheDirLength</directive>
737 est recommandée.</p>
739 <p>Le paramétrage de la directive
740 <directive module="mod_disk_cache">CacheDirLevels</directive>
741 dépend du nombre de fichiers que vous pensez stocker dans le cache.
742 Avec une valeur de "2" comme dans l'exemple donné plus haut,
743 4096 sous-répertoires peuvent être créés au total. Avec 1 million de
744 fichiers dans le cache, cela équivaut à environ 245 URLs mises en cache
745 dans chaque répertoire.</p>
747 <p>Chaque URL nécessite au moins deux fichiers dans le cache. Ce sont en
748 général un fichier ".header", qui contient des meta-informations à propos
749 de l'URL, comme la date de son arrivée à expiration,
750 et un fichier ".data" qui est la copie exacte du contenu à servir.</p>
752 <p>Dans le cas d'un contenu négocié via l'en-tête "Vary", un répertoire
753 ".vary" sera créé pour l'URL en question. Ce répertoire contiendra de
754 multiples fichiers ".data" correspondant aux différents contenus
755 négociés.</p>
759 <title>Maintenance du cache sur disque</title>
761 <p>Bien que le module <module>mod_disk_cache</module> supprime un contenu
762 du cache lorsqu'il est arrivé à expiration, il ne maintient aucune
763 information à propos de la taille totale du cache ou de l'espace restant
766 <p>Par contre l'utilitaire
767 <a href="programs/htcacheclean.html">htcacheclean</a> fourni avec Apache
768 vous permet, comme son nom l'indique, de nettoyer le cache périodiquement.
769 Déterminer la fréquence à laquelle lancer <a
770 href="programs/htcacheclean.html">htcacheclean</a> et la taille souhaitée
771 pour le cache est une tâche relativement complexe et il vous faudra de
772 nombreux essais et erreurs pour arriver à sélectionner des valeurs
775 <p><a href="programs/htcacheclean.html">htcacheclean</a> opère selon deux
776 modes. Il peut s'exécuter comme démon résident, ou être lancé
777 périodiquement par cron. <a
778 href="programs/htcacheclean.html">htcacheclean</a> peut mettre une heure
779 ou plus pour traiter de très grands caches (plusieurs dizaines de
780 Gigaoctets) et si vous l'exécutez à partir de cron, il vous est
781 conseillé de déterminer la durée typique d'un traitement, afin d'éviter
782 d'exécuter plusieurs instances à la fois.</p>
785 <img src="images/caching_fig1.gif" alt="" width="600"
786 height="406" /><br />
787 <a id="figure1" name="figure1"><dfn>Figure 1</dfn></a>: Croissance
788 typique du cache / séquence de nettoyage.</p>
790 <p>Comme <module>mod_disk_cache</module> ne tient pas compte de l'espace
791 utilisé dans le cache, vous devez vous assurer que
792 <a href="programs/htcacheclean.html">htcacheclean</a> est configuré de
793 façon à laisser suffisamment d'"espace de croissance"
794 à la suite d'un nettoyage.</p>