<?xml-stylesheet type="text/xsl" href="style/manual.fr.xsl"?>
<!-- French translation : Lucien GENTIS -->
<!-- Reviewed by : Vincent Deffontaines -->
-<!-- English Revision : 1174747 -->
+<!-- English Revision : 1210725 -->
<!--
Licensed to the Apache Software Foundation (ASF) under one or more
<section id="introduction">
<title>Introduction</title>
- <p>Depuis la version 2.2 du serveur HTTP Apache, les modules
- <module>mod_cache</module>
- et <module>mod_file_cache</module> ne sont plus jugés expérimentaux
- et on considère qu'ils peuvent être utilisés en production. Ces
- architectures de mise en cache constituent un puissant concept
- d'accélération de la gestion HTTP, tant comme serveur web originel
- que comme mandataire.</p>
-
- <p>Le module <module>mod_cache</module> et son module de soutien
- <module>mod_cache_disk</module>
- permettent une mise en cache intelligente du point de vue HTTP.
- Le contenu proprement dit est stocké dans le cache,
- et mod_cache tente d'honorer tous les en-têtes HTTP et les options
- qui définissent la possibilité de mise en cache du contenu. Il gère non
- seulement le contenu local, mais aussi le contenu mandaté.
- <module>mod_cache</module>
- est conçu pour des configurations de mise en cache simples ou complexes,
- dans lesquels vous traitez de contenu mandaté, de contenu local dynamique
- ou avez besoin d'accélérer l'accès à des fichiers locaux qui sont modifiés
- au cours du temps.</p>
-
- <p>Le module <module>mod_file_cache</module> quant à lui, constitue une
- forme de mise en cache plus basique, mais quelques fois intéressante.
- Plutôt que de gérer la complexité de s'assurer de manière active de la
- possibilité de mise en cache d'URLs,
- <module>mod_file_cache</module> fournit des méthodes pour la gestion
- et l'édition de fichiers en mémoire afin de maintenir un cache de fichiers
- dans l'état où ils étaient la dernière
- fois qu'httpd a démarré.
- En tant que tel, <module>mod_file_cache</module> a été conçu pour améliorer
- le temps d'accès à des fichiers locaux statiques qui ne sont modifiés
- que rarement.</p>
-
- <p>Etant donné que <module>mod_file_cache</module> constitue une
- implémentation de mise en cache relativement simple, mises à part les
- sections spécifiques sur les directives <directive
- module="mod_file_cache">CacheFile</directive> et <directive
- module="mod_file_cache">MMapFile</directive>, les explications fournies
- dans ce guide concernent l'architecture de mise en cache du
- module <module>mod_cache</module>.</p>
+ <p>Le serveur HTTP Apache offre tout un ensemble de fonctionnalités
+ de mise en cache qui ont été conçues pour améliorer les performances
+ du serveur de différentes manières.</p>
+
+ <dl>
+ <dt>Mise en cache HTTP à trois états RFC2616</dt>
+ <dd><module>mod_cache</module> et son module de fournisseur
+ <module>mod_cache_disk</module> proposent une mise en cache
+ intelligente de niveau HTTP. Le contenu proprement dit est
+ stocké dans le cache, et mod_cache vise à respecter tous les
+ en-têtes HTTP, ainsi que les options qui contrôlent la mise en
+ cache du contenu comme décrit dans la <a
+ href="http://www.w3.org/Protocols/rfc2616/rfc2616-sec13.html">Section
+ 13 de la RFC2616</a>. <module>mod_cache</module> peut gérer des
+ configurations de mise en cache simples, mais aussi complexes
+ comme dans les cas où vous avez à faire à des contenus mandatés,
+ à des contenus locaux dynamiques, ou lorsque vous avez besoin
+ d'accélérer l'accès aux fichiers locaux situés sur disque
+ supposé lent.
+ </dd>
+
+ <dt>Mise en cache d'objets partagés de forme clé/valeur à deux
+ états</dt>
+ <dd>
+ <module>mod_socache</module> et ses modules de fournisseurs
+ proposent une mise en cache d'objets partagés à base de
+ couples clé/valeur de niveau serveur. Ces modules sont
+ conçus pour la mise en cache de données de bas niveau comme
+ les sessions SSL et les données d'authentification. les
+ serveurs d'arrière-plan permettent le stockage des données
+ au niveau serveur en mémoire partagée, ou au niveau
+ datacenter dans un cache comme memcache ou distcache.
+ </dd>
+
+ <dt>Mise en cache de fichiers spécialisée</dt>
+ <dd>
+ <module>mod_file_cache</module> offre la possibilité de
+ précharger des fichiers en mémoire au démarrage du serveur,
+ et peut améliorer les temps d'accès et sauvegarder les
+ gestionnaires de fichiers pour les fichiers qui font l'objet
+ d'accès fréquents, évitant ainsi d'avoir à accéder au disque
+ à chaque requête.
+ </dd>
+ </dl>
<p>Pour tirer parti efficacement de ce document, les bases de HTTP doivent
vous être familières, et vous devez avoir lu les sections
</section>
- <section id="overview">
+ <section id="http-caching">
- <title>Vue d'ensemble de la mise en cache</title>
+ <title>Mise en cache HTTP à trois états RFC2616</title>
<related>
<modulelist>
<module>mod_cache</module>
<module>mod_cache_disk</module>
- <module>mod_file_cache</module>
</modulelist>
<directivelist>
<directive module="mod_cache">CacheEnable</directive>
<directive module="mod_cache">CacheDisable</directive>
- <directive module="mod_file_cache">CacheFile</directive>
- <directive module="mod_file_cache">MMapFile</directive>
<directive module="core">UseCanonicalName</directive>
<directive module="mod_negotiation">CacheNegotiatedDocs</directive>
</directivelist>
</related>
- <p><module>mod_cache</module> peut faire intervenir deux phases
- principales pendant la durée de vie d'une requête.
- En premier lieu, <module>mod_cache</module>
- est un module de mise en correspondance d'URLs, ce qui signifie que si
- une URL a été mise en cache, et que la version du cache de cette URL n'est
- pas arrivée à expiration, la requête sera traitée directement par
- <module>mod_cache</module>.</p>
-
- <p>Ceci entraîne que toutes autres actions qui se dérouleraient normalement
- au cours du processus de traitement d'une requête -- par exemple un
- traitement effectué par <module>mod_proxy</module>, ou
- <module>mod_rewrite</module> --
- ne seront pas effectuées. Mais c'est justement l'intérêt
- de la mise en cache préalable du contenu.</p>
-
- <p>Si l'URL ne se trouve pas dans le cache, <module>mod_cache</module>
- va ajouter un <a href="filter.html">filtre</a> au traitement de la requête.
- Une fois le contenu localisé par httpd selon la conception courante, le
- filtre sera exécuté en même temps que le contenu sera servi.
- S'il est déterminé que le contenu peut être mis en cache,
- il sera sauvegardé dans le cache pour une utilisation future.</p>
-
- <p>Si l'URL se trouve dans le cache, mais est arrivée à expiration,
- le filtre est quand-même ajouté, mais <module>mod_cache</module> va créer
- une requête conditionnelle en arrière-plan, pour déterminer si la version
- du cache est encore à jour. Si la version du cache est encore à jour, ses
- meta-informations seront mises à jour et la requête sera servie à partir du
- cache. Si la version du contenu n'est plus à jour, elle sera supprimée et le
- filtre va sauvegarder le contenu mis à jour dans le cache
- au moment où il sera servi.</p>
+ <p>Le module <module>mod_cache</module> permet de tirer avantage du
+ mécanisme de mise en cache en ligne faisant partie
+ intégrante du protocole HTTP, et décrit dans la <a
+ href="http://www.w3.org/Protocols/rfc2616/rfc2616-sec13.html">section
+ 13 de la RFC2616</a>.</p>
+
+ <p>A la différence d'un cache simple clé/valeur à deux états où le
+ contenu est supprimé lorsqu'il est périmé, un cache HTTP comporte un
+ mécanisme permettant de conserver temporairement un contenu périmé,
+ de demander au serveur original si ce contenu périmé a été modifié,
+ et dans le cas contraire de le rendre à nouveau valide.</p>
+
+ <p>Une entrée d'un cache HTTP peut se présenter sous un de ces trois
+ états :</p>
+
+ <dl>
+ <dt>Frais</dt>
+ <dd>
+ Si un contenu est suffisamment récent (plus jeune que sa
+ <strong>durée de fraîcheur</strong>), il est considéré comme
+ <strong>frais</strong>. Un cache HTTP peut servir un contenu
+ frais sans avoir à demander quoi que ce soit au serveur
+ d'origine.
+ </dd>
+ <dt>Périmé</dt>
+ <dd>
+ <p>Si le contenu est trop ancien (plus vieux que sa
+ <strong>durée de fraîcheur</strong>), il est considéré comme
+ <strong>périmé</strong>. Un cache HTTP doit contacter le serveur
+ original pour vérifier si le contenu, même s'il est périmé, est
+ encore à jour avant de le servir au client. Soit le serveur
+ original va répondre en envoyant un contenu de remplacement si
+ le contenu périmé n'est plus à jour, soit dans le cas idéal il
+ renverra un code pour signaler au cache que le contenu est
+ encore à jour, et qu'il est inutile de le générer ou de
+ l'envoyer à nouveau. Le contenu repasse à l'état "frais" et le
+ cycle continue.</p>
+
+ <p>Le protocole HTTP permet au cache de servir des données
+ périmées dans certaines circonstances, comme lorsqu'une
+ tentative de rafraîchir une entrée depuis un serveur original
+ se solde par un échec avec un code d'erreur 5xx, ou lorsqu'une
+ autre requête est déjà en train d'essayer de rafraîchir la même
+ entrée. Dans ces cas, un en-tête <code>Warning</code> est ajouté
+ à la réponse.</p>
+ </dd>
+ <dt>Non Existent</dt>
+ <dd>
+ Si le cache est plein, il se réserve la possibilité de supprimer
+ des entrées pour faire de la place. Une entrée peut être
+ supprimée à tout moment, qu'elle soit fraîche ou périmée.
+ L'outil <a href="programs/htcacheclean.html">htcacheclean</a>
+ peut être utilisé à la demande, ou lancé en tant que démon afin
+ de conserver la taille du cache ou le nombre d'inodes en deçà de
+ valeurs spécifiées. Cet outil essaie cependant de
+ supprimer les entrées périmées avant les entrées fraîches.
+ </dd>
+ </dl>
+
+ <p>Le fonctionnement détaillé d'un cache HTTP est décrit dans la <a
+ href="http://www.w3.org/Protocols/rfc2616/rfc2616-sec13.html">Section
+ 13 de la RFC2616</a>.</p>
+
+ <section>
+ <title>Interaction avec le serveur</title>
+
+ <p>Le module <module>mod_cache</module> interagit avec le serveur
+ à deux niveaux possibles en fonction de la directive <directive
+ module="mod_cache">CacheQuickHandler</directive> :
+ </p>
+
+ <dl>
+ <dt>Phase du gestionnaire rapide</dt>
+ <dd>
+ <p>Cette phase se déroule très tôt au cours du traitement de
+ la requête, juste après l'interprétation de cette dernière. Si
+ le contenu se trouve dans le cache, il est servi immédiatement
+ et pratiquement tout le reste du traitement de la requête est
+ court-circuité.</p>
+
+ <p>Dans ce scénario, le cache se comporte comme s'il avait
+ été "boulonné" à l'entrée du serveur.</p>
+
+ <p>Ce mode possède les meilleures performances car la
+ majorité des traitements au niveau du serveur sont
+ court-circuités. Cependant, il court-circuite aussi les
+ phases d'authentification et d'autorisation du traitement
+ au niveau du serveur, et il doit donc être utilisé avec
+ prudence lorsque que ces phases sont importantes.</p>
+ </dd>
+ <dt>Phase du gestionnaire normal</dt>
+ <dd>
+ <p>Cette phase se déroule très tard au cours du traitement
+ de la requête, en fait après toutes les phases de ce
+ traitement.</p>
+
+ <p>Dans ce scénario, le cache se comporte comme s'il avait
+ été "boulonné" à la sortie du serveur.</p>
+
+ <p>Ce mode offre la plus grande souplesse, car il permet
+ de faire intervenir la mise en cache en un point
+ précisément spécifié de la chaîne de filtrage, et le
+ contenu issu du cache peut être filtré ou personnalisé
+ avant d'être servi au client.</p>
+ </dd>
+ </dl>
+
+ <p>Si l'URL ne se trouve pas dans le cache,
+ <module>mod_cache</module> ajoutera un <a
+ href="filter.html">filtre</a> à la chaîne de filtrage afin
+ d'enregistrer la réponse dans le cache, puis passera la main
+ pour permettre le déroulement normal de la suite du traitement
+ de la requête. Si la mise en cache du contenu est autorisée, il
+ sera enregistré dans le cache pour pouvoir être servi à nouveau
+ ; dans le cas contraire, le contenu sera ignoré.</p>
+
+ <p>Si le contenu trouvé dans le cache est périmé, le module
+ <module>mod_cache</module> convertit la requête en
+ <strong>requête conditionnelle</strong>. Si le serveur original
+ renvoie une réponse normale, elle est enregistrée dans le cache
+ en lieu et place du contenu périmé. Si le serveur original
+ renvoie une réponse "304 Not Modified", le contenu repasse à
+ l'état "frais" et est servi par le filtre au lieu d'être
+ sauvegardé.</p>
+ </section>
<section>
<title>Amélioration du taux de présence dans le cache</title>
- <p>Lors de la mise en cache de contenu généré localement, le
- positionnement de la directive
+ <p>Lorsqu'un serveur virtuel est connu sous la forme d'un des
+ nombreux alias du serveur, la définition de la directive
<directive module="core">UseCanonicalName</directive> à
- <code>On</code> peut améliorer de manière spectaculaire le taux de
- présence dans le cache. Ceci est du au fait que le nom d'hôte de l'hôte
- virtuel qui sert le contenu constitue une partie de la clé de cache.
+ <code>On</code> peut augmenter de manière significative le nombre
+ de correspondances positives dans le cache. Ceci est du au fait
+ que la clé du cache contient le nom d'hôte du serveur virtuel.
Avec <directive module="core">UseCanonicalName</directive> positionnée
à <code>On</code>,
les hôtes virtuels possédant plusieurs noms de serveur ou alias ne
généreront pas d'entités de cache différentes, et le contenu sera mis en
cache en faisant référence au nom d'hôte canonique.</p>
- <p>Les documents mis en cache ne seront servis qu'en réponse à des
- requêtes de type URL, car la mise en cache est effectuée lors de la phase
- de traduction de l'URL en nom de fichier.
- En général, cela n'a que peu d'effet, à moins que vous n'utilisiez les
- <a href="howto/ssi.html">Inclusions Côté Serveur (SSI)</a>;</p>
-
- <example>
-<!-- L'inclusion suivante peut être mise en cache --><br />
-<!--#include virtual="/footer.html" --><br />
-<br />
-<!-- L'inclusion suivante ne peut pas être mise en cache --><br />
-<!--#include file="/path/to/footer.html" --> <br />
- </example>
-
- <p>Si vous utilisez les SSI, et voulez bénéficier de la vitesse de
- service depuis le cache, vous devez utiliser des inclusions de type
- <code>virtual</code>.</p>
</section>
<section>
- <title>Périodes d'expiration</title>
-
- <p>La période d'expiration par défaut pour les entités du cache est
- d'une heure; elle peut cependant être facilement modifiée à l'aide de
+ <title>Durée de fraîcheur</title>
+
+ <p>Un contenu bien formé destiné à être mis en cache doit déclarer
+ explicitement une durée de fraîcheur via les champs
+ <code>max-age</code> ou <code>s-maxage</code> de l'en-tête
+ <code>Cache-Control</code>, ou en incluant un en-tête
+ <code>Expires</code>.</p>
+
+ <p>De plus, un client peut passer outre la durée de fraîcheur
+ définie pour le serveur original en ajoutant son propre en-tête
+ <code>Cache-Control</code> à la requête. Dans ce cas, c'est la
+ durée de fraîcheur la plus basse entre la requête et la réponse
+ qui l'emporte.</p>
+
+ <p>Lorsque cette durée de fraîcheur est absente de la requête ou
+ de la réponse, une durée de fraîcheur par défaut s'applique. La
+ durée de fraîcheur par défaut des entrées du cache est d'une heure
+ ; elle peut cependant être facilement modifiée à l'aide de
la directive <directive
- module="mod_cache">CacheDefaultExpire</directive>. Cette valeur par
- défaut n'est utilisée que lorsque la source originale du contenu ne
- précise pas de période d'expiration ou d'heure de dernière
- modification.</p>
+ module="mod_cache">CacheDefaultExpire</directive>.</p>
<p>Si une réponse ne contient pas d'en-tête <code>Expires</code> mais
inclut un en-tête <code>Last-Modified</code>, <module>mod_cache</module>
- peut déduire une période d'expiration en se basant sur la valeur de la
- directive <directive
+ peut déduire une durée de fraîcheur en se basant sur une
+ heuristique, qui peut être contrôlée via la directive <directive
module="mod_cache">CacheLastModifiedFactor</directive>.</p>
- <p>La période d'expiration des contenus locaux peut être ajustée finement
- en utilisant le module <module>mod_expires</module>.</p>
+ <p>Pour les contenus locaux, ou les contenus distants qui ne
+ spécifient pas leur propre en-tête <code>Expires</code>,
+ <module>mod_expires</module> permet de régler finement la durée de
+ fraîcheur via les paramètres <code>max-age</code> et
+ <code>Expires</code>.</p>
- <p>On peut aussi contrôler la période d'expiration maximale en utilisant
+ <p>On peut aussi contrôler la durée de fraîcheur maximale en utilisant
la directive <directive module="mod_cache">CacheMaxExpire</directive>.</p>
</section>
<section>
<title>Guide succinct des requêtes conditionnelles</title>
- <p>Lorsqu'un contenu est arrivé à expiration dans le cache et fait
- l'objet d'une nouvelle demande d'accès, plutôt que traiter directement
- la requête originale, httpd préfère utiliser une
- requête conditionnelle.</p>
-
- <p>HTTP propose toute une panoplie d'en-têtes qui permettent à un client,
- ou au cache de distinguer les différentes versions d'un même contenu. Par
- exemple, si une ressource a été servie avec un en-tête "Etag:", il est
- possible de créer une requête conditionnelle contenant un en-tête
- "If-None-Match:". Si une ressource a été servie avec un en-tête
- "Last-Modified:", il est possible de créer une requête conditionnelle
- contenant un en-tête "If-Modified-Since:", etc....</p>
-
- <p>Lorsqu'une telle requête conditionnelle est créée, la reponse diffère
- selon que le contenu satisfait ou non aux conditions. Si une requête est
- créée avec un en-tête "If-Modified-Since:", et le contenu n'a pas été
- modifié depuis le moment indiqué dans la requête, alors un laconique
- "304 Not Modified" est retourné.</p>
-
- <p>Si le contenu a été modifié, il est servi comme si la requête n'avait
- pas été conditionnelle à l'origine.</p>
-
- <p>Les bénéfices des requêtes conditionnelles pour ce qui concerne la
- mise en cache sont de deux sortes. Premièrement, quand une telle requête
- est envoyée au processus en arrière-plan, il sera aisé de déterminer
- si le contenu que devra servir le processus en arrière-plan correspond
- au contenu stocké dans le cache, sans être obligé de transmettre la
- totalité de la ressource.</p>
-
- <p>Deuxièmement, les requêtes conditionnelles sont en général moins
- coûteuses en ressources pour le processus en arrière-plan.
- Pour ce qui est des fichiers
- statiques, l'action type est un appel à <code>stat()</code> ou un appel
- système similaire, pour déterminer si la taille du fichier ou sa date de
- modification ont changé. Ainsi, même si httpd met en cache le contenu
- local, un contenu arrivé à expiration pourra être servi plus rapidement
- depuis le cache s'il n'a pas été modifié, parce que la lecture depuis le
- cache est plus rapide que la lecture depuis le processus en arrière-plan
- (à comparer à la différence de vitesse entre la lecture depuis un cache en
- mémoire avec <module>mod_cache_disk</module> et la lecture depuis un disque).</p>
+ <p>Lorsqu'un contenu du cache est périmé, httpd modifie la requête
+ pour en faire une requête conditionnelle</p>
+
+ <p>Lorsque la réponse originale du cache contient un en-tête
+ <code>ETag</code>, <module>mod_cache</module> ajoute un en-tête
+ <code>If-None-Match</code> à la requête envoyée au serveur
+ d'origine. Lorsque la réponse originale du cache contient un en-tête
+ <code>Last-Modified</code>, <module>mod_cache</module> ajoute un en-tête
+ <code>If-Modified-Since</code> à la requête envoyée au serveur
+ d'origine. Dans ces deux cas, la requête devient une requête
+ <strong>conditionnelle</strong>.</p>
+
+ <p>Lorsqu'un serveur d'origine reçoit une requête conditionnelle,
+ il vérifie si le paramètre Etag ou Last-Modified a été modifié en
+ fonction des paramètres de la requête. Si ce n'est pas le cas, il
+ répondra avec le message lapidaire "304 Not Modified". Ceci
+ informe le cache que le contenu est périmé mais encore à jour, et
+ peut être utilisé tel quel pour les prochaines requêtes jusqu'à ce
+ qu'il atteigne à nouveau sa date de péremption.</p>
+
+ <p>Si le contenu a été modifié, il est servi comme s'il s'agissait
+ d'une requête normale et non conditionnelle.</p>
+
+ <p>Les requêtes conditionnelles offrent deux avantages. D'une
+ part, il est facile de déterminer si le contenu du serveur
+ d'origine correspond à celui situé
+ dans le cache, et ainsi d'économiser la consommation de ressources
+ nécessaire au transfert du contenu dans son ensemble.</p>
+
+ <p>D'autre part, un serveur d'origine bien conçu sera configuré de
+ telle manière que les requêtes conditionnelles nécessitent pour
+ leur production bien moins de ressources qu'une réponse complète.
+ Dans le cas des fichiers statiques, il suffit en général d'un
+ appel système de type <code>stat()</code> ou similaire pour
+ déterminer si la taille ou la date de modification du fichier a
+ été modifiée. Ainsi, même un contenu local pourra être servi plus
+ rapidement depuis le cache s'il n'a pas été modifié.</p>
+
+ <p>Il serait souhaitable que tous les serveurs d'origine
+ supportent les requêtes conditionnelles, car dans le cas
+ contraire, ils répondent comme s'il s'agissait d'une requête
+ normale, et le cache répond comme si le contenu avait été
+ modifié et enregistre ce dernier. Le cache se comporte alors
+ comme un simple cache à deux état, où le contenu est servi s'il
+ est à jour, ou supprimé dans le cas contraire.</p>
</section>
<section>
<title>Que peut-on mettre en cache ?</title>
- <p>Comme mentionné plus haut, les deux styles de mise en
- cache de httpd
- fonctionnent différemment; la mise en cache de
- <module>mod_file_cache</module> conserve les contenus des fichiers
- tels qu'ils étaient au démarrage de httpd. Quand une requête pour un
- fichier mis en cache par ce module est envoyée, elle est interceptée
- et le fichier mis en cache est servi.</p>
-
- <p>La mise en cache de <module>mod_cache</module>, quant à elle, est
- plus complexe. Lors du traitement d'une requête, le module de mise en
- cache déterminera si le contenu peut être mis en cache, s'il ne l'a
- pas déjà été auparavant. Les conditions qui permettent de déterminer
- la possibilité de mise en cache d'une réponse sont :</p>
+ <p>La liste complète des conditions nécessaires pour qu'une
+ réponse puisse être enregistrée dans un cache HTTP est fournie
+ dans la <a
+ href="http://www.w3.org/Protocols/rfc2616/rfc2616-sec13.html#sec13.4">section
+ 13.4 Response Cacheability de la RFC2616</a>, et peut se résumer
+ ainsi :</p>
<ol>
<li>La mise en cache doit être activée pour cette URL. Voir les
<li>La requête doit être de type HTTP GET.</li>
- <li>Si la requête contient un en-tête "Authorization:", la réponse ne
- sera pas mise en cache.</li>
-
<li>Si la réponse contient un en-tête "Authorization:", elle doit aussi
contenir une option "s-maxage", "must-revalidate" ou "public"
dans l'en-tête "Cache-Control:".</li>
<section>
<title>Qu'est ce qui ne doit pas être mis en cache ?</title>
- <p>En bref, tout contenu qui varie beaucoup avec le temps, ou en fonction
- de particularités de la requête qui ne sont pas couvertes par la
- négociation HTTP, ne doit pas être mis en cache.</p>
-
- <p>Un contenu dynamique qui varie en fonction de l'adresse IP du
- demandeur, ou est modifié toutes les 5 minutes, ne devra en général
- pas être mis en cache.</p>
+ <p>Le client qui crée la requête ou le serveur d'origine qui
+ génère la réponse doit être à même de déterminer si le contenu
+ doit pouvoir être mis en cache ou non en définissant correctement
+ l'en-tête <code>Cache-Control</code>, et
+ <module>mod_cache</module> sera alors en mesure de satisfaire les
+ souhaits du client ou du serveur de manière appropriée.
+ </p>
- <p>Si par contre le contenu servi diffère en fonction de la valeur de
- divers en-têtes HTTP, il se peut que l'on puisse le mettre en cache
- intelligemment en utilisant un en-tête "Vary".</p>
+ <p>Les contenus qui varient au cours du temps, ou en fonction de
+ particularités de la requête non prises en compte par la
+ négociation HTTP ne doivent pas être mis en cache. Ce type de
+ contenu doit se déclarer lui-même "à ne pas mettre en cache" via
+ l'en-tête <code>Cache-Control</code>.</p>
+
+ <p>Si le contenu change souvent, suite par exemple à une durée de
+ fraîcheur de l'ordre de la minute ou de la seconde, il peut tout
+ de même être mis en cache, mais il est alors fortement souhaitable
+ que le serveur d'origine supporte correctement les
+ <strong>requêtes conditionnelles</strong> afin que des réponses
+ complètes ne soient pas systématiquement générées.</p>
+
+ <p>Un contenu qui varie en fonction d'en-têtes de requête fournis
+ par le client peut être mis en cache, sous réserve d'une
+ utilisation appropriée de l'en-tête de réponse <code>Vary</code>.</p>
</section>
<section>
<title>Contenu variable et/ou négocié</title>
- <p>Si <module>mod_cache</module> reçoit une réponse contenant un en-tête
- "Vary", lorsqu'un contenu a été demandé par un processus d'arrière-plan,
- il va s'efforcer de la traiter intelligemment. Si possible,
- <module>mod_cache</module> va détecter les en-têtes attribués dans la
- réponse "Vary" à l'occasion des futures demandes, et servir une réponse
- correcte à partir du cache.</p>
+ <p>Lorsque le serveur d'origine est configuré pour servir des
+ contenus différents en fonction de la valeur de certains en-têtes
+ de la requête, par exemple pour servir une ressource en plusieurs
+ langages à partir d'une seule URL, le mécanisme de mise en cache
+ d'HTTP permet de mettre en cache plusieurs variantes de la même
+ page à partir d'une seule URL.</p>
+
+ <p>Pour y parvenir, le serveur d'origine ajoute un en-tête
+ <code>Vary</code> pour indiquer quels en-têtes doivent être pris
+ en compte par un cache pour déterminer si deux variantes sont
+ différentes l'une de l'autre.</p>
<p>Si par exemple, une réponse est reçue avec l'en-tête Vary suivant,</p>
<p><module>mod_cache</module> ne servira aux demandeurs que le contenu
mis en cache qui correspond au contenu des en-têtes accept-language et
accept-charset de la requête originale.</p>
+
+ <p>Plusieurs variantes d'un contenu peuvent être mises en cache
+ simultanément ; <module>mod_cache</module> utilise l'en-tête
+ <code>Vary</code> et les valeurs correspondantes des en-têtes de
+ la requête spécifiés dans ce dernier pour
+ déterminer quelle variante doit être servie au client.</p>
+
</section>
- </section>
+ <section id="disk">
+ <title>Mise en cache sur disque</title>
- <section id="security">
- <title>Considérations sur la sécurité</title>
+ <p>Le module <module>mod_cache</module> s'appuie sur des
+ implémentations de stockage en arrière-plan spécifiques pour gérer
+ le cache ; à ce titre, <module>mod_cache_disk</module> fournit le
+ support de la mise en cache sur disque.</p>
- <section>
- <title>Autorisation et contrôle d'accès</title>
+ <p>En général, le module se configure comme suit :</p>
- <p>Utiliser <module>mod_cache</module> revient sensiblement à la même
- chose qu'avoir un mandataire inverse intégré (reverse-proxy). Les requêtes
- seront servies par le module de mise en cache sauf si ce dernier
- détermine qu'un processus d'arrière-plan doit être appelé. La mise en
- cache de ressources locales modifie considérablement le modèle de
- sécurité de httpd.</p>
+ <example>
+CacheRoot /var/cache/apache/<br />
+CacheEnable disk /<br />
+CacheDirLevels 2<br />
+CacheDirLength 1
+ </example>
- <p>Comme le parcours de la hiérarchie d'un système de fichiers pour
- examiner le contenu d'éventuels fichiers
- <code>.htaccess</code> serait une opération très coûteuse en ressources,
- annulant partiellement de ce fait l'intérêt de la mise en cache
- (accélérer le traitement des requêtes),
- <module>mod_cache</module> ne se préoccupe pas de savoir s'il a
- l'autorisation de servir une entité mise en cache. En d'autres termes,
- si <module>mod_cache</module> a mis en cache un certain contenu, ce
- dernier sera servi à partir du cache tant qu'il ne sera pas arrivé à
- expiration.</p>
+ <p>Il est important de savoir que, les fichiers mis en cache étant stockés
+ localement, la mise en cache par l'intermédiaire du système d'exploitation
+ sera en général aussi appliquée à leurs accès. Si bien que même si les
+ fichiers sont stockés sur disque, s'il font l'objet d'accès fréquents,
+ il est probable que le système d'exploitation s'appliquera à ce qu'ils
+ soient servis à partir de la mémoire.</p>
- <p>Si par exemple, votre configuration autorise l'accès à une ressource
- en fonction de l'adresse IP, vous devez vous assurer que ce contenu n'est
- pas mis en cache. Ceci est possible en utilisant la directive
- <directive module="mod_cache">CacheDisable</directive>, ou le module
- <module>mod_expires</module>. Livré à lui-même,
- <module>mod_cache</module> - pratiquement comme un mandataire inverse -
- mettrait en cache le contenu lors de son service, et le servirait ensuite
- à tout client, vers n'importe quelle adresse IP.</p>
</section>
<section>
- <title>Piratages locaux</title>
+ <title>Comprendre le stockage dans le cache</title>
- <p>Etant donné que les requêtes des utilisateurs finaux peuvent être
- servies depuis le cache, ce dernier est une cible potentielle pour ceux
- qui veulent défigurer un contenu ou interférer avec lui. Il est important
- de garder à l'esprit que l'utilisateur sous lequel tourne
- httpd doit
- toujours avoir l'accès en écriture dans le cache. Ceci est en contraste
- total avec la recommandation usuelle d'interdire à l'utilisateur sous
- lequel tourne Apache
- l'accès en écriture à tout contenu.</p>
+ <p>Pour stocker des entités dans le cache,
+ le module <module>mod_cache_disk</module> crée une empreinte (hash) de 22
+ caractères de l'URL qui a fait l'objet d'une requête. Cette empreinte
+ comprend le nom d'hôte, le protocole, le port, le chemin et tout argument
+ de type CGI associé à l'URL, ainsi que les éléments
+ spécifiés dans l'en-tête Vary afin d'être sur que plusieurs URLs
+ n'interfèrent pas entre elles.</p>
- <p>Si l'utilisateur sous lequel tourne Apache est compromis,
- par exemple à cause d'une
- faille de sécurité dans un processus CGI, il est possible que le cache
- fasse l'objet d'une attaque. Il est relativement aisé d'insérer ou de
- modifier une entité dans le cache en utilisant le module
- <module>mod_cache_disk</module>.</p>
+ <p>Chaque position de l'empreinte peut contenir un caractère
+ choisi parmi 64 caractères différents, il y a donc
+ 64^22 possibilités pour une empreinte. Par exemple, une URL peut posséder
+ l'empreinte <code>xyTGxSMO2b68mBCykqkp1w</code>. Cette empreinte est
+ utilisée pour préfixer les noms de fichiers spécifiques à cette URL à
+ l'intérieur du cache; cependant, elle est tout d'abord placée dans les
+ répertoires du cache selon les directives
+ <directive module="mod_cache_disk">CacheDirLevels</directive> et
+ <directive module="mod_cache_disk">CacheDirLength</directive>.</p>
- <p>Cela représente un risque relativement élévé par rapport aux autres
- types d'attaques qu'il est possible de mener sous l'utilisateur apache.
- Si vous utilisez <module>mod_cache_disk</module>, vous devez garder ceci
- à l'esprit : effectuez toujours les mises à jour de
- httpdquand des
- correctifs de sécurité sont annoncés et exécutez les processus CGI sous
- un utilisateur autre qu'apache en utilisant
- <a href="suexec.html">suEXEC</a> dans la mesure du possible.</p>
+ <p>La directive
+ <directive module="mod_cache_disk">CacheDirLevels</directive>
+ définit le nombre de niveaux de sous-répertoires, et
+ <directive module="mod_cache_disk">CacheDirLength</directive>
+ le nombre de caractères composant le nom des sous-répertoires. Dans
+ l'exemple donné plus haut, l'empreinte se trouvera à :
+ <code>/var/cache/apache/x/y/TGxSMO2b68mBCykqkp1w</code>.</p>
+ <p>Cette technique a pour but principal de réduire le nombre de
+ sous-répertoires ou de fichiers contenus dans un répertoire particulier,
+ car le fonctionnement de la plupart des systèmes de fichiers est ralenti
+ quand ce nombre augmente. Avec la valeur "1" pour la directive
+ <directive module="mod_cache_disk">CacheDirLength</directive>,
+ il peut y avoir au plus 64 sous-répertoires à un niveau quelconque.
+ Avec la valeur "2", il peut y en avoir 64 * 64, etc...
+ A moins d'avoir une bonne raison pour ne pas le faire, l'utilisation de
+ la valeur "1" pour la directive
+ <directive module="mod_cache_disk">CacheDirLength</directive>
+ est recommandée.</p>
+
+ <p>Le paramétrage de la directive
+ <directive module="mod_cache_disk">CacheDirLevels</directive>
+ dépend du nombre de fichiers que vous pensez stocker dans le cache.
+ Avec une valeur de "2" comme dans l'exemple donné plus haut,
+ 4096 sous-répertoires peuvent être créés au total. Avec 1 million de
+ fichiers dans le cache, cela équivaut à environ 245 URLs mises en cache
+ dans chaque répertoire.</p>
+
+ <p>Chaque URL nécessite au moins deux fichiers dans le cache. Ce sont en
+ général un fichier ".header", qui contient des meta-informations à propos
+ de l'URL, comme la date de son arrivée à expiration,
+ et un fichier ".data" qui est la copie exacte du contenu à servir.</p>
+
+ <p>Dans le cas d'un contenu négocié via l'en-tête "Vary", un répertoire
+ ".vary" sera créé pour l'URL en question. Ce répertoire contiendra de
+ multiples fichiers ".data" correspondant aux différents contenus
+ négociés.</p>
</section>
<section>
- <title>Empoisonnement du cache (Cache Poisoning)</title>
+ <title>Maintenance du cache sur disque</title>
- <p>Si vous utilisez httpd comme serveur mandataire avec mise en cache,
- vous vous exposez aussi à un éventuel "Empoisonnement du
- cache" (Cache poisoning). L'empoisonnement du cache est un terme général
- pour désigner les attaques au cours desquelles l'attaquant fait en sorte
- que le serveur mandataire renvoie à un contenu incorrect (et souvent
- indésirable) suite à en provenance du serveur d'arrière-plan.
- </p>
+ <p>Le module <module>mod_cache_disk</module> n'effectue aucune
+ régulation de l'espace disque utilisé par le cache, mais s'il
+ s'arrête en douceur en cas d'erreur disque et se comporte alors
+ comme si le cache n'avait jamais existé.</p>
- <p>Par exemple, si les serveur DNS qu'utilise votre système où tourne
- httpd sont vulnérables à l'empoisonnement du cache des DNS, un attaquant
- pourra contrôler vers où httpd se connecte lorsqu'il demande un contenu
- depuis le serveur d'origine.
- Un autre exemple est constitué par les attaques ainsi nommées
- "Dissimulation de requêtes HTTP" (HTTP request-smuggling).</p>
+ <p>Par contre l'utilitaire
+ <a href="programs/htcacheclean.html">htcacheclean</a> fourni avec
+ httpd
+ vous permet de nettoyer le cache périodiquement.
+ Déterminer la fréquence à laquelle lancer <a
+ href="programs/htcacheclean.html">htcacheclean</a> et la taille souhaitée
+ pour le cache est une tâche relativement complexe et il vous faudra de
+ nombreux essais et erreurs pour arriver à sélectionner des valeurs
+ optimales.</p>
- <p>Ce document n'est pas le bon endroit pour une discussion approfondie
- à propos de la Dissimulation de requêtes HTTP (utilisez plutôt votre
- moteur de recherche favori); il est cependant important de savoir qu'il
- est possible d'élaborer une série de requêtes, et d'exploiter une
- vulnérabilité d'un serveur web d'origine de telle façon que l'attaquant
- puisse contrôler entièrement le contenu renvoyé par le mandataire.</p>
+ <p><a href="programs/htcacheclean.html">htcacheclean</a> opère selon deux
+ modes. Il peut s'exécuter comme démon résident, ou être lancé
+ périodiquement par cron. <a
+ href="programs/htcacheclean.html">htcacheclean</a> peut mettre une heure
+ ou plus pour traiter de très grands caches (plusieurs dizaines de
+ Gigaoctets) et si vous l'exécutez à partir de cron, il vous est
+ conseillé de déterminer la durée typique d'un traitement, afin d'éviter
+ d'exécuter plusieurs instances à la fois.</p>
+
+ <p>Il est aussi conseillé d'attribuer un niveau de priorité "nice"
+ approprié à htcacheclean de façon à ce qu'il n'effectue pas trop
+ d'accès disque pendant le fonctionnement du serveur.</p>
+
+ <p class="figure">
+ <img src="images/caching_fig1.gif" alt="" width="600"
+ height="406" /><br />
+ <a id="figure1" name="figure1"><dfn>Figure 1</dfn></a>: Croissance
+ typique du cache / séquence de nettoyage.</p>
+
+ <p>Comme <module>mod_cache_disk</module> ne tient pas compte de l'espace
+ utilisé dans le cache, vous devez vous assurer que
+ <a href="programs/htcacheclean.html">htcacheclean</a> est configuré de
+ façon à laisser suffisamment d'"espace de croissance"
+ à la suite d'un nettoyage.</p>
</section>
+
</section>
- <section id="filehandle">
- <title>Mise en cache de la gestion de fichier</title>
+ <section id="socache-caching">
+
+ <title>Mise en cache d'objets partagés à deux états de forme
+ clé/valeur</title>
<related>
<modulelist>
- <module>mod_file_cache</module>
+ <module>mod_authn_socache</module>
+ <module>mod_socache_dbm</module>
+ <module>mod_socache_dc</module>
+ <module>mod_socache_memcache</module>
+ <module>mod_socache_shmcb</module>
+ <module>mod_ssl</module>
</modulelist>
- <directivelist>
- <directive module="mod_file_cache">CacheFile</directive>
- </directivelist>
+ <directivelist>
+ <directive module="mod_authn_socache">AuthnCacheSOCache</directive>
+ <directive module="mod_ssl">SSLSessionCache</directive>
+ <directive module="mod_ssl">SSLStaplingCache</directive>
+ </directivelist>
</related>
+
+ <p>Le serveur HTTP Apache fournit un cache d'objets partagés de bas
+ niveau pour la mise en cache d'informations comme les sessions SSL
+ ou les données d'authentification dans l'interface <a
+ href="socache.html">socache</a>.</p>
+
+ <p>Pour chaque implémentation un module supplémentaire est fourni
+ qui offre les services d'arrière-plan suivants :</p>
+
+ <dl>
+ <dt><module>mod_socache_dbm</module></dt>
+ <dd>Cache d'objets partagés basé sur DBM.</dd>
+ <dt><module>mod_socache_dc</module></dt>
+ <dd>Cache d'objets partagés basé sur Distcache.</dd>
+ <dt><module>mod_socache_memcache</module></dt>
+ <dd>Cache d'objets partagés basé sur Memcache.</dd>
+ <dt><module>mod_socache_shmcb</module></dt>
+ <dd>Cache d'objets partagés basé sur la mémoire partagée.</dd>
+ </dl>
+
+ <section id="mod_authn_socache-caching">
+ <title>Mise en cache des données d'authentification</title>
+
+ <related>
+ <modulelist>
+ <module>mod_authn_socache</module>
+ </modulelist>
+ <directivelist>
+ <directive module="mod_authn_socache">AuthnCacheSOCache</directive>
+ </directivelist>
+ </related>
+
+ <p>Le module <module>mod_authn_socache</module> permet la mise en
+ cache des données issues d'une authentification, diminuant ainsi
+ la charge des serveurs d'authentification en arrière-plan.</p>
- <p>Le fait d'ouvrir un fichier peut en lui-même introduire un délai,
- en particulier dans les systèmes de fichiers répartis
- sur le réseau. httpd
- peut s'affranchir de ce délai en maintenant
- un cache des descripteurs de fichiers
- ouverts pour ce qui concerne les fichiers souvent
- accédés. httpd propose
- actuellement une implémentation de mise en cache de la
- gestion de fichier.</p>
-
- <section>
- <title>Directive CacheFile</title>
+ </section>
- <p>La forme la plus élémentaire de mise en cache que
- propose httpd est
- fournie par le module <module>mod_file_cache</module>.
- Plutôt que de mettre en cache le contenu des fichiers, ce cache maintient
- une table des descripteurs de fichiers ouverts. Les fichiers à mettre en
- cache de cette manière sont spécifiés dans le fichier de configuration
- en utilisant la directive
- <directive module="mod_file_cache">CacheFile</directive>.</p>
+ <section id="mod_ssl-caching">
+ <title>Mise en cache des sessions SSL</title>
- <p>La directive
- <directive module="mod_file_cache">CacheFile</directive> demande
- à httpd
- d'ouvrir le fichier lors de son démarrage et de réutiliser le descripteur
- de fichier élaboré à cette occasion pour tous les
- accès ultérieurs à ce fichier.</p>
+ <related>
+ <modulelist>
+ <module>mod_ssl</module>
+ </modulelist>
+ <directivelist>
+ <directive module="mod_ssl">SSLSessionCache</directive>
+ <directive module="mod_ssl">SSLStaplingCache</directive>
+ </directivelist>
+ </related>
- <example>
- CacheFile /usr/local/apache2/htdocs/index.html
- </example>
+ <p>Le module <module>mod_ssl</module> utilise l'interface
+ <code>socache</code> pour fournir un cache de session et un cache
+ de base.</p>
- <p>Si vous avez l'intention de mettre en cache un grand nombre de
- fichiers de cette manière, vous devez vous assurer que le nombre maximum
- de fichiers ouverts par votre système d'exploitation est correctement
- défini.</p>
-
- <p>Bien que l'utilisation de la directive
- <directive module="mod_file_cache">CacheFile</directive>
- n'entraîne pas la mise en cache du contenu du fichier, cela ne signifie
- pas qu'en cas de modification du fichier pendant
- l'exécution de httpd,
- ces changements seront pris en compte. Le fichier sera toujours servi
- dans l'état où il était quand httpd a démarré.</p>
-
- <p>Si le fichier est supprimé pendant l'exécution de
- httpd, ce dernier
- continuera à maintenir un descripteur de fichier ouvert et à servir le
- fichier dans l'état où il était quand httpd a démarré. Cela signifie
- aussi habituellement que malgré le fait que le fichier ait été supprimé,
- et ne soit
- plus accessible par le système de fichiers, l'espace libéré ne sera
- restitué qu'à l'arrêt de httpd quand le
- descripteur de fichier sera fermé.</p>
</section>
-
</section>
- <section id="inmemory">
- <title>Mise en cache en mémoire</title>
+ <section id="file-caching">
+
+ <title>Mise en cache à base de fichiers spécialisés</title>
- <related>
+ <related>
<modulelist>
<module>mod_file_cache</module>
</modulelist>
<directivelist>
- <directive module="mod_cache">CacheEnable</directive>
- <directive module="mod_cache">CacheDisable</directive>
+ <directive module="mod_file_cache">CacheFile</directive>
<directive module="mod_file_cache">MMapFile</directive>
</directivelist>
</related>
+ <p>Sur les plateformes où le système de fichiers peut être lent, ou
+ lorsque les descripteurs de fichiers sont gourmands en ressources,
+ il est possible de précharger des fichiers en mémoire au démarrage
+ du serveur.</p>
+
+ <p>Sur les systèmes où l'ouverture des fichiers est lente, il est
+ possible d'ouvrir le fichier au démarrage du serveur et de mettre en
+ cache le descripteur de fichier. Ces options peuvent vous aider sur
+ les systèmes où l'accès aux fichiers statiques est lent.</p>
+
+ <section id="filehandle">
+ <title>Mise en cache des descripteurs de fichier</title>
+
+ <p>Le processus d'ouverture d'un fichier peut être en soi une
+ source de ralentissement, en particulier sur les systèmes de
+ fichiers sur le réseau. httpd permet d'éviter ce ralentissement en
+ maintenant un cache des descripteurs de fichiers ouverts pour les
+ fichiers souvent servis. Actuellement, httpd fournit une seule
+ implémentation de mise en cache des descripteurs de fichiers.</p>
+
+ <section>
+ <title>CacheFile</title>
+
+ <p>La forme la plus basique de mise en cache que propose httpd
+ est la mise en cache des descripteurs de fichiers fournie par le
+ module <module>mod_file_cache</module>. Plutôt que de mettre en
+ cache le contenu des fichiers, ce cache maintient une table des
+ descripteurs de fichiers ouverts. Les fichiers devant faire
+ l'objet d'une mise en cache de ce type sont spécifiés dans le
+ fichier de configuration via la directive <directive
+ module="mod_file_cache">CacheFile</directive>.</p>
+
+ <p>La directive <directive
+ module="mod_file_cache">CacheFile</directive> informe httpd
+ qu'il doit ouvrir le fichier lors de son démarrage et qu'il doit
+ réutiliser le descripteur de fichier mis en cache pour tous les
+ accès futurs à ce fichier.</p>
+
+ <example>
+ CacheFile /usr/local/apache2/htdocs/index.html
+ </example>
+
+ <p>Si vous désirez mettre en cache un grand nombre de fichiers
+ de cette manière, vous devez vous assurer que le nombre maximal
+ de fichiers ouverts pour votre système d'exploitation est défini
+ à une valeur suffisante.</p>
+
+ <p>Bien que l'utilisation de la directive <directive
+ module="mod_file_cache">CacheFile</directive> n'entraîne pas de
+ mise en cache du contenu du fichier proprement dit, elle
+ implique que si le fichier est modifié pendant l'exécution du
+ serveur, ces modifications ne seront pas prises en compte. Le
+ fichier sera toujours servi dans l'état où il se trouvait au
+ moment du démarrage du serveur.</p>
+
+ <p>Si le fichier est supprimé pendant l'exécution du serveur, ce
+ dernier conservera le descripteur de fichier ouvert associé et
+ servira le fichier dans l'état où il se trouvait au
+ moment du démarrage du serveur. Cela signifie aussi que même si
+ le fichier a été supprimé, et n'apparaît donc plus dans le
+ système de fichiers, l'espace disque libéré ne sera disponible
+ qu'une fois le serveur httpd arrêté et donc le descripteur de
+ fichier fermé.</p>
+ </section>
+
+ </section>
+
+ <section id="inmemory">
+ <title>In-Memory Caching</title>
+
<p>Servir un contenu directement depuis la mémoire système est
universellement reconnu comme la méthode la plus rapide. Lire des fichiers
depuis un contrôleur de disque ou pire, depuis un réseau distant est plus
Sinon le système sera contraint d'utiliser le swap, ce qui dégradera
sensiblement les performances.</p>
- <section>
+ <section>
<title>Mise en cache par l'intermédiaire du système d'exploitation</title>
<p>Dans la plupart des systèmes d'exploitation modernes, c'est le noyau
temps nécessaire à la première lecture d'un fichier et le temps
nécessaire à sa deuxième lecture;</p>
- <example><pre>
+ <example><pre>
colm@coroebus:~$ time cat testfile > /dev/null
real 0m0.065s
user 0m0.000s
real 0m0.003s
user 0m0.003s
sys 0m0.000s</pre>
- </example>
+ </example>
<p>Même pour ce petit fichier, il y a une grande différence entre les
temps nécessaires pour lire le fichier. Ceci est du au fait que le
avantage par rapport à la mise en cache en mémoire
de httpd qui n'a
aucune possibilité de savoir si un fichier a été modifié.</p>
- </section>
+ </section>
<p>En dépit des performances et des avantages de la mise en cache
automatique par le système d'exploitation, la mise en cache en mémoire
utilisera le contenu chargé en mémoire pour satisfaire ultérieurement
toutes les demandes d'accès à ce fichier.</p>
- <example>
- MMapFile /usr/local/apache2/htdocs/index.html
- </example>
+ <example>
+ MMapFile /usr/local/apache2/htdocs/index.html
+ </example>
<p>Comme dans le cas de la directive
<directive module="mod_file_cache">CacheFile</directive>, toute
sa propre réplique de la mémoire allouée, il est donc d'une importance
critique de s'assurer que les fichiers chargés ne sont pas d'une taille
trop importante afin d'épargner au système l'utilisation du swap.</p>
+ </section>
</section>
-
</section>
- <section id="disk">
- <title>Mise en cache sur disque</title>
-
- <related>
- <modulelist>
- <module>mod_cache_disk</module>
- </modulelist>
- <directivelist>
- <directive module="mod_cache">CacheEnable</directive>
- <directive module="mod_cache">CacheDisable</directive>
- </directivelist>
- </related>
-
- <p>Le module <module>mod_cache_disk</module> fournit un mécanisme de mise
- en cache sur disque au module <module>mod_cache</module>. Cette mise en cache est
- intelligente et le contenu ne sera servi qu'à partir du cache tant qu'il
- sera considéré comme valide.</p>
+ <section id="security">
+ <title>Considérations sur la sécurité</title>
- <p>Typiquement, le module sera configuré comme suit :</p>
+ <section>
+ <title>Autorisation et contrôle d'accès</title>
- <example>
-CacheRoot /var/cache/apache/<br />
-CacheEnable disk /<br />
-CacheDirLevels 2<br />
-CacheDirLength 1
- </example>
+ <p>Utiliser <module>mod_cache</module> revient sensiblement à la même
+ chose qu'avoir un mandataire inverse intégré (reverse-proxy). Les requêtes
+ seront servies par le module de mise en cache sauf si ce dernier
+ détermine qu'un processus d'arrière-plan doit être appelé. La mise en
+ cache de ressources locales modifie considérablement le modèle de
+ sécurité de httpd.</p>
- <p>Il est important de savoir que, les fichiers mis en cache étant stockés
- localement, la mise en cache par l'intermédiaire du système d'exploitation
- sera en général aussi appliquée à leurs accès. Si bien que même si les
- fichiers sont stockés sur disque, s'il font l'objet d'accès fréquents,
- il est probable que le système d'exploitation s'appliquera à ce qu'ils
- soient servis à partir de la mémoire.</p>
+ <p>Comme le parcours de la hiérarchie d'un système de fichiers pour
+ examiner le contenu d'éventuels fichiers
+ <code>.htaccess</code> serait une opération très coûteuse en ressources,
+ annulant partiellement de ce fait l'intérêt de la mise en cache
+ (accélérer le traitement des requêtes),
+ <module>mod_cache</module> ne se préoccupe pas de savoir s'il a
+ l'autorisation de servir une entité mise en cache. En d'autres termes,
+ si <module>mod_cache</module> a mis en cache un certain contenu, ce
+ dernier sera servi à partir du cache tant qu'il ne sera pas arrivé à
+ expiration.</p>
- <section>
- <title>Comprendre le stockage dans le cache</title>
+ <p>Si par exemple, votre configuration autorise l'accès à une ressource
+ en fonction de l'adresse IP, vous devez vous assurer que ce contenu n'est
+ pas mis en cache. Ceci est possible en utilisant la directive
+ <directive module="mod_cache">CacheDisable</directive>, ou le module
+ <module>mod_expires</module>. Livré à lui-même,
+ <module>mod_cache</module> - pratiquement comme un mandataire inverse -
+ mettrait en cache le contenu lors de son service, et le servirait ensuite
+ à tout client, vers n'importe quelle adresse IP.</p>
- <p>Pour stocker des entités dans le cache,
- le module <module>mod_cache_disk</module> crée une empreinte (hash) de 22
- caractères de l'URL qui a fait l'objet d'une requête. Cette empreinte
- comprend le nom d'hôte, le protocole, le port, le chemin et tout argument
- de type CGI associé à l'URL, afin d'être sur que plusieurs URLs
- n'interfèrent pas entre elles.</p>
+ <p>Lorsque la directive <directive
+ module="mod_cache">CacheQuickHandler</directive> est définie à
+ <code>Off</code>, toutes les phases du traitement de la requête
+ sont exécutées et le modèle de sécurité reste le même.</p>
- <p>Chaque position de l'empreinte peut contenir un caractère
- choisi parmi 64 caractères différents, il y a donc
- 64^22 possibilités pour une empreinte. Par exemple, une URL peut posséder
- l'empreinte <code>xyTGxSMO2b68mBCykqkp1w</code>. Cette empreinte est
- utilisée pour préfixer les noms de fichiers spécifiques à cette URL à
- l'intérieur du cache; cependant, elle est tout d'abord placée dans les
- répertoires du cache selon les directives
- <directive module="mod_cache_disk">CacheDirLevels</directive> et
- <directive module="mod_cache_disk">CacheDirLength</directive>.</p>
+ </section>
- <p>La directive
- <directive module="mod_cache_disk">CacheDirLevels</directive>
- définit le nombre de niveaux de sous-répertoires, et
- <directive module="mod_cache_disk">CacheDirLength</directive>
- le nombre de caractères composant le nom des sous-répertoires. Dans
- l'exemple donné plus haut, l'empreinte se trouvera à :
- <code>/var/cache/apache/x/y/TGxSMO2b68mBCykqkp1w</code>.</p>
+ <section>
+ <title>Piratages locaux</title>
- <p>Cette technique a pour but principal de réduire le nombre de
- sous-répertoires ou de fichiers contenus dans un répertoire particulier,
- car le fonctionnement de la plupart des systèmes de fichiers est ralenti
- quand ce nombre augmente. Avec la valeur "1" pour la directive
- <directive module="mod_cache_disk">CacheDirLength</directive>,
- il peut y avoir au plus 64 sous-répertoires à un niveau quelconque.
- Avec la valeur "2", il peut y en avoir 64 * 64, etc...
- A moins d'avoir une bonne raison pour ne pas le faire, l'utilisation de
- la valeur "1" pour la directive
- <directive module="mod_cache_disk">CacheDirLength</directive>
- est recommandée.</p>
+ <p>Etant donné que les requêtes des utilisateurs finaux peuvent être
+ servies depuis le cache, ce dernier est une cible potentielle pour ceux
+ qui veulent défigurer un contenu ou interférer avec lui. Il est important
+ de garder à l'esprit que l'utilisateur sous lequel tourne
+ httpd doit
+ toujours avoir l'accès en écriture dans le cache. Ceci est en contraste
+ total avec la recommandation usuelle d'interdire à l'utilisateur sous
+ lequel tourne Apache
+ l'accès en écriture à tout contenu.</p>
- <p>Le paramétrage de la directive
- <directive module="mod_cache_disk">CacheDirLevels</directive>
- dépend du nombre de fichiers que vous pensez stocker dans le cache.
- Avec une valeur de "2" comme dans l'exemple donné plus haut,
- 4096 sous-répertoires peuvent être créés au total. Avec 1 million de
- fichiers dans le cache, cela équivaut à environ 245 URLs mises en cache
- dans chaque répertoire.</p>
+ <p>Si l'utilisateur sous lequel tourne Apache est compromis,
+ par exemple à cause d'une
+ faille de sécurité dans un processus CGI, il est possible que le cache
+ fasse l'objet d'une attaque. Il est relativement aisé d'insérer ou de
+ modifier une entité dans le cache en utilisant le module
+ <module>mod_cache_disk</module>.</p>
- <p>Chaque URL nécessite au moins deux fichiers dans le cache. Ce sont en
- général un fichier ".header", qui contient des meta-informations à propos
- de l'URL, comme la date de son arrivée à expiration,
- et un fichier ".data" qui est la copie exacte du contenu à servir.</p>
+ <p>Cela représente un risque relativement élévé par rapport aux autres
+ types d'attaques qu'il est possible de mener sous l'utilisateur apache.
+ Si vous utilisez <module>mod_cache_disk</module>, vous devez garder ceci
+ à l'esprit : effectuez toujours les mises à jour de
+ httpdquand des
+ correctifs de sécurité sont annoncés et exécutez les processus CGI sous
+ un utilisateur autre qu'apache en utilisant
+ <a href="suexec.html">suEXEC</a> dans la mesure du possible.</p>
- <p>Dans le cas d'un contenu négocié via l'en-tête "Vary", un répertoire
- ".vary" sera créé pour l'URL en question. Ce répertoire contiendra de
- multiples fichiers ".data" correspondant aux différents contenus
- négociés.</p>
</section>
<section>
- <title>Maintenance du cache sur disque</title>
-
- <p>Bien que le module <module>mod_cache_disk</module> supprime un contenu
- du cache lorsqu'il est arrivé à expiration, il ne maintient aucune
- information à propos de la taille totale du cache ou de l'espace restant
- disponible.</p>
-
- <p>Par contre l'utilitaire
- <a href="programs/htcacheclean.html">htcacheclean</a> fourni avec
- httpd
- vous permet, comme son nom l'indique, de nettoyer le cache périodiquement.
- Déterminer la fréquence à laquelle lancer <a
- href="programs/htcacheclean.html">htcacheclean</a> et la taille souhaitée
- pour le cache est une tâche relativement complexe et il vous faudra de
- nombreux essais et erreurs pour arriver à sélectionner des valeurs
- optimales.</p>
+ <title>Empoisonnement du cache (Cache Poisoning)</title>
- <p><a href="programs/htcacheclean.html">htcacheclean</a> opère selon deux
- modes. Il peut s'exécuter comme démon résident, ou être lancé
- périodiquement par cron. <a
- href="programs/htcacheclean.html">htcacheclean</a> peut mettre une heure
- ou plus pour traiter de très grands caches (plusieurs dizaines de
- Gigaoctets) et si vous l'exécutez à partir de cron, il vous est
- conseillé de déterminer la durée typique d'un traitement, afin d'éviter
- d'exécuter plusieurs instances à la fois.</p>
+ <p>Si vous utilisez httpd comme serveur mandataire avec mise en cache,
+ vous vous exposez aussi à un éventuel "Empoisonnement du
+ cache" (Cache poisoning). L'empoisonnement du cache est un terme général
+ pour désigner les attaques au cours desquelles l'attaquant fait en sorte
+ que le serveur mandataire renvoie à un contenu incorrect (et souvent
+ indésirable) suite à en provenance du serveur d'arrière-plan.
+ </p>
- <p class="figure">
- <img src="images/caching_fig1.gif" alt="" width="600"
- height="406" /><br />
- <a id="figure1" name="figure1"><dfn>Figure 1</dfn></a>: Croissance
- typique du cache / séquence de nettoyage.</p>
+ <p>Par exemple, si les serveur DNS qu'utilise votre système où tourne
+ httpd sont vulnérables à l'empoisonnement du cache des DNS, un attaquant
+ pourra contrôler vers où httpd se connecte lorsqu'il demande un contenu
+ depuis le serveur d'origine.
+ Un autre exemple est constitué par les attaques ainsi nommées
+ "Dissimulation de requêtes HTTP" (HTTP request-smuggling).</p>
- <p>Comme <module>mod_cache_disk</module> ne tient pas compte de l'espace
- utilisé dans le cache, vous devez vous assurer que
- <a href="programs/htcacheclean.html">htcacheclean</a> est configuré de
- façon à laisser suffisamment d'"espace de croissance"
- à la suite d'un nettoyage.</p>
+ <p>Ce document n'est pas le bon endroit pour une discussion approfondie
+ à propos de la Dissimulation de requêtes HTTP (utilisez plutôt votre
+ moteur de recherche favori); il est cependant important de savoir qu'il
+ est possible d'élaborer une série de requêtes, et d'exploiter une
+ vulnérabilité d'un serveur web d'origine de telle façon que l'attaquant
+ puisse contrôler entièrement le contenu renvoyé par le mandataire.</p>
</section>
+ <section>
+ <title>Déni de Service / Cachebusting</title>
+
+ <p>Le mécanisme utilisé via l'en-tête Vary permet de mettre en
+ cache simultanément plusieurs variantes d'une ressource avec la
+ même URL. Le cache sélectionne la variante correcte à envoyer au
+ client en fonction des valeurs d'en-tête fournies par ce dernier.
+ Ce mécanisme peut devenir un problème lorsqu'on tente d'appliquer
+ le mécanisme des variantes à un en-tête connu pour pouvoir
+ posséder un grand nombre de valeurs
+ possibles en utilisation normal, comme par exemple l'en-tête
+ <code>User-Agent</code>. En fonction de la popularité du site web,
+ des milliers ou même des millions d'entrées de cache dupliquées
+ peuvent être créées pour la même URL, submergeant les autres
+ entrées du cache.</p>
+
+ <p>Dans d'autres cas, il peut être nécessaire de modifier l'URL
+ d'une ressource particulière à chaque requête, en général en lui
+ ajoutant une chaîne "cachebuster". Si ce contenu est déclaré comme
+ pouvant être mis en cache par un serveur avec une durée de
+ fraîcheur significative, ces entrées peuvent submerger les entrées
+ légitimes du cache. Alors que <module>mod_cache</module> fournit
+ une directive <directive
+ module="mod_cache">CacheIgnoreURLSessionIdentifiers</directive>,
+ cette dernière doit être utilisée avec prudence pour s'assurer que
+ les caches du navigateur ou du mandataire le plus proche
+ (downstream proxy) ne sont pas victimes du même problème de Déni de
+ service.</p>
+ </section>
</section>
+
</manualpage>