1 <?xml version="1.0" encoding="ISO-8859-1" ?>
2 <!DOCTYPE manualpage SYSTEM "./style/manualpage.dtd">
3 <?xml-stylesheet type="text/xsl" href="./style/manual.fr.xsl"?>
4 <!-- French translation : Lucien GENTIS -->
5 <!-- Reviewed by : Vincent Deffontaines -->
6 <!-- English Revision: 965792 -->
9 Licensed to the Apache Software Foundation (ASF) under one or more
10 contributor license agreements. See the NOTICE file distributed with
11 this work for additional information regarding copyright ownership.
12 The ASF licenses this file to You under the Apache License, Version 2.0
13 (the "License"); you may not use this file except in compliance with
14 the License. You may obtain a copy of the License at
16 http://www.apache.org/licenses/LICENSE-2.0
18 Unless required by applicable law or agreed to in writing, software
19 distributed under the License is distributed on an "AS IS" BASIS,
20 WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
21 See the License for the specific language governing permissions and
22 limitations under the License.
25 <manualpage metafile="logs.xml.meta">
27 <title>Fichiers journaux</title>
30 <p>Pour véritablement gérer un serveur web,
31 il est nécessaire de disposer d'un
32 retour d'informations à propos de l'activité et des performances du
33 serveur, ainsi que de tout problème qui pourrait survenir. Le serveur HTTP
34 Apache propose des fonctionnalités de journalisation souples et très
35 complètes. Ce document décrit comment configurer ces fonctionnalités de
36 journalisation et interpréter le contenu des journaux.</p>
39 <section id="overview">
40 <title>Vue d'ensemble</title>
44 <module>mod_log_config</module>
45 <module>mod_log_forensic</module>
46 <module>mod_logio</module>
47 <module>mod_rewrite</module>
48 <module>mod_cgi</module>
53 Le serveur HTTP Apache fournit toute une variété de mécanismes
54 différents pour la journalisation de tout ce qui peut se passer au
55 sein de votre serveur, depuis la requête initiale, en passant par le
56 processus de mise en correspondance des URLs, et jusqu'à la fermeture
57 de la connexion, y compris toute erreur pouvant survenir au cours du
58 traitement. De plus, certains modules tiers fournissent des
59 fonctionnalités de journalisation ou insèrent des entrées dans les
60 fichiers journaux existants, et les applications comme les programmes
61 CGI, les scripts PHP ou autres gestionnaires peuvent envoyer des
62 messages vers le journal des erreurs du serveur.
66 Ce document décrit le fonctionnement des modules de journalisation
67 fournis en standard avec le serveur httpd.
72 <section id="security">
73 <title>Avertissement à propos de la sécurité</title>
75 <p>Tout utilisateur qui a les droits en écriture sur le répertoire dans
76 lequel Apache httpd écrit ses journaux pourra quasi
77 certainement avoir accès à l'uid sous lequel le serveur est démarré, en
78 l'occurrence habituellement root. N'accordez <em>PAS</em> aux utilisateurs
79 l'accès en écriture au répertoire dans lequel les journaux sont stockés
80 sans savoir exactement quelles en seraient les conséquences ; voir le
81 document <a href="misc/security_tips.html">conseils sur la sécurité</a>
82 pour plus de détails.</p>
84 <p>En outre, les journaux peuvent contenir des informations fournies
85 directement par un client, sans caractères d'échappement. Des clients mal
86 intentionnés peuvent donc insérer des caractères de contrôle dans les
87 journaux, et il convient par conséquent d'être très prudent lors de la
88 manipulation des journaux bruts.</p>
91 <section id="errorlog">
92 <title>Journal des erreurs</title>
99 <directive module="core">ErrorLog</directive>
100 <directive module="core">LogLevel</directive>
104 <p>Le journal des erreurs du serveur, dont le nom et la localisation sont
105 définis par la directive <directive module="core">ErrorLog</directive>,
106 est le journal le plus important. C'est dans celui-ci
107 que le démon Apache httpd va envoyer les informations de diagnostic et
108 enregistrer toutes les erreurs qui surviennent lors du traitement des
109 requêtes. Lorsqu'un problème survient au démarrage du serveur ou pendant
110 son fonctionnement, la première chose à faire est de regarder dans ce
111 journal, car il vous renseignera souvent sur le problème rencontré et
112 la manière d'y remédier.</p>
114 <p>Le journal des erreurs est habituellement enregistré dans un fichier
115 (en général <code>error_log</code> sur les systèmes de type Unix et
116 <code>error.log</code> sur Windows et OS/2). Sur les systèmes de type Unix,
117 le serveur peut aussi enregistrer ses erreurs dans
118 <code>syslog</code> ou les
119 <a href="#piped">rediriger vers un programme</a> par l'intermédiaire d'un
120 tube de communication (pipe).</p>
122 <p>Le format du journal des erreurs est descriptif et de forme
123 relativement libre. Certaines informations apparaissent cependant dans la
124 plupart des entrées du journal. Voici un message typique
125 à titre d'exemple : </p>
128 [Wed Oct 11 14:32:52 2000] [error] [client 127.0.0.1]
129 client denied by server configuration:
130 /export/home/live/ap/htdocs/test
133 <p>Le premier champ de l'entrée du journal est la date et l'heure du
134 message. Le second champ indique la sévérité de l'erreur rapportée. La
135 directive <directive module="core">LogLevel</directive> permet de
136 restreindre le type des erreurs qui doivent être enregistrées
137 dans le journal des erreurs en définissant leur niveau de sévérité. Le
138 troisième champ contient l'adresse IP du client qui a généré l'erreur.
139 Vient ensuite le message proprement dit, qui indique dans ce cas que le
140 serveur a été configuré pour interdire l'accès au client. Le serveur
141 indique le chemin système du document requis (et non
144 <p>Une grande variété de messages différents peuvent apparaître dans le
145 journal des erreurs. La plupart d'entre eux sont similaires à l'exemple
146 ci-dessus. Le journal des erreurs peut aussi contenir des informations de
147 débogage en provenance de scripts CGI. Toute information qu'un script CGI
148 écrit sur la sortie d'erreurs standard <code>stderr</code> sera recopiée
149 telle quelle dans le journal des erreurs.</p>
151 <p>Il n'est pas possible de personnaliser le journal des erreurs en ajoutant ou en
152 supprimant des informations. Cependant, les entrées du journal des erreurs
153 qui concernent certaines requêtes possèdent des entrées correspondantes
154 dans le <a href="#accesslog">journal des accès</a>. Ainsi, l'entrée de
155 l'exemple ci-dessus correspond à une entrée du journal des accès avec un
156 code de statut 403. Etant donné qu'il est possible de personnaliser le
157 journal des accès, vous pouvez obtenir d'avantage d'informations sur les
158 circonstances d'une erreur en consultant ce journal.</p>
160 <p>Pendant la phase de test, il est souvent utile de visualiser en continu
161 le journal des erreurs afin de détecter tout problème éventuel. Sur les
162 systèmes de type Unix, ceci s'effectue à l'aide de la commande :</p>
169 <section id="accesslog">
170 <title>Journal des accès</title>
174 <module>mod_log_config</module>
175 <module>mod_setenvif</module>
178 <directive module="mod_log_config">CustomLog</directive>
179 <directive module="mod_log_config">LogFormat</directive>
180 <directive module="mod_setenvif">SetEnvIf</directive>
184 <p>Le journal des accès au serveur
185 enregistre toutes les requêtes que traite
186 ce dernier. La localisation et le contenu du journal des accès sont définis
187 par la directive <directive module="mod_log_config">CustomLog</directive>.
188 La directive <directive module="mod_log_config">LogFormat</directive>
189 permet de simplifier la sélection du contenu du journal. Cette section
190 décrit comment configurer le serveur pour l'enregistrement des informations
191 dans le journal des accès.</p>
193 <p>Bien évidemment, le stockage d'informations dans le journal des accès
194 n'est que le point de départ de la gestion de la journalisation. L'étape
195 suivante consiste à analyser ces informations de façon à pouvoir en
196 extraire des statistiques utiles. L'analyse de journaux en général est en
197 dehors du sujet de ce document et ne fait pas vraiment partie intégrante
198 du travail du serveur web lui-même. Pour plus d'informations à propos de ce
199 sujet et des applications dédiées à l'analyse de journaux, vous pouvez vous
200 référer à <a href="http://dmoz.org/Computers/Software/Internet/
201 Site_Management/Log_analysis/">Open Directory</a> ou
202 <a href="http://dir.yahoo.com/Computers_and_Internet/Software/
203 Internet/World_Wide_Web/Servers/Log_Analysis_Tools/">Yahoo</a>.</p>
205 <p>Différentes versions du démon Apache httpd utilisaient d'autres modules
206 et directives pour contrôler la journalisation des accès, à l'instar de
207 mod_log_referer, mod_log_agent, et de la directive
208 <code>TransferLog</code>. La directive
209 <directive module="mod_log_config">CustomLog</directive> rassemble
210 désormais les fonctionnalités de toutes les anciennes directives.</p>
212 <p>Le format du journal des accès est hautement configurable. Il est
213 défini à l'aide d'une chaîne de format qui ressemble sensiblement à la
214 chaîne de format de style langage C de printf(1). Vous trouverez quelques
215 exemples dans les sections suivantes. Pour une liste exhaustive de ce que
216 peut contenir une chaîne de format, vous pouvez vous référer au chapitre
217 <a href="mod/mod_log_config.html#formats">chaînes de format</a> de la
218 documentation du module <module>mod_log_config</module>.</p>
220 <section id="common">
221 <title>Format habituel du journal</title>
223 <p>Voici une configuration typique pour le journal des accès :</p>
226 LogFormat "%h %l %u %t \"%r\" %>s %b" common<br />
227 CustomLog logs/access_log common
230 <p>Ici est définie l'<em>identité</em> <code>common</code> qui est
231 ensuite associée à une chaîne de format de journalisation particulière.
232 La chaîne de format est constituée de directives débutant par le
233 caractère %, chacune d'entre elles indiquant au serveur d'enregistrer
234 un élément particulier d'information. Des caractères littéraux peuvent
235 aussi être insérés dans la chaîne de format ; il seront copiés tels
236 quels dans le flux de sortie destiné à la journalisation.
237 Les guillemets (<code>"</code>) doivent être échappées en les faisant
238 précéder d'un anti-slash (<code>\</code>) afin qu'elles ne soient pas
239 interprétées comme la fin de la chaîne de format. La chaîne de format
240 peut aussi contenir les caractères de contrôle spéciaux
241 "<code>\n</code>" et "<code>\t</code>" pour insérer respectivement
242 un passage à la ligne et une tabulation.</p>
244 <p>La directive <directive module="mod_log_config">CustomLog</directive>
245 définit un nouveau fichier journal en l'associant à l'identité
246 précédemment définie. Le chemin du nom de fichier associé au journal
247 des accès est relatif au chemin défini par la directive
248 <directive module="core">ServerRoot</directive>, sauf s'il
249 débute par un slash.</p>
251 <p>La configuration ci-dessus va enregistrer les entrées de
252 journalisation selon un format connu sous le nom de
253 Common Log Format (CLF) pour "Format de journalisation standard".
254 Ce format standard peut être produit par de nombreux serveurs web
255 différents et lu par de nombreux programmes d'analyse de journaux.
256 Les entrées de fichier journal générées selon le format CLF
257 ressemblent à ceci :</p>
260 127.0.0.1 - frank [10/Oct/2000:13:55:36 -0700] "GET
261 /apache_pb.gif HTTP/1.0" 200 2326
264 <p>Chaque partie de cette entrée de journal est décrite
265 dans ce qui suit.</p>
268 <dt><code>127.0.0.1</code> (<code>%h</code>)</dt>
270 <dd>Il s'agit de l'adresse IP du client (l'hôte distant) qui a envoyé
271 la requête au serveur. Si la directive
272 <directive module="core">HostnameLookups</directive> est positionnée à
273 <code>On</code>, le serveur va essayer de déterminer le nom de l'hôte
274 et de l'enregistrer à la place de l'adresse IP. Cette configuration
275 n'est cependant pas recommandée car elle peut ralentir le serveur de
276 manière significative. Il est par conséquent préférable d'utiliser un
277 processeur d'analyse de journaux a posteriori
278 tel que <program>logresolve</program>
279 pour déterminer les noms d'hôte. L'adresse IP indiquée ici n'est pas
280 nécessairement l'adresse IP de la machine devant laquelle se trouve
281 l'utilisateur. Si un serveur mandataire s'intercale entre le serveur
282 et l'utilisateur, l'adresse indiquée sera celle du mandataire et non
283 celle de la machine à l'origine de la requête.</dd>
285 <dt><code>-</code> (<code>%l</code>)</dt>
287 <dd>Le "trait d'union" indique que la portion d'information
288 correspondante n'est pas disponible. Dans le cas présent, l'information
289 non disponible est l'identité (RFC 1413) du client telle que déterminée
290 par <code>identd</code> sur la machine cliente. Cette information est
291 très peu fiable et ne devrait jamais être utilisée, sauf dans le cas
292 de réseaux internes étroitement contrôlés. Le démon httpd ne cherchera
293 d'ailleurs à obtenir cette information que si la directive
294 <directive module="core">IdentityCheck</directive> est positionnée
295 à <code>On</code>.</dd>
297 <dt><code>frank</code> (<code>%u</code>)</dt>
299 <dd>Il s'agit de l'identifiant utilisateur de la personne qui a
300 demandé le document, issu d'une authentification HTTP.
301 Ce même identifiant est en général fourni aux scripts CGI par
302 l'intermédiaire de la valeur de la variable d'environnement
303 <code>REMOTE_USER</code>. Si le statut de la requête (voir plus loin)
304 est 401, cette identifiant n'est pas fiable car l'utilisateur n'est
305 pas encore authentifié. Si le document n'est pas protégé par
306 mot de passe, cette partie d'information sera représentée par
307 "<code>-</code>", comme la partie précédente.</dd>
309 <dt><code>[10/Oct/2000:13:55:36 -0700]</code>
310 (<code>%t</code>)</dt>
313 L'heure à laquelle la requête a été reçue.
314 Le format est le suivant :
317 <code>[jour/mois/année:heure:minutes:secondes zone]<br />
318 jour = 2*chiffre<br />
319 mois = 3*lettre<br />
320 année = 4*chiffre<br />
321 heure = 2*chiffre<br />
322 minutes = 2*chiffre<br />
323 secondes = 2*chiffre<br />
324 zone = (`+' | `-') 4*chiffre</code>
325 </p>Il est possible de modifier le format d'affichage de l'heure
326 en spécifiant <code>%{format}t</code> dans la chaîne de format du
327 journal, où <code>format</code> est une chaîne de format de même
328 forme que celle de la fonction <code>strftime(3)</code> de la
329 bibliothèque C standard.
332 <dt><code>"GET /apache_pb.gif HTTP/1.0"</code>
333 (<code>\"%r\"</code>)</dt>
335 <dd>La ligne de la requête du client est placée entre guillemets.
336 Elle contient de nombreuses informations utiles. Tout d'abord, la
337 méthode utilisée par le client est <code>GET</code>. Ensuite, le
338 client a demandé la ressource <code>/apache_pb.gif</code>, et enfin,
339 le client a utilisé le protocole <code>HTTP/1.0</code>. Il est aussi
340 possible d'enregistrer séparément une ou plusieurs parties de la
341 requête. Par exemple, la chaîne de format "<code>%m %U %q %H</code>"
342 va enregistrer la méthode, le chemin, la chaîne de la requête et le
343 protocole, ce qui donnera le même résultat que
344 "<code>%r</code>".</dd>
346 <dt><code>200</code> (<code>%>s</code>)</dt>
348 <dd>C'est le code de statut que le serveur retourne au client. Cette
349 information est très importante car elle indique si la requête a fait
350 l'objet d'une réponse positive (codes commençant par 2), une
351 redirection (codes commençant par 3), une erreur due au client (codes
352 commençant par 4), ou une erreur due au serveur (codes commençant
353 par 5). Vous trouverez la liste complète des codes de statut possibles
354 dans la <a href="http://www.w3.org/Protocols/rfc2616/
355 rfc2616.txt">specification HTTP</a> (RFC2616 section 10).</dd>
357 <dt><code>2326</code> (<code>%b</code>)</dt>
359 <dd>La dernière partie indique la taille de l'objet retourné au client,
360 en-têtes non compris. Si aucun contenu n'a été retourné au client, cette
361 partie contiendra "<code>-</code>". Pour indiquer l'absence de contenu
362 par "<code>0</code>", utilisez <code>%B</code> au lieu de
363 <code>%b</code>.</dd>
367 <section id="combined">
368 <title>Combined Log Format (Format de journalisation combiné)</title>
370 <p>Une autre chaîne de format couramment utilisée est le
371 "Combined Log Format" (Format de journalisation combiné). Il s'utilise
375 LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\"
376 \"%{User-agent}i\"" combined<br />
377 CustomLog log/access_log combined
380 <p>Ce format est identique au Common Log Format, avec deux champs
381 supplémentaires. Chacun de ces deux champs utilise la directive
382 commençant par le caractère "%" <code>%{<em>header</em>}i</code>,
383 où <em>header</em> peut être n'importe quel en-tête de requête HTTP.
384 Avec ce format, le journal des accès se présentera comme suit :</p>
387 127.0.0.1 - frank [10/Oct/2000:13:55:36 -0700] "GET
388 /apache_pb.gif HTTP/1.0" 200 2326
389 "http://www.example.com/start.html" "Mozilla/4.08 [en]
393 <p>Les champs supplémentaires sont :</p>
396 <dt><code>"http://www.example.com/start.html"</code>
397 (<code>\"%{Referer}i\"</code>)</dt>
399 <dd>L'en-tête "Referer" (sic) de la requête HTTP. Il indique le site
400 depuis lequel le client prétend avoir lancé sa requête. (Ce doit être
401 la page qui contient un lien vers <code>/apache_pb.gif</code> ou
402 inclut ce dernier fichier).</dd>
404 <dt><code>"Mozilla/4.08 [en] (Win98; I ;Nav)"</code>
405 (<code>\"%{User-agent}i\"</code>)</dt>
407 <dd>L'en-tête User-Agent de la requête HTTP. C'est une information
408 d'identification que le navigateur du client envoie à propos
409 de lui-même.</dd>
413 <section id="multiple">
414 <title>Journaux d'accès multiples</title>
416 <p>Plusieurs journaux d'accès peuvent être créés en spécifiant tout
417 simplement plusieurs directives
418 <directive module="mod_log_config">CustomLog</directive> dans le
419 fichier de configuration. Par exemple, les directives suivantes vont
420 créer trois journaux d'accès. Le premier contiendra les informations
421 de base CLF, le second les informations du Referer, et le troisième
422 les informations sur le navigateur. Les deux dernières directives
423 <directive module="mod_log_config">CustomLog</directive> montrent
424 comment simuler les effets des directives <code>ReferLog</code> et
425 <code>AgentLog</code>.</p>
428 LogFormat "%h %l %u %t \"%r\" %>s %b" common<br />
429 CustomLog logs/access_log common<br />
430 CustomLog logs/referer_log "%{Referer}i -> %U"<br />
431 CustomLog logs/agent_log "%{User-agent}i"
434 <p>Cet exemple montre aussi qu'il n'est pas obligatoire d'associer
435 une chaîne de format à un alias au moyen de la directive
436 <directive module="mod_log_config">LogFormat</directive>. Elle peut
437 être définie directement dans la ligne de la directive
438 <directive module="mod_log_config">CustomLog</directive>.</p>
441 <section id="conditional">
442 <title>Journalisation conditionnelle</title>
444 <p>Il est parfois souhaitable d'exclure certaines entrées des journaux
445 d'accès en fonction des caractéristiques de la requête du client. On
446 peut aisément accomplir ceci à l'aide des
447 <a href="env.html">variables d'environnement</a>. Tout d'abord, une
448 variable d'environnement doit être définie pour indiquer que la
449 requête remplit certaines conditions. Pour ceci, on utilise en général
450 la directive <directive module="mod_setenvif">SetEnvIf</directive>,
451 puis la clause <code>env=</code> de la directive
452 <directive module="mod_log_config">CustomLog</directive> pour inclure
453 ou exclure les requêtes pour lesquelles
454 la variable d'environnement est définie.
455 Quelques exemples :</p>
458 # Marque les requêtes en provenance de l'interface loop-back<br />
459 SetEnvIf Remote_Addr "127\.0\.0\.1" dontlog<br />
460 # Marque les requêtes pour le fichier robots.txt<br />
461 SetEnvIf Request_URI "^/robots\.txt$" dontlog<br />
462 # Journalise toutes les autres requêtes<br />
463 CustomLog logs/access_log common env=!dontlog
466 <p>Autre exemple, imaginons l'enregistrement des requêtes en provenance
467 d'utilisateurs de langue anglaise dans un journal, et celles des autres
468 utilisateurs dans un autre journal.</p>
471 SetEnvIf Accept-Language "en" english<br />
472 CustomLog logs/english_log common env=english<br />
473 CustomLog logs/non_english_log common env=!english
476 <p>Dans le contexte d'une mise en cache, il peut être
477 intéressant de connaître l'efficacité du cache. Pour y parvenir,
478 on pourrait utiliser cette méthode simple :</p>
481 SetEnv CACHE_MISS 1<br />
482 LogFormat "%h %l %u %t "%r " %>s %b %{CACHE_MISS}e" common-cache<br />
483 CustomLog logs/access_log common-cache
486 <p><module>mod_cache</module> va s'exécuter avant
487 <module>mod_env</module>, et si son action est couronnée de
488 succès, il délivrera le contenu sans faire appel à ce dernier. Si
489 l'URL se trouve dans le cache, la valeur journalisée sera alors
490 <code>-</code>, tandis que dans le cas contraire elle sera
494 <p>Bien que nous venions de montrer que la journalisation conditionnelle
495 est souple et très puissante, cette méthode de contrôle du contenu des
496 journaux n'est pas la seule. Les fichiers journaux sont plus utiles
497 quand ils contiennent un enregistrement complet de l'activité du serveur,
498 et il est souvent plus aisé de simplement traiter à posteriori les fichiers
499 journaux pour supprimer les requêtes que vous ne voulez pas y voir
500 apparaître.</p>
504 <section id="rotation">
505 <title>Rotation des journaux</title>
507 <p>Même dans le cas d'un serveur modérément sollicité, la quantité
508 d'informations stockées dans les fichiers journaux est très importante.
509 Le fichier journal des accès grossit en général d'1 Mo ou plus toutes
510 les 10000 requêtes. Il est par conséquent nécessaire d'effectuer
511 périodiquement la rotation des journaux en déplaçant ou supprimant les
512 fichiers correspondants. On ne peut pas le faire pendant que le serveur
513 est en cours d'exécution, car Apache httpd va continuer à écrire dans l'ancien
514 fichier journal aussi longtemps qu'il le maintiendra ouvert.
515 C'est pourquoi le serveur doit être
516 <a href="stopping.html">redémarré</a> après le déplacement ou la
517 suppression des fichiers journaux de façon à ce qu'il en ouvre
520 <p>Avec un redémarrage <em>graceful</em>, on peut faire en sorte que le
521 serveur ouvre de nouveaux fichiers journaux sans perdre de connexions
522 existantes ou en cours avec les clients. Cependant, pour que ceci soit
523 possible, le serveur doit continuer à écrire dans les anciens fichiers
524 journaux pendant qu'il termine le traitement des requêtes en cours.
525 Il est donc nécessaire d'attendre un certain temps après le rédémarrage
526 avant d'effectuer tout traitement sur les fichiers journaux. Voici un
527 scénario typique dans lequel on effectue une simple rotation des
528 journaux en compressant les anciens fichiers correspondants afin
529 de gagner de l'espace disque :</p>
532 mv access_log access_log.old<br />
533 mv error_log error_log.old<br />
534 apachectl graceful<br />
536 gzip access_log.old error_log.old
539 <p>La section suivante présente une autre méthode de rotation des journaux
540 qui consiste à utiliser les
541 <a href="#piped">journaux redirigés</a>.</p>
545 <title>Journaux redirigés</title>
547 <p>Nous avons vu que le démon httpd écrivait les informations de
548 journalisation des erreurs et des accès dans un fichier journal ;
550 rediriger ces informations vers un autre processus par l'intermédiaire d'un
551 tube de communication (pipe). Cette fonctionnalité améliore
552 considérablement la souplesse de la journalisation, sans ajouter de code
553 au serveur principal. Pour rediriger les informations de journalisation
554 vers un tube de communication, remplacez simplement le nom de fichier
556 le caractère pipe "<code>|</code>", suivi du nom de l'exécutable qui va
557 recueillir les entrées de journal sur son entrée
558 standard. Le serveur va
559 lancer le processus de redirection des journaux au moment du démarrage du
560 serveur, et le relancera s'il cesse de fonctionner
561 pendant l'exécution du serveur.
562 (Nous dénommons cette technique "journalisation
563 redirigée fiable" grâce à cette dernière fonctionnalité.)</p>
565 <p>Les processus de journalisation redirigée sont lancés par le processus
566 httpd parent, et héritent de l'UID de ce dernier. Cela signifie que les
567 programmes de journalisation dirigée s'exécutent généralement en tant que
568 root. Il est donc très important que ces programmes soient simples et
569 sécurisés.</p>
571 <p>Un des grands avantages de la journalisation redirigée est la possibilité
572 d'effectuer la rotation des journaux sans avoir à redémarrer le serveur. Pour
573 accomplir cette tâche, le serveur HTTP Apache fournit un programme simple
574 appelé <program>rotatelogs</program>. Par exemple, pour une rotation des
575 journaux toutes les 24 heures, ajoutez ces lignes :</p>
578 CustomLog "|/usr/local/apache/bin/rotatelogs
579 /var/log/access_log 86400" common
582 <p>Notez que l'ensemble de la commande qui sera appelée par le tube de
583 communication a été placée entre guillemets. Bien que cet exemple
584 concerne le journal des accès, la même technique peut être utilisée
585 pour le journal des erreurs.</p>
587 <p>Il existe un autre programme de rotation des journaux similaire mais
588 beaucoup plus souple : il s'agit de "cronolog", non fourni par Apache,
589 mais disponible <a href="http://www.cronolog.org/">ici</a>.</p>
591 <p>Comme la journalisation conditionnelle, la journalisation redirigée est
592 un outil très puissant, mais si elle existe, il est préférable d'utiliser
593 une solution plus simple comme le traitement à posteriori hors ligne.</p>
596 <section id="virtualhost">
597 <title>Hôtes virtuels</title>
599 <p>Lorsqu'un serveur possède plusieurs <a href
600 ="vhosts/">hôtes virtuels</a>, il existe de nombreuses solutions pour gérer
601 les fichiers journaux. Par exemple, on peut utiliser les journaux comme
602 s'il s'agissait d'un serveur avec un seul hôte. Il suffit pour cela de
603 placer les directives de journalisation en dehors des sections
604 <directive module="core" type="section">VirtualHost</directive> au niveau
605 du serveur principal, ce qui a pour effet de journaliser toutes les
606 requêtes dans le même journal des accès et des erreurs. Cette technique
607 est cependant inappropriée pour recueillir des statistiques sur chaque
608 hôte virtuel individuellement.</p>
610 <p>Si des directives <directive module=
611 "mod_log_config">CustomLog</directive> ou
612 <directive module="core">ErrorLog</directive> sont placées dans une section
613 <directive module="core" type="section">VirtualHost</directive>, toutes les
614 requêtes ou erreurs pour cet hôte virtuel ne seront enregistrées que dans
615 le fichier spécifié. Tout hôte virtuel qui ne possède pas de directives de
616 journalisation verra ses requêtes enregistrées dans le journal du serveur
617 principal. Cette technique est appropriée pour un petit nombre d'hôtes
618 virtuels, mais si ce nombre est important, elle peut devenir compliquée à
619 gérer. En outre, des problèmes de <a
620 href="vhosts/fd-limits.html">nombre de descripteurs
621 de fichiers insuffisant</a> peuvent rapidement apparaître.</p>
623 <p>Il existe un très bon compromis pour le journal des accès. En intégrant
624 les informations à propos de l'hôte virtuel à la chaîne de format du
625 journal, il est possible de journaliser tous les hôtes dans le même
626 journal, puis de séparer ultérieurement le journal en plusieurs journaux
627 individuels. Considérons par exemple les directives suivantes :</p>
630 LogFormat "%v %l %u %t \"%r\" %>s %b"
632 CustomLog logs/access_log comonvhost
635 <p>Le champ <code>%v</code> sert à enregistrer le nom de l'hôte virtuel qui
636 traite la requête. Un programme tel que <a
637 href="programs/other.html">split-logfile</a> peut ensuite être utilisé
638 pour générer "à froid" autant de journaux que d'hôtes virtuels.</p>
642 <title>Autres fichiers journaux</title>
646 <module>mod_logio</module>
647 <module>mod_log_forensic</module>
648 <module>mod_cgi</module>
649 <module>mod_rewrite</module>
652 <directive module="mod_log_config">LogFormat</directive>
653 <directive module="mod_log_forensic">ForensicLog</directive>
654 <directive module="mpm_common">PidFile</directive>
655 <directive module="mod_rewrite">RewriteLog</directive>
656 <directive module="mod_rewrite">RewriteLogLevel</directive>
657 <directive module="mod_cgi">ScriptLog</directive>
658 <directive module="mod_cgi">ScriptLogBuffer</directive>
659 <directive module="mod_cgi">ScriptLogLength</directive>
664 <title>Enregistrement du nombre réel d'octets envoyés et reçus</title>
666 <p>Le module <module>mod_logio</module> fournit deux champs
667 <directive module="mod_log_config">LogFormat</directive> supplémentaires
668 (%I et %O) qui permettent d'enregistrer le nombre réel d'octets reçus et
669 envoyés sur le réseau.</p>
673 <title>Journalisation de style investigation judiciaire (forensic logging)</title>
675 <p>Le module <module>mod_log_forensic</module> permet la journalisation
676 à des fins d'investigation judiciaire des requêtes des clients. La
677 journalisation est effectuée avant et après le traitement de la requête,
678 qui fait donc l'objet de deux entrées dans le journal. Le générateur de
679 journaux d'investigation est très strict et ne permet aucune
680 personnalisation. C'est un inestimable outil de débogage et de sécurité.</p>
683 <section id="pidfile">
684 <title>Fichier PID</title>
686 <p>Au démarrage, le démon httpd Apache enregistre l'identifiant du
687 processus httpd parent dans le fichier <code>logs/httpd.pid</code>.
688 Le nom de ce fichier peut être modifié à l'aide de la directive
689 <directive module="mpm_common">PidFile</directive>. Cet identifiant
690 permet à l'administrateur de redémarrer et arrêter le démon en
691 envoyant des signaux au processus parent ; sous Windows, vous devez
692 utiliser l'option de ligne de commande -k. Pour plus de détails,
693 consulter la page <a href="stopping.html">Arrêt et redémarrage</a>.</p>
696 <section id="scriptlog">
697 <title>Journal des scripts</title>
699 <p>Afin de faciliter le débogage, la directive
700 <directive module="mod_cgi">ScriptLog</directive> vous permet
701 d'enregistrer les entrées et sorties des scripts CGI. Elle ne doit être
702 utilisée que pendant la phase de test, et en aucun cas sur un
703 serveur en production. Vous trouverez plus d'informations dans la
704 documentation du module <a href="mod/mod_cgi.html">mod_cgi</a>.</p>
707 <section id="rewritelog">
708 <title>Journal de réécriture</title>
710 <p>Lorsqu'on utilise les fonctionnalités puissantes et complexes du
711 module <a href="mod/mod_rewrite.html">mod_rewrite</a>, il est presque
712 toujours nécessaire d'utiliser la directive
713 <directive module="mod_rewrite">RewriteLog</directive> afin de
714 faciliter le débogage. Ce fichier journal fournit une analyse détaillée
715 de la transformation des requêtes par le moteur de réécriture. Le niveau
716 de détail est contrôlé par la directive
717 <directive module="mod_rewrite">RewriteLogLevel</directive>.</p>