最終更新日:2019年9月9日

Homeへ

注意:このREADMEの内容は、正確に翻訳したものでは無く、日本語的にする為に訳者によってアレンジが加えられています。 正確な情報はオリジナルのREADMEをご覧ください。

Webalizer - Webサーバのログファイル解析ツール。
ブラッドフォード L.バレット/Bradford L. Barrett (brad@mrunix.net)による著作権。1997年から2000年.
GNU GPLの下で配布されます。追加情報のためのディストリビューションに付属の"COPYING" と "Copyright" を参照して下さい。


Webalizerって何?

WebalizerはWebサーバーのログファイルによる使用統計をブラウザで表示できるようにHTML形式で生成する解析プログラムです。
結果を表形式とグラフィカル形式の両方で表示します。
毎年、毎月、毎日、毎時の使用状況の統計を提示し、利用されたサイト、URL、リファラ(参照元)、ユーザエージェント(ブラウザ)、検索文字列、入口/出口ページ、ユーザ名とカントリ(国情報)などを表示します。(一部の情報はログファイルに情報がある場合にのみ使用可能です)処理されたデータは、ほとんどのデータベースやスプレッドシートプログラムがサポートするタブ区切りのデータ形式にエクスポートすることができます。
Webalizerは、CLF(共通ログ形式)のログファイルだけでなく、NCSAやその他により定義されたコンビログ形式(Combined log formats)、加えて、WU-FTPDの xferlog 形式のログと、Squidプロキシのログがサポートされています。
gzip と bzip2 (.bz2)で圧縮されたログを現在は直接使用することができます。いくつかのログファイル名が持つ拡張子が '.gz'のものは、gzip形式であると想定され実行時に解凍されながら読み込まれます。さらに、Webalizerのコンパイル時にDNSルックアップを有効にすることができます。追加情報については、DNS.READMEファイルを参照してください。

このドキュメントは、Webalizerのバージョン2.23に適用されます。

Webalizerの実行

WebalizerはUnixのコマンドラインプロンプトまたはcronジョブから実行するように設計されています。
いくつかのコマンドラインオプションによって結果は変わります。またコンフィグレーションファイルでも同様に使用できます。
コマンドラインの形式は次のとおりです。
webalizer [options ...] [log-file]
ここでの 'options'にはコマンドラインスイッチとしてサポートされて、1つまたは複数が指定できます。
"log-file"は、処理をするログ·ファイルの名前です。(詳細については下記を参照してください)​
もし、ログファイル名の代わりにダッシュ("-")を指定すると標準入力が使用されます。
プログラムの一般的な処理の流れは以下の通りです:

増分処理

Webalizerのバージョン1.2xより、増分実行機能を追加します。
これにより、大きなログファイルを小さな断片に分割し、代わりにこれらの断片を処理することで、大きなログファイルを処理できます。
これが意味する本当のことは、ログファイルを必要な回数だけローテーションすることができ、しかも詳細を失うことなく毎月の使用統計を作成できることです。
これは、実行の間に関連するすべての内部データをディスクファイルに保存および復元することで実現されます。
そうすることで、プログラムはいわば「中断したところから開始」できるようになり、実行ごとに詳細を保存できるようになります。
Webalizerのインクリメントの機能を使用する場合、いくつかの注意をする必要があります。
内部記憶データに破損を引き起こすかもしれないので、コンフィグレーションファイルのオプションは各実行間で変更されるべきではありません。例えば、MangleAgentsのレベルを変更した場合、
MangleAgentsレベルを変更すると、ユーザエージェントの表現が異なる為に、レポートのためのユーザエージェントが異なって保存されてしまいます。もしコンフィグレーションファイルの変更が必要になったなら、先月までの処理を実施後、今月分を実施する前にそれを行ってください。
その際、'webalizer.current' (あるいは「IncrementalName」設定オプションを使用して指定された)のファイルを削除してください。
Webalizerは、さらに処理における最後のレコードのタイムスタンプ保持するこでデータ重複を防ぐことを試みます。
このタイムスタンプは次回の処理の際のレコードと比較され、そのタイムスタンプより前のレコードが記録されていた場合、それらは無視されます。
これは理論上、すでに処理されたログを再度実行することで、同じログを混入させてしまい統計上に重複を発生させる事がないようにしています。
このため、もし2つのログファイルにおいて同じタイムスタンプを持つような状況が発生してしまうと、2つめのログファイルの処理においてそれらのレコードは廃棄されてしまうことになるので、webサーバをセットアップする場合、ログのローテーションにおける時計の時間について確実に連続性が保持される必要があります。

出力結果

Webalizerはいくつかの報告書(html)と月間の処理状況のグラフを作成します。 さらに、今月と履歴ファイルを使った増分処理を行った場合には前の月(12ヶ月)の集計ページを作成します。
これらのファイルの正確な位置および名前は設定ファイルおよびコマンドライン・オプションを使用して変更することができます。 作成されるファイルのデフォルトの名前としては:
index.html - メインの集計ページ (拡張子は変更できる)
usage.png - indexページに置かれる年間のグラフィック
usage_YYYYMM.html - 月の集計ページ (拡張子は変更できる)
usage_YYYYMM.png - 年間における月の利用状況グラフ
daily_usage_YYYYMM.png - 指定月における日ごとの利用状況グラフ
hourly_usage_YYYYMM.png - 指定月における各時間毎の利用状況グラフ
site_YYYYMM.html - 全サイトのリスト (有効にしている場合)
url_YYYYMM.html - 全URLのリスト (有効にしている場合)
ref_YYYYMM.html - 全参照元のリスト (有効にしている場合)
agent_YYYYMM.html - 全ユーザエージェントのリスト (有効にしている場合)
search_YYYYMM.html - 全検索文字列のリスト (有効にしている場合)
webalizer.hist - 前月の履歴 (変更されているかもしれない)
webalizer.current - 増分データ (変更されているかもしれない)
site_YYYYMM.tab - タブで区切られたサイトのファイル
url_YYYYMM.tab - タブで区切られたURLのファイル
ref_YYYYMM.tab - タブで区切られた参照元のファイル
agent_YYYYMM.tab - タブで区切られたユーザエージェントのファイル
user_YYYYMM.tab - タブで区切られたユーザネームのファイル
search_YYYYMM.tab - タブで区切られた検索文字列のファイル
年間(index)のレポートは、12か月間の統計および各月へのリンクを示します。
月報は呼び出されたURLや呼び出しもとなどのリンク情報を含んだ詳細な統計です。
レポートに示される様々な合計の意味は以下の通りです。

Hits(ヒット数)

サーバに与えられたリクエストはすべて 'hit' として記録される。色々なものがリクエストされてきます。。。。 HTMLページやグラフィックイメージ、オディオファイル、CGIスクリプトなどなど。サーバのログにあるこれらへの有効であった各ラインは hit としてカウントされます。この数は、指定されたレポート期間中にサーバになされたリクエストの総数を表わします

Files(ファイル数)

サーバに対するいくつかのリクエストは、その後、HTMLページやグラフィックイメージなどのはサーバからクライアントへと返されます。このような事が起こると、'file'としてその合計が増分します。
'hits' と 'files' の関係は、'入ってくるリクエスト(incoming requests)' と '出て行く応答(outgoing responses)' と見なすことができます。

Pages(ページ)

ページはまあページです。 一般に、どんなHTMLドキュメント(すなわちHTMLドキュメントを生成するもの(すべて))もページと考えられるでしょう。これには、グラフィック・イメージ、オーディオ・クリップなどのようなドキュメントに入る別の材料を含んでいません。 この数は、'ページ'としてリクエストされ、上記のような他の材料を含んでいないものとなります。 実際にはサーバによってページの構成には色々なものがあります。
デフォルトでは、拡張「.htm」、「.html」あるいは「.cgi」であるものがページとして扱います。
同様に多くのサイトが、恐らく「.phtml」のような他の拡張、「.php3」および「.pl」を定義するでしょう。
何人かの人々はこの数を「純粋」な hit の数と見なします...私は、その見解に全く賛成できるか分かりませんが、他のいくつかのプログラム(また人々:)はこれを「ページビュー」と呼びます。

Sites(サイト)

サーバーになされた各リクエストは、ユニークな「サイト」(それはIPアドレスによって、最終的に名前として参照されるか、IPアドレスのままとして)から来ます。
「サイト」の数は、どれだけのユニークなIPアドレスがサーバーに期間中にリクエストしたか示します。これは、ユニークな個々のユーザ数を意味するものではありません。ログとHTTPプロトコルからそれを特定する事は不可能です。
(しかしながら、この数はそれらとほぼ同じくらいに近いかも知れません)

Visits(訪問者)

リクエストにより常にサーバには呼び出し元のIPアドレス(サイト)が与えられ、そのアドレスによる以前のリクエストからの経過した時間が計算されます。
その時差が''visit timeout'で指定された値より大きかった場合、(または、以前にリクエストが無かった場合)には、「あたらしい訪問者(new visit)」として考えられ、そのIPアドレスとサイトは合計に加増されます。
デフォルトのタイムアウトは30分(変更可能)となっており、よってユーザが1:00にあなたのサイトを訪れ、その後3:00に再び訪れると訪問(visits)は2つとして記録されるでしょう。
注意: 「Top Sites(上位 リモートサイト)」テーブルには、「グループ化された」レコードおよびグループとして考えられる訪問数の最小数を合計として示します。
注意:訪問数(Visits)は、PageType リクエストによって生じ、それは PageType と PagePrefix オプションで定義がされているページをURLに含んでいるリクエストによります。よって、HTTPプロトコルの制限、ログ・ローテーションや他の要因などにより、この数字は絶対的に正確なものとしは扱ってはなりません。あくまで推定値として考すべきです。

KBytes(KB)

KBytes(キロバイト)の値は、データ量の値を示します。in KBなら、指定された期間中にサーバに対して送られたデータ量を示します。 この値は、ログファイルから直接生成されます。よって、この値はWebサーバにより生じたログから正確な数字を報告します。
一般的にこれは、おかしな挙動のwebサーバであるかに関わらず、サーバーからのデータ量をかなり正確に報告します。
Note: KB(キロバイト)は、1000でなく1024バイトです。
Entry Pages(エントリページ) と Exit Pages(終了ページ)
エントリページ(Entry Pages)と終了ページ(Exit Pages)の表は、あなたのサイトに入る際にどのようなURLが使用され、最後にどのようなページが閲覧されたかの概算を得られます。
ただしこの計測は、HTTPプロトコル上の制限、またログローテーションの影響によって、「荒い推定」です。 しかしながら、ユーザがどこからエントリし、どこで終了したかの全体的な傾向を知る良い指標を与えるでしょう。

コマンドライン・オプション

Webalizerは、プログラムに作用し出力を生成する方法を変更するための様々な設定オプションをサポートしてます。 これらの内の殆どは、単にコンフィグレーションファイルに設定する以外に、コマンドラインで指定することができます。
コマンドラインオプションおよびコンフィグレーションファイルのキーワードは、以下のリストの通りです。

一般のオプション:

-h :
利用できるコマンドオプションの情報を表示して終了します。
-v :
プログラムのバージョンを表示して終了します。
-V :
プログラムのバージョンを表示して終了します。 'verbose'モードも使用されている場合(たとえば、 '-vV')、追加のプログラム固有の情報が表示されます。これは、バグレポートを送信するときに役立ちます。
-d :
処理中に発生したエラーと警告に関するデバックのための情報を表示します。それらのエラーを発生させたデータを知りたい場合以外はこれを利用しません。通常、Webalizerはエラーを起こしたデータではなくエラーを見つけたという報告だけを行います。このオプションを指定するとデータも表示するようになります。
コンフィグ・ファイルのキーワード: Debug
-F :
使用されてるログがftpのログであることを示します。通常、WebalizerはWebサーバのログとして有効なCLFまたはコンビログフォーマットを期待しています。このオプションは、同様にwu-ftpd xferlogsを処理することを可能にします。
コンフィグ・ファイルのキーワード: LogType
-f :
日付や時間の順番が不正なログレコードであっても、問題のないレコードと見なして解析を行います。通常、順番の狂ったログレコードは不正とされます。Apacheではこのような問題を発生させません。
コンフィグ・ファイルのキーワード: FoldSeqErr
-i :
履歴ファイルを無視します。 注意して使用してください。
これによって、以前に実行されたWebalizerの履歴ファイルは無視されて、新たにWebalizerの結果が生成されます。 それは、あたかもWebalizerが初めて実行され、それ以前の統計結果はすべて失われた状態でindex.html(年間)が作られます。(以前のHTMLドキュメントは削除はされません)
コンフィグ・ファイル・キーワード : IgnoreHist
-b :
増分データファイルを無視します。 注意して使用してください。 これにより、Webalizerは、以前の実行で作成された既存の増分(状態)データファイルを無視します。 増分データファイルを無視すると、今月以前のすべての処理が失われ、それらのログを再処理する必要があります。
構成ファイルのキーワード:IgnoreState
-p :
増分処理の状態を維持します。
これは部分ログでの増分を処理を可能にします。プログラムの終了時に、次回のプログラム実行時に復元されるように関連する内部データを保存します。これは2つ以上にローテート(分割)されたログを、一月分または数ヶ月の1つのログのようにWebalizerが使用し、月と月の間まで1つのファイルが集まるまで実行できないような心配をしないようにできます。追加情報については、"増分処理(Incremental Processing)"のセクションを参照してください。デフォルトでは増分処理は実行されません。機能を有効にするにはこのコマンドラインオプションを使用してください。
コンフィグ・ファイル・キーワード : Incremental
-q :
クアィト(静かな)モード。
通常、Webalizerは実行中に何が起きているかを知らせるための様々なメッセージを生じます。このオプションはそれらのメッセージを抑えるでしょう。
これは、STDERR(標準エラー出力)に出力されるエラーおよび警告を抑制します。
コンフィグ・ファイル・キーワード: Quiet
-Q :
リアル クアィトモード。
webalizerが実行中に表示する、エラーや警告も含めてすべてのメッセージを抑制します。Webalizerが cron ジョブとして実行される場合に有用です。
コンフィグ・ファイル・キーワード: ReallyQuiet
-T :
時間情報を表示。
Webalizerは処理の開始と終了の経過時間を保持します。
通常は処理の終了において処理にかかったトータルの時間を表示します。
もし、クアィトモード(-q または 'Quiet yes'をコンフィグ・ファイルに記入)を指定した場合、経過時間の情報は表示されません。クアィト(quite)モードが指定されていたとしても、このオプションは経過時間表示に影響を与え表示を強制します。
コンフィグ・ファイル・キーワード: TimeMe
-c file
このオプションは、利用するコンフィグ・ファイルを指定します。
コンフィグ・ファイルは、Webalizerがどのように動作するかに対する全体的なコントロールを可能にし、またその幾つもの方法を利用できるようにします。
バージョン0.98の時点で、デフォルトのコンフィグ・ファイルはカレントディレクトリの「webalizer.conf」という名で探し、見つからない場合は、 /etc ディレクトリの中の同じ名前のファイルを探します。 もし、このオプションとファイル名をコマンドラインで指定した場合このファイルが利用されます。
-n name
このオプションで指定したホスト名が、生成されるレポートに使用されます。
ホスト名はすべての報告書のタイトルの中で使用され、またURLのレポートの前につけられます。
これは、「仮想」ウェブサーバ、あるいはレポートが置かれるマシンと異なるウェブサーバログファイルをWebalizerが処理することを可能にし、URLのリンクが適切な位置へ飛ぶようにすることをまだ可能にします。

ホスト名がコマンドラインおよびコンフィグファイルのいずれかで指定されない場合、Webalizerは'uname'システムコールを使用して、ホスト名を決定することを試みます。
これが失敗すれば、「localhost」がスト名として使用されるでしょう。
コンフィグ・ファイル・キーワード: HostName
-o dir
このオプション、レポートの出力ディレクトリを指定します。
もし、この指定やコンフィグファイルの指定が無い場合には、カレントディレクトリが使用されます。
コンフィグ・ファイル・キーワード: OutputDir
-x name
このオプションは、生成されるページが デフォルトの'.html'以外の拡張子となることを可能にします。
指定する名前の中にはピリオド'.'を含めないでください。
コンフィグ・ファイル・キーワード: HTMLExtension
-P name
レポートの中でカウントされる'ページ(Pages)'のファイル拡張子を指定します。
ページ(時々「PageViews」と呼んだ)は、パーツを含まないページ全体を表示する為の通常のhtmlドキュメントとCGIスクリプトです。
あるシステムは同じように 'phtml'や'php3'あるいは'pl'のように、さらに幾つか定義してカウントする必要があるでしょう。
デフォルトは Webログの 'htm*' と 'cgi'と、ftpログの 'txt' となります。
コンフィグ・ファイル・キーワード: PageType
-O name
'pages'としてカウントされないURLを指定します。 これらのURLのいずれかに一致するリクエストは、上記で定義されたPageTypeのいずれかに一致する拡張子を持つか、拡張子がまったくない場合でも、ページとしてカウントされません。
構成ファイルのキーワード:OmitPage
-t name
このオプションは、すべてのレポート用のタイトルを指定します。
実際のタイトルは、この文字列と共にホスト名が使用されます。
これを指定しなかった場合、デフォルトでは "Usage Statistics for(利用統計)"が使用されるでしょう。
コンフィグ・ファイル・キーワード: ReportTitle
-Y :
カントリーグラフの省略
通常Webalizerは、グラフおよび表形式のカントリー統計を生成します。
このオプションは、カントリーグラフの生成を抑制します。
コンフィグ・ファイル・キーワード: CountryGraph
-G :
一時間毎のグラフを省略
通常Webalizerは、グラフおよび表形式の一時間毎の統計を生成します。
このオプションは、一時間毎のグラフの生成を抑制します。
コンフィグ・ファイル・キーワード: HourlyGraph
-H :
時間あたりの統計を省略
通常Webalizerは、グラフおよび表形式の一時間毎の統計を生成します。
このオプションは、一時間毎の統計表の生成を抑制します。
コンフィグ・ファイル・キーワード: HourlyStats
-K num:
メインインデックス(年間サマリー)表に表示する月数を指定します。 デフォルトは12か月です。 12〜120か月(1〜10年)の間に設定できます。
構成ファイルのキーワード:IndexMonths
-k num:
メインインデックス(年間サマリー)グラフに表示する月数を指定します。 デフォルトは12か月です。 12〜72か月(1〜6年)の間に設定できます。
構成ファイルのキーワード:GraphMonths
-L :
グラフの凡例を無効にします。
このオプションによって、グラフの中に表示される色ごとの凡例が無効化されます。
デフォルトでは、凡例は表示されます。
コンフィグ・ファイル・キーワード: GraphLegend
-l num
グラフラインの数。
棒線グラフの中に表示される背景の参考用ラインの数を指定します。
デフォルトは2本で、ゼロ('0')または20以上を指定するとラインは表示されません。
コンフィグ・ファイル・キーワード: GraphLines
-P name
ページの種類。 これは、ページ計算用のページと見なされるファイルの拡張子です(「ページビュー」と呼ばれることもあります)。
デフォルトは 'htm*' および 'cg' です(異なる場合は、指定したHTMLExtensionも)。 ピリオドを使用しないでください!
-m num
'visitタイムアウト'を指定します。
訪問時間は特定のホストによってなされた現在と最後のリクエスト間の時差を見ることにより計算されます。
このとき、時差が visitタイムアウトで指定した時間を超えたなら、以後のリクエストは新しいリクエストと判断されます。この値は秒で指定します。
デフォルトは30分の(1800)です。
コンフィグ・ファイル・キーワード: VisitTimeout
-M num
ユーザエージェントの圧縮レベルの指定。
通常は、Webalizerはユーザエージェンフィールドをそのままレポートします。残念ながら、それらユーザエージェントの情報は、異なったOSやマシンタイプの名前をなどの他のフィールドも併せて報告します。
例えばWindows 95で動作するNetscape 4.03 は、 Windows NTで動作している Netscape 4.03 と異なった文字列を報告するでしょう。
従って同じブラウザを利用していても、それらはWebalizerでは異なる2つのブラウザとして見なされるでしょう。
更に云えば、Windows NT で Netscape 4.0 を走らせても1つがAlphaでもう一つがIntelであれば、それぞれ異なる名前を報告してくるでしょう!
MSIEの場合には更に悪く、Netscapeであるかのように報告してくるので、IEであることを発見するには文字列の多くの検索することになります。
Webalizerはユーザエージェント名を圧縮し、このような汎用ブラウザの種類を統合するためにこのオプションはあります。
オプションは6つのレベルが指定でき、集計結果において詳細が異なります。
レベル5では、ブラウザの名前のみ(MSIE or Mozilla)とメジャーバージョンのみを表示します。 
レベル4では上記に加えマイナーバージョン(小数点以下1桁)が表示されます。
レベル3では、マイナーバージョンが2桁まで表示されます。
レベル2では、さらにサブレベルの呼称(Mozilla/3.01Gold や MSIE 3.0bのような)も追加されます。
レベル1は、さらにシステムタイプを加えることを試みるでしょう。
デフォルトのレベル0は、ユーザエージェント名の圧縮はせずに、もっとも詳細な量を表示します。
コンフィグ・ファイル・キーワード: MangleAgents
-g num
このオプションは、ドメイン名のグルーピングのレベルを指定します。
数値は、ドメインのグルーピングを行う場合に表示するべきドットの数を指定します。
デフォルト値の0は、ドメイン名のグルーピングを行いません。
コンフィグ・ファイル・キーワード: GroupDomains
-D name
これは、DNSキャッシュファイル名の指定をおこないます。
これは、DNSの検索を有効にした場合(コマンドオプションの -N または、コンフィグレーションファイルのキーワード DNSChildren を使い)に指定したファイル名が利用されます。このファイル名でディレクトリに絶対パスを指定されていない場合には、デフォルトのディレクトリを基準とします。この指定はDNSのサポートをコンパイルにおいて有効にしていないと 'Invalid Keyword' としてエラーが生成されます。
DNSの検索についての追加情報は、DNS.READMEファイルを参照してください。
-N num
逆引きDNSの検索に使用するDNS子プロセスの数。
指定するなら、DNSキャッシュファイル名の指定も必要です。
もしDNSキャッシュファイルが生成されるとこを望まない場合には、それを不能にするために値としてゼロ('0')を指定してください。これは使用できなくなる訳でなく、実行時に1つのみ生成します。
DNSの検索についての追加情報は、DNS.READMEファイルを参照してください。
-j :
ネイティブGeoDBジオロケーションサービスを有効にします。
構成ファイルのキーワード:GeoDB
-J name :
使用する代替GeoDBデータベースファイル名を指定します。 通常、これは必要ありません。 使用する場合、ファイル名"name"は、絶対パスが指定されていない限り(つまり、先頭が '/' で始まらない)、使用されている出力ディレクトリに対して相対的です。
構成ファイルのキーワード:GeoDBDatabase
-w :
GeoIPサポートが有効とする場合は指定にします。
構成ファイルのキーワード:GeoIP
-W name :
使用する代替GeoIPデータベースファイル名を指定します。 通常、これは必要ありません。 使用する場合、ファイル名 'name'は、絶対名が指定されていない限り(つまり、先頭の '/' で始まらない)、指定された出力ディレクトリに相対的です。
構成ファイルのキーワード:GeoIPDatabase
-z name :
国旗のグラフィックの場所を指定し、上部の国テーブルでの表示を有効にします。 ディレクトリ名は、絶対パスが指定されていない限り(つまり、先頭が '/' ででない場合)、出力ディレクトリに対して相対的です。
構成ファイルのキーワード:FlagDir

非表示オプション:

オプションとして与えられる文字列アーギュメントでは、比較によるマッチングが補助される。
IndexAlias オプションを除き、文字列アーギュメントにはプレーンテキストを使い、プレーンテキストの始まり又は終わりにはワイルドカード'*' を含むことができます。

例として:
文字列 "yourmama/was/here" のとき、アーギュメントの "was" , "*here" そして "your*" はすべて一致として処理されます。

-a name
レポート中の「上位 ユーザ・エージェント(Top User Agent)」表から、指定したユーザエージェント(ブラウザ)を見えなくします。
このオプションは現在のように同じブラウザでも細分化されている状況で、特定の目的のために特別な名前のユーザエージェントをリストから場外したい場合を除き、あまり役にたちません。 それと、このオプションを使うためには、あなたのWEBサーバがログファイルにユーザエージェントを記録するようにしなくてはなりません。
加えて、もしあなたがレポートの中のユーザエージェント表を無効にするならば、このオプションは意味を無しません。( -A コマンドオプションまたは、コンフィグファイルの"TopAgents"キーワードを参照してください)
コマンドライン上で必要な数だけ、このオプションを指定することができます。
ワイルドカード文字'*'は、文字列の前か最後に使用することができます。
(つまり: Mozilla/4.0*は、文字列"Mozilla/4.0"で始まるものとすべて一致するでしょう。)
コンフィグ・ファイル・キーワード : HideAgent
-r name
このオプションはレポート中の「上位 参照元(Top Referrer)」表から指定した照会元を隠します。
照会者は、あなたのWEBサーバへのURLを指していたローカルまたはリモートサイトのURLです。
このオプションは通常、自分自身のサイトからのアクセスを上位参照元情報としてレポートに含めないようにするために使います。
このオプションを使うためには、ログファイルに参照元情報を取得できるWEBサーバを持っていいなくてはなりません。
加えて、もしあなたがレポートの中の参照元の表を無効にするならば、このオプションは意味を無しません。(-R コマンドライン・オプションまたは、コンフィグファイルの "TopReferrers" キーワードを参照してください)
コマンドライン上で必要な数だけ、このオプションを指定することができます。
コンフィグ・ファイル・キーワード: HideReferrer
-s name
このオプションはレポートでの「上位 リモートサイト(Top Sites)」表から、指定したサイトを隠すことを可能にします。
通常はレポートの上位リモートサイトの表には、WEBサーバを訪れた中から自分のサイトかによるものを隠したいと考えるでしょう。
もしあなたがレポートの中の上位 リモートサイト(Top Sites)表を無効にするならば、このオプションは意味を無しません。
(-S コマンドライン・オプションまたは、コンフィグファイルの "TopSites" オプションを参照してください)。
コンフィグ・ファイル・キーワード: HideSite
-X :
これは個々のサイトをすべて見えなくします。
そしてレポートにはグループ化されたサイトを報告します。
コンフィグ・ファイル・キーワード: HideAllSites
-u name
このオプションは、レポートの"トップ URL(Top URL's)"表からURLを見えなくします。
通常、WEBサーバのイメージファイルやオーディオファイルやその他のオブジェクトの情報によってこの表が見にくくなってしまわないように、このオプションを使います。
もしあなたがレポートの中の"トップ URL(Top URL's)"表を無効にするならば、このオプションは意味を無しません。
(-U コマンドライン・オプションまたは、コンフィグファイルの "TopURLs" キーワードを参照してください)
コンフィグ・ファイル・キーワード: HideURL
-I name
このオプションは、index.html の別名を追加で指定することを可能にします。
Webalizerでは、URSから'index.'を処理の前に取り除き、URLにおいて'/somedir/index.html'と'/somedir'は同じものとして扱われる効果があります。
このオプションは、指定した追加の文字列に対して、同じ効果を与えます。
使用には注意が必要です。不適切な使用は予期しない結果を引き起こす可能性があります。
例えば、別命として'home'という文字列を指定したなら、'/somedir/homepages/brad/home.html'というURLは '/somedir'と変換されこれは恐らく意図されたものでは無いでしょう。
あなたのウェブサーバが標準のホームページ(index ページ)の'index.html'、'index.htm'以外に、'home.html'あるいは'homepage.html'のような文字列を使用する場合、このオプションは有用です。
文字列が指定された場合、URLの中が常に検索されます。したがって、'home.htm'が指定されると、"/somedir/home.htm"と"/somedir/home.html"のどちらも、"/somedir/"として扱われます。
利用は控えてください。 文字列を指定した場合、常にログのレコードが検索され、文字列を束ねるためにパフォーマンスを悪化させます。
ワイルドカードの利用はできません。
コンフィグ・ファイル・キーワード: IndexAlias

テーブルサイズのオプション:

-e num
このオプションの指定で、「上位 エントリページ(Top Entry Pages)」表の表示数を指定します。
0 を指定すると、表は表示されません。
コンフィグ・ファイル・キーワード: TopEntry
-E num
このオプションの指定で、「上位 終了ページ(Top Exit Pages)」表の表示数を指定します。 
0 を指定すると、表は表示されません。
コンフィグ・ファイル・キーワード: TopExit
-A num
このオプション指定で、「上位 ユーザエージェント(Top User Agents)」表の表示数を指定します。
0 を指定すると、表は表示されません。
コンフィグ・ファイル・キーワード: TopAgents
-C num
このオプション指定で、「上位 国(Top Countries)」表の表示数を指定します。
0 を指定すると、表は表示されません。
コンフィグ・ファイル・キーワード: TopCountries
注意) Debianにて、パッケージの Webalizer をインストールした場合、この表のタイトルは "Top Locations(上位 地域)" となっているようです。
-R num
このオプション指定で、「上位 参照元(Top Referrers)」表の表示数を指定します。
0 を指定すると、表は表示されません。
コンフィグ・ファイル・キーワード: TopReferrers
-S num
このオプション指定で、「上位 サイト(Top Sites)」表の表示数を指定します。
0 を指定すると、表は表示されません。
コンフィグ・ファイル・キーワード: TopSites
注意) Debianにて、パッケージの Webalizer をインストールした場合、この表のタイトルは "上位 リモートサイト" となっているようです。
-U num
このオプション指定で、「上位 URL(Top URL's)」表の表示数を指定します。
0 を指定すると、表は表示されません。
コンフィグ・ファイル・キーワード: TopURLs

設定ファイル(CONFIGURATION FILES):

Webalizerは、簡単に利用できるようにするためにコンフィグ(設定)ファイルを利用できます。
Webalizerによって、コンフィグ・ファイルは何通りかの方法でアクセスされます。
Webalizerが実行されると最初に、カレントディレクトリ上の"webalizer.conf"を探し、見つからないと"/etc/webalizer.conf"を探します。さらに、コマンドラインで '-c' オプションと共にコンフィグファイルを指定することもできます。
これら、設定ファイルとコマンドラインオプションを組み合わせることで、様々な結果を生成することができます。
Webalizerでは、常に最初にコンフィグファイルを探し読み、その設定をデフォルトと行動します。 そしてまた、コンフィグファイルでデフォルトとされたものを、コマンドラインからのオプションによって上書きして使用することができます。
例えば、殆どのユーザは、デフォルトのファイルとして /etc/webalizer.conf を作成し、そこにホスト名、ログファイル名、表のオプションなどを指定しておき、月末等に違うログファイルを使ってWebalizerを実行したいときにコマンドラインから指定することで、コンフィグファイルでの指定を上書きして実行させることができます。
コンフィグファイルでのオプションの中には、コマンドラインによるアーギュメント(引数)で上書きできないものもある事にち注意してください。
例えば、コンフィグファイルで"Quiet yes"を指定した場合、コマンドライン(-q オプション)の引数の指定による上書きで、この機能を無効にすることはできません。

コンフィグファイルは、標準的なASCIIテキストファイルで作成されているので、編集は標準的なエディターを使用できます。
ブランク行(空行)と最初がシャ-プ記号('#')で始まる行は無視されます。
その他のコンフィグファイル中の行は、キーワードと値が与えられた有効な行と判断されます。
'キーワード'として現在のところ以下のような設定できるキーワードと特定の割り当てられた値をもったものが定義されている。
キーワードの後の文字は行の中では、どんなテキスト文字もキーワードに対する値と判断される。そのため、行中の本来の値の後ろには、実際の値ではない文字を含むべきではありません。
プログラムと同梱されている"sample.conf"ファイルには、利用において有用なドキュメントろ例が含まれています。また、必ずしもコンフィグファイルが必要では無いことにも注目してください。その場合には、デフォルト値が使用されます。(殆どのサイトではデフォルトで利用しても十分でしょう)

一般的なコンフィグ キーワード:

LogFile
利用するログファイルのデフォルトを指定します。これは完全修飾された名前(パスを含んだ)であるべきです。 しかし、相対パスでも実行できます。 もし指定されなければ、STDIN(標準入力)からログファイルを待ちます。

LogType
利用するログファイルのタイプを指定します。通常は、WebalizerはWebログである CLF形式かコンビログフォーマットを処理します。
このキーワードを使って適切なタイプを指定することで、wu-ftpdのxferlogフォーマットログや、squidプロキシのログを処理しても良いでしょう。適切なファイルタイプを与えてください。そうしないと 'invalid record' というメッセージが沢山表示されることになるでしょう。
コマンドライン オプション: -F

OutputDir
レポートを出力するディレクトリを指定します。 指定がなかった場合にはカレントディレクトリが使われます。
コマンドライン オプション: -o

HistoryName
望むのであれば、履歴のパス/ファイル名を指定できます。
デフォルトでは、'webalizer.hist'のファイル名を使い、通常は出力ディレクトリ(上記の OutputDir)に保持されます。
名前の指定で絶対パス(即ち '/'で始まる)でファイル名が与えられない場合には、出力ディレクトリからの相対パスに関連付けられます。

ReportTitle
生成されるレポートに使用するタイトルを指定します。
これはホスト名(もし、ブランクでなければ)とともに使われ、最終的なレポートのタイトルとして生成されます。
この定義が行われない場合、デフォルトでは"利用統計(Usage Statistics for)"が使われます。
コマンドライン オプション: -t

HostName
これはホスト名を定義します。
ホスト名は、レポートのタイトルと"上位 URL(Top URL's)"表の中のURLと関連付けられます。
これは、Webalizerが仮想Webサーバや実際のWebサーバでないマシンで実行された場合に、URLをクリックして正しく適所に行くために使用します。
指定がなかった場合、Webalizerは 'uname' システムコールを使って ホスト名の入手を試み、それに失敗した場合には、デフォルトでは"localhost"となります。
コマンドライン オプション: -n

UseHTTPS
'上位 URL(Top URL's)'表の中のリンクに、デフォルトの'http://'に代わって'https://'を使用させます。
貴方のサーバで、セキュア/非セキュアなサーバをミックスして実行している場合、使用に適さないでしょう。
貴方がセキュアサーバのログの解析を実行し、その表の中のリンクとして望む場合に利用してください。

HTAccess
出力ディレクトリにデフォルトの.htaccessファイルを作成できるようにします。
有効にすると、ファイルが既に存在しない限り、(単一の"DirectoryIndex" ディレクティブを使用して)ファイルが作成されます。 デフォルトは 'no' で、.htaccessファイルの作成を無効にします。
Quiet
これは、プログラムの実行中に表示されるメッセージを有効または無効にします。
このキーワードに対する値は "yes" または "no" となります。
"Quiet yes"とした場合、メッセージは省略され、"Quiet no"とした場合にはメッセージが有効になります。 指定が省力されている場合のデフォルトは "no" となり、Webalizer は情報メッセージの表示を行います。
このオプションは、STDERRに出力される警告やエラーメッセージに対しては効果が生じません。
コマンドライン オプション: -q

ReallyQuiet
これにより、警告およびエラーメッセージを含む、生成されたすべての出力を抑制することができます。 このキーワードの値は、 'yes' または 'no' のいずれかです。デフォルトは'no' です。
コマンドライン引数:-Q
TimeMe
これは、"quiet"モードが指定されている場合でも、経過情報の表示を可能にします。
Webalizerをコマンドラインオプションの -q または、コンフィグファイルの "Quiet" キーワードを使って "quiet" モードで実行した場合でも、この指定を行うことで処理に要した経過情報が常に表示されるようになります。
値としては、"yes" または "no" が指定でき、デフォルトは "no" になっています。
コマンドライン オプション: -T

GMTTime
このキーワードは、タイムスタンプとして現地時間の代わりにGMT(UTC:グリニッジ標準時)時間で表示させることを可能にします。
通常 Webalizer は、タイムスタンプの表示を実行中のマシンのタイムゾーンに合わせます。
このキーワードを指定することで、GMT(UTC)時間でタイムスタンプの表示をすることを可能にします。
値としては、"yes" または "no" が指定できます。 デフォルトは "no" です。

Debug
これは、Webalizerに対して警告やエラーに遭遇した際に追加の情報を表示させるように指示します。
通常、Webalizer は問題のあるレコードや障害を見つけると、適度な情報を知らせます。
このオプションを指定することで、処理において警告やエラーの元になった実際のデータの表示を可能にします。
これは多くの警告やエラーを取得するので、原因を特定したい場合にのみに有効にするべきです。
値としては "yes" または "no" が指定でき、デフォルトは "no" です。
コマンドライン オプション: -d

IgnoreHist
履歴ファイルの読み込みを省略します。注意して使用してください。
Webalizerでは、履歴ファイルによって先月からの状態を保持しています。
このオプションによる効果は、Webalizerが初めて実行されたように動作し、それ以前のデータは破棄されます。
値として 'yes' まはた 'no' が指定でき、デフォルトは 'no' です
コマンドライン オプション: -i

IgnoreState
これにより、既存の増分データファイルの読み取りが抑制されます。 非常に注意して使用してください! 既存の増分データファイルを無視すると、今月の以前のすべての処理が失われ、それらのログを再処理する必要があります。 値は 'yes' または 'no' で、デフォルトは'no'です。
コマンドライン引数:-b
FoldSeqErr
ログのレコードにおいて、順番が狂っているレコードがあった場合に解析の戻り処理を行い、あたかもそれらが最後のよいレコードと同じデート/時間をするかのようにそれらを扱うこ
とで、分析を可能にします。
通常、ログのレコードの順番が狂っていると、単に無視されます。
あなたがapacheを実行しているなる、このような問題は心配ありません。

VisitTimeout
'訪問者のタイムアウト'時間 をセットします。
訪問者が閲覧のために特定のサイトに行った現在と最後のリクエストの時差のタイムアウト間隔を指定します。
もし、時差がタイムアウトで指定した時間より大きい場合、それは新しい訪問によるリクエストと判断されます。
値は秒数で指定し、デフォルトは30分(1800)です。

PageType
「ページ」のタイプを拡張定義することを可能にします。
通常では、HTMLとCGIスクリプトをパージとして扱います。
このオプションにより、貴方の指定した拡張子を持ったものをページと見なします。
デフォルトでは、Webログの中の '*.html" と '*.cgi' と FTPログの中の '*.txt' となります。
コマンドライン オプション: -P

PagePrefix
指定された接頭辞を備えたリクエストがすべて「ページ」と見なされることを可能にします。
もし、あなたが /documents 以下のすべてをページとして扱うことを望むのであれば、この拡張によって行えます。
また、CGIスクリプトなどがある場合には、そのパスの指定に使うと有用でしょう。

OmitPage
上記で定義されたPageTypeまたはPagePrefixに一致する拡張子を持つ場合でも、指定されたURLをどのような状況でもページとしてカウントされないようにします。
GraphLegend
生成されたグラフ中の色分けされた凡例の表示を有効または無効にします。
デフォルトでは 'yes' で表示されます。
コマンドライン オプション: -L

GraphLines
生成されたグラフの背景線の数を指定します。
デフォルトでは 2 です。 非表示にするには、数をゼロ('0')にしてください。
コマンドライン オプション: -l

IndexMonths
メインインデックス(年間サマリー)表に表示する月数を指定します。デフォルトは12か月です。 12〜120か月(1〜10年)の間に設定できます。
コマンドライン引数:-K
YearHeaders
YearHeadersメインインデックス(年次サマリー)テーブルの年ヘッダーの表示を有効または無効にします。 有効にすると、テーブルに16か月以上のデータが表示されるときに年ヘッダー表示されます。 値は'yes' または'no'です。 デフォルトは'yes'です。

GraphMonths
メインインデックス(年間サマリー)グラフに表示する月数を指定します。 デフォルトは12か月です。 12〜72か月(1〜6年)の間に設定できます。
コマンドライン引数:-k
CountryGraph
このキーワードは作成される国別の利用者グラフの表示を有効または無効にします。
値としては 'yes' または 'no' を使い、デフォルトは 'yes' になっています。
コマンドライン オプション: -Y

CountoryFlags
上位の国テーブルのフラグの表示を有効または無効にします。 有効にすると、以下の 'FlagDir' オプションで別のパスが指定されない限り、出力ディレクトリのすぐ下にあるデフォルトの 'flags'が使用されます。
コマンドライン引数:-zflags

FlagDir
フラググラフィックの場所を指定します。 指定しない場合、デフォルトはレポートに使用される出力ディレクトリのすぐ下の'flags'ディレクトリにあります。 指定した場合、フラグの表示はデフォルトで有効になります。
コマンドライン引数:-z

DailyGraph
このキーワードを使うことで、「日ごとの状況(Daily Usage)」グラフの生成と表示を有効/無効にすることが可能になります。
値としては 'yes' または 'no' を使い、デフォルトは 'yes' になっています。

DailyStats
このキーワードを使うことで、「日ごとの統計(Daily Usage statistics)」表の生成と表示を有効/無効にすることが可能になります。
値としては 'yes' または 'no' を使い、デフォルトは 'yes' になっています。

HourlyGraph
このキーワードを使うことで、「時間ごとの状況(Hourly Usage)」グラフの生成と表示を有効/無効にすることが可能になります。
値としては 'yes' または 'no' を使い、デフォルトは 'yes' になっています。
コマンドライン オプション: -G

HourlyStats
このキーワードを使うことで、「時間ごとの統計(Hourly Usage statistics)」表の生成と表示を有効/無効にすることが可能になります。
値としては 'yes' または 'no' を使い、デフォルトは 'yes' になっています。
コマンドライン オプション: -H

IndexAlias
これは、'index.html'の別名を追加で定義することを可能にします。
通常、Webalizerは処理においてURLに与えられた文字列の中から"index."の部分を探し出します。
これは、URLである /somedir/index.html の中の /somedir/ をだけを真のURLとします。
このキーワードは、"home.html"のような異なるデフォルト名を使用するのサイトに対して、同じような扱いをさせるための名前を指定するのに使います。
URLの中の文字列は、いかなる場所にあっても走査されます。そのため、あなたがこれの定義を誤り、たとえば 'home' としてしまうと、URLで /somedir/homepages/brad/home.html が使われた場合、意図に反して結果は /somedir/ となってしまうでしょう。
この場合、 'home.htm' を指定することで正確なURLの /somedir/homepages/brad/ を得ることができるでしょう。
指定された別名は、ログ中のすべてのレコードから走査されることに注意してください。 定義された別名をレコードから走査しなくてはならないために、処理の性能を著しか下げることになるでしょう。
なお、別名として 'index.'はデフォルトなので定義は不要です。
コマンドライン オプション: -I

DefaultIndex
このオプションは、URLの末尾から削除されるデフォルトのインデックス名として"index."の使用を有効/無効にするために使用されます。 ほとんどのサイトはこのオプションを使用する必要はありませんが、特にデフォルトのインデックスファイル名が異なるサイトや、'index.php'または同様のURLを使用して動的コンテンツを生成するサイトは便利です。
このオプションは、IndexAliasオプションを使用して定義される名前には影響せず、それらの名前は引き続き説明どおりに機能します。 値は'yes' または'no' で、デフォルトは'yes' です。

MangleAgents
MangleAgentsキーワードは、ユーザエージェント名の圧縮レベルを指定します。
指定できるレベルは6段階あり、レベルごとに表示される詳細に差が作り出されます。
レベル5では、ラウザの名前のみ(MSIE or Mozilla)とメジャーバージョンのみを表示します。
レベル4では、上記に加えマイナーバージョン(小数点以下1桁)が表示されます。
レベル3では、マイナーバージョンが2桁まで表示されます。
レベル2では、さらにサブレベルの呼称(Mozilla/3.01Gold や MSIE 3.0bのような)も追加されます。
レベル1では、さらにシステムタイプを加えることを試みるでしょう。
デフォルトであるレベル0では、ユーザエージェント名のフィールドに手を加えず、もっとも詳細な量を表示します。
コマンドライン オプション: -M

SearchEngine
このキーワードは、検索エンジンおよびそれらのクエリ文字列の指定を行います。
検索文字列はレコードの中のリファラーフィールドから見つけることができます。
Webalizerが適切に機能するためには、利用した検索エンジンごとに違うクエリ文字について知る必要があります。
SearchEngineは、検索文字列に使う検索エンジンにおける解析のための各クエリ文字列を指定します。
行は次のようなフォーマットです: "SearchEngine エンジン文字列 クエリ文字列"
"エンジン文字列"は検索エンジンと一致させるための"yahoo.com"や"altavista"といったような文字列です。クエリ文字列は、検索エンジンに対しURLで与えられたユニークな文字列で、"search="や"MT="のような検索文字列とともに最後に与えられた文字列です。このキーワードに対応するコマンドオプションはありません。

SearchCaseI
SearchCaseIオプションは、検索文字列を小文字にする(大文字と小文字を区別しない)かどうかを指定します。
ほとんどの検索エンジンは大文字と小文字を区別しない検索を使用するため(つまり、「Hello」の検索は「HELLO」または「hello」と同じです)、小文字に変換するとキーワードの精度が向上します。これはデフォルトです。 必要に応じて、このオプションを使用して大文字と小文字を区別できます。 値は 'yes'または 'no'で、デフォルトは 'yes'(大文字と小文字を区別しない)です。

Incremental
増分(インクリメント)処理を有効または無効にします。
増分処理は、分割されたログを処理するために以前に実行されたを失わないようにします。次回のプログラムの実行にて、保存された'内部ステータス'を読み込み、再格納されます。追加情報については、'増分処理(Incremental Processing)'の章を参照してください。
コマンドライン オプション: -p

IncrementalName
望むなら、増分データファイルを指定できます。
通常、'webalizer.current'というファイル名が使われ、標準の出力ディレクトリに保持されます。指定した場合、絶対パス(即ち最初が '/')で始まる名前が与えられなければ、出力ディレクトリからファイルは探されます。

StripCGI
CGI変数をURLの末尾から削除するかどうかを決定します。 通常、これらの変数は正確性を向上させるためにURLから削除されますが、一部のサイトはそれらを保持したい場合があります(特に非常に動的なサイト)。 値は'yes'または'no'のいずれかで、'yes'がデフォルトです。

TrimSquidURL
http://部分の後に指定された数の '/' パス区切り文字の後にそれらを切り捨てることにより、squidログURLの粒度を減らすことができます。 値を1にすると、すべてのURLがドメインのみで要約されます。 デフォルト値はゼロ(0)で、URLは変更されません。

DNSCache
DNSキャッシュのファイル名を指定します。
この名前が絶対パス(即ち'/'で始まる)が与えらられなかった場合、標準の出力ディレクトリから探されます。
追加情報については、DNS.READMEファイルを参照してください

DNSChildren
DNSキャッシュファイルを作成/更新するために実行するDNS子プロセスの数を指定します。
これを指定するなら、DNSキャッシュファイル名も指定されなくてはいけません。(上記参照)
無効にするなら、ゼロ('0')を指定します。
追加情報については、DNS.READMEファイルを参照してください。

CacheIPs
未解決のアドレスもDNSデータベースにキャッシュするかどうかを指定します。 有効にすると、未解決のIPアドレスが解決済みのアドレスとともに保存されます。 これは、プログラムが実行されるたびに検索されないように、多くの未解決のIPが訪問する一部のサイトで役立つ場合があります。 値は 'yes'または 'no'です。 デフォルトは'no'です。

CacheTTL
キャッシュされたDNSエントリの生存期間(TTL)値を日数で指定します。 デフォルト値は7(1週間)です。 1〜100の任意の値を指定できます。

GeoDB
The Webalizerが提供するネイティブGeoDBジオロケーションサービスの使用を制御します。 値は'yes'または'no'で、デフォルトは'no'です。
コマンドライン引数:-j

GeoDBDatabase
使用するGeoDBデータベースのファイル名を指定します。
これは、絶対パスが指定されていない限り(つまり、 '/'でない)、使用されている出力ディレクトリに対して相対的です。
コマンドライン引数:-J

GeoIP
GeoIPジオロケーションサービスの使用を制御します。 WebalizerがGeoIPサポートでコンパイルされた場合、デフォルトで使用されます。
値は'yes'または'no'です。 デフォルトは'yes'です。
コマンドライン引数:-w

GeoIPDatabase
使用する代替GeoIPデータベースファイル名を指定します。
この名前は、絶対名が指定されていない限り(つまり、'/'でない)、デフォルトの出力ディレクトリに相対的です。
コマンドライン引数:-W


上位(Top)の表に関するキーワード:

TopAgents
これは、上位(Top)のユーザエージェントを"上位ユーザエージェント(Top User Agents)"表にいくつ表示させるかを指定します。
デフォルトでは15です。 もしあなたがユーザエージェントの状況が不要であるなら、値にゼロ('0')を指定します。
あなたのWebサーバのログファイルにユーザエージェントの情報を含んでいれば(つまり、コンビログフォーマットであれば)、ユーザエージェントは表示される事でしょう。
コマンドライン オプション: -A
AllAgents
すべてのユーザエージェントを表示するために、個別のHTMLページを生成するでしょう。
有効にした場合、そのリンクは"上位ユーザエージェント(Top User Agents)"表の最後に追加されます。
値として'yes'か'no'を指定しデフォルトは'no'です。
TopCountries
これは、上位(Top)の国を"上位 国(Top Countries)"表にいくつ表示させるかを指定します。
デフォルトでは30です。 もしあなたが国情報が不要であるなら、値にゼロ('0')を指定します。
コマンドライン オプション: -C
注意) Debianにて、パッケージの Webalizer をインストールした場合、この表のタイトルは "Top Locations(上位 地域)" となっているようです。
TopReferrers
これは、上位(Top)の参照元を"上位 参照元(Top Referrers)"表にいくつ表示させるかを指定します。
デフォルトでは30です。 もしあなたが参照元情報が不要なであるなら、値にゼロ('0')を指定します。
コマンドライン オプション: -R
AllReferrers
すべての参照元をを表示するために、個別のHTMLページを生成するでしょう。
有効にした場合、そのリンクは"上位 参照元(Top Referrers)"表の最後に追加されます。
値として'yes'か'no'を指定しデフォルトは'no'です。
TopSites
これは、上位(Top)のサイトを"上位 リモートサイト(Top Sites)"表にいくつ表示させるかを指定します。
デフォルトでは30です。 もしあなたがサイト情報が不要なであるなら、値にゼロ('0')を指定します。
コマンドライン オプション: -S
TopKSites
'KByte'による順になっている以外は、上位 リモートサイト(TopSites)表と同等です。デフォルトは 10 です。コマンドラインオプションはありません。
AllSites
すべてのサイトを表示するために、個別のHTMLページを生成するでしょう。
有効にした場合、そのリンクは"上位 リモートサイト(Top Sites)"表の最後に追加されます。
値として'yes'か'no'を指定しデフォルトは'no'です。
TopURLs
これは、上位(Top)のURLを"上位 URL(Top URL's)"表にいくつ表示させるかを指定します。
デフォルトでは30です。 もしあなたがURL情報が不要なであるなら、値にゼロ('0')を指定します。
コマンドライン オプション: -U
TopKURLs
'KByte'による順になっている以外は、上位 URL(Top URL's)表と同等です。デフォルトは 10 です。コマンドラインオプションはありません。
AllURLs
すべてのURLを表示するために、個別のHTMLページを生成するでしょう。
有効にした場合、そのリンクは"上位 URL(Top URL's)"表の最後に追加されます。
値として'yes'か'no'を指定しデフォルトは'no'です。
TopEntry
"上位 エントリ(Top Entry Pages)"表にいくつ表示させるかを指定します。 デフォルトでは10です。 もしあなたが表が不要なであるなら、値にゼロ('0')を指定します。
コマンドライン オプション: -e
TopExit
"上位 終了ページ(Top Exit Pages)"表にいくつ表示させるかを指定します。 デフォルトでは10です。 もしあなたが表が不要なであるなら、値にゼロ('0')を指定します。
コマンドライン オプション: -E
TopSearch
"上位 検索文字列(Top Search Strings)"表にいくつ表示させるかを指定します。 デフォルトでは20です。 もしあなたが表が不要なであるなら、値にゼロ('0')を指定します。 正常に機能するには、コンビネーションログ形式だけです。(つまり、参照元情報がある)
TopUsers
"上位 ユーザ名(op Usernames)"表にいくつ表示させるかを指定します。ユーザ名はWebサーバでhttp認証を利用しているか、処理されたwu-ftpd のxferlog の場合利用できます。 デフォルトでは20です。 もしあなたが表が不要なであるなら、値にゼロ('0')を指定します。
AllUsers
すべてのユーザ名を表示するために、個別のHTMLページを生成するでしょう。
有効にした場合、そのリンクは"上位 ユーザ名(Top Usernames)"表の最後に追加されます。
値として'yes'か'no'を指定しデフォルトは'no'です。
AllSearchStr
すべての検索文字列を表示するために、個別のHTMLページを生成するでしょう。
有効にした場合、そのリンクは"上位 検索文字列(Top Search Strings)"表の最後に追加されます。
値として'yes'か'no'を指定しデフォルトは'no'です。

オブジェクト非表示のキーワード:

これらのキーワードは、ユーザーエージェントや参照元、サイト、URLやユーザネームな"上位(Top)"として表示されるレポート表を非表示にできます。
これらのキーワードで使われる値は、これに相当するコマンドラインで使われるものと同じものです。
これらは望むかぎり制限なしで何度も使用することができます。
指定できる値や文字列のフォーマットについてはコマンドラインオプションを参照してください。値は80文字以上は指定できません。

HideAgent
これは、指定されたエージェント(ブラウザ)を「上位 ユーザエージェント(User Agents)」表から見えなくできます。 今日のように無数の異なる名前のブラウザあるので、これはそれ程有用な機能ではありません。しかし特定のエージェントがある場合(例:robots, spiders, real-audio, etc..)これらがあなたのサイトの上位ユーザエージェントのリストとして頻繁に表示されるような場合には役に立つかもしれません。
このキーワードは次の場合には役立ちません。
1)ログファイにユーザエージェント情報が取れていない場合
2)ユーザエージェントのレポート表を無効にしている場合
コマンドライン オプション: -a
HideReferrer
これは、"上位 参照元"表から指定された参照元を隠すことを可能にします。通常、あなた自身のWebサーバが上位の参照元として生成されるを隠すために指定するでしょう。
もちろん、このキーワードは次の場合には役に立ちません。
1)ログファイに参照元情報が取れていない場合
2)上位の参照元のレポート表を無効にしている場合
コマンドライン オプション: -r
HideSite
これは、"上位 リモートサイト"表から指定されたサイトを隠すことを可能にします。通常、あなた自身のWebサーバやローカルマシンが上位のサイトとして生成されるを隠すために指定するでしょう。
もとりわけ、あなたのブラウザがそれをホームページなどに指定する場合には指定すると良いでしょう。
コマンドライン オプション: -s
HideAllSites
これは個々のサイトの表示をすべて隠すことを可能にします。
非常に多くのグループから利用されている場合、(グループ化されたレコードが隠せないので)これは有用です。
これは、GroupDomain機能による結合に特に有効です。しかしながら、他の状況にも同様に役立つことができます。
値として'yes'か'no'を指定し、デフォルトは'no'です。
HideURL
これは"上位 URL(Top URL's)"表から、URLを隠すの可能にします。
通常これは訪問ユーザに転送された、グラフィックファイルやオーディオファイル、その他のHTMLファイルでないようなアイテムを隠すのに使われます。
コマンドライン オプション: -u
HideUser
これは、"上位ユーザ名(Top Usernames)"表から、指定したユーザ名を隠すことを可能にします。
ユーザ名は、あなたがHTTPベースの認証をWebサーバに用意した場合に利用可能です。

グループオブジェクトに関するキーワード:

Group* キーワードは、サイト、URL、参照元、ユーザ・エージェントおよびユーザー名に基づいてオブジェクトのグループ化を可能します。
Hide* キーワードとコンビで使うことで、"上位"レポート表に表示されるものを適正にカスタマイズすることができます。 例えば、特別なディレクトリだけのトータルを表示したいなら、GroupURL と HideURL を指定します。(例: '/heml/*')
グループの処理は、個々のレコードへの処理が完了した後に行われ、その結果ネームのたたみ込みとサイトのトータルの更新の完了後に処理されることになります。
この為、グループはメインサイトの合計にカウントされません。(つまり重複はされない)
グループは、強調と影とともに表示されます。グループの詳細レコードはデフォルトでレポートからは隠されません。
これは個々のレコードを見せる一方、これらをグループの一部としてグループ明細として表示できます。もし、詳細なレコードを見えなくしたいのであれば、Group* ディレクティブを Hide* とともに同じ値で使用してください。これらのキーワードについては、コマンドラインスイッチは有りません。
Group*キーワードでは更に実際の値を代わり使うに、オプションラベルを受け入れます。このラベルは、少なくともスペースかタブ文字のセパレート文字によって、値の後ろに付けられます。例についてはsample.confファイルを参照してください。
GroupReferrer
参照元をグループ化できます。幾つかのメジャーな検索エンジンから参照によった複数の名前を得た状態が手軽になります。
GroupURL
このキーワードはURLのをグループ化することを可能にします。
完全なディレクトリ階層をグループ化するのに役立ちます。
GroupSite
このキーワード、サイトをグループ化することを可能にします。
トップレベルドメインやダイアルアップによる逆引きできないIPアドレスに尤も使用されます。その他でも...
GroupAgent
グループ・ユーザ・エージェント。
あなたがどのようにこれを使用するかの手軽な例は、GroupAgentとHideAgentのキーワードに対する値として"Mozilla"および"MSIE"を使用することです。
最初に"MSIE"をを指定して確かめてください。
GroupDomains
ドメインの自動グルーピングを許可します。
数値はグループのレベルに相当し、表示する「ドットの数」と見なすことができます。
1とした場合、セカンドレベルドメインまで表示されます。(xxxx.xx : 例:"co.jp")
2とした場合、サードレベルドメインまで表示されます。(xxx.xxxx.xx : 例:"yahoo.co.jp")
または数値を上げればそれ以上のレベルまで表示します。
デフォルトの値の 0 とすると、ドメイングルーピングは行われません
コマンドライン オプション: -g
GroupUser
ユーザー名のグルーピングを許可します。
グループ名とコンビにして、特別なユーザの実際にの名前を表示せずにグループ名で統計を表示させる手軽な方法です。
GroupShading
グループのためのテーブル列の影付けを許可します。
使える値は 'yes' または 'no' で、デフォルトは 'yes' が与えられています。
GroupHighlight
グループのためのテーブル列の強調表示を許可します。
使える値は 'yes' または 'no' で、デフォルトは 'yes' が与えられています。

無視(Ignore)/含む(Include) オブジェクトのキーワード:

これらのキーワードは、あなたが統計の生成を成功させるために、基準を無視させることで無効なログレコードを無視することを可能にします。
レコードは、サイト、URL、ユーザエージェント、照会元およびユーザー名などについて、無視するか含むことができます。
レコードを無視することによって、生成された統計の正確さが、ウェブサーバ上のロードの正確な値とは違い不正確になることに注意してください。
これらのキーワードは、Hide* キーワードに影響を与えます。
値の先頭または後ろにはワイルドカード'*'が使えます。
これらのキーワードは Hide* と同じように、値は80文字以内の制限を持っています。
これらのキーワードは、どんなコマンドラインスイッチを持っていません。したがって、それらは単に設定ファイル中で指定されるものです。
さらに、使用において無視/含む のコンビは選択的に実行され、全サイトを除外するような特別な塊を含んでいると非常に非効率的になりますので回避してください。
そのような場合には、ファイルを分割して処理を行ってください。
IgnoreSite
これは、指定されたサイトを統計の生成において完全に無視することを可能にします。
IgnoreURL
これは、指定されたURLが統計の生成において完全に無視することを可能にします。
このキーワードの使い方としては、外部からのアクセスが無い開発中のために使っている'temporary'ディレクトへのアクセスヒットを無視することでしょう。
IgnoreReferrer
これは、参照元フィールドに基づいてレコードが無視されることを可能にします。
IgnoreAgent
これは、指定されたユーザエージェントレコードが統計から完全に無視されることを可能にします。あなたが MSIE からのリアルなアクセスをすべて見たくなければ、恐らく有用。
IgnoreUser
これは、指定されたユーザー名レコードが統計から完全に無視されることを可能にします。
あなたがサーバー上でhttp認証を有効にすれば、ユーザー名は使用することができます。
IncludeSite
ホスト名に基づいて処理されることをレコードに強制します。
これはIgnore*キーワードに優先します。
IncludeURL
URLに基づいて処理されることをレコードに強制します。
これはIgnore*キーワードに優先します。
IncludeReferrer
照会元に基づいて処理されることをレコードに強制します。
これはIgnore*キーワードに優先します。
IncludeAgent
ユーザエージェントに基づいて処理されることをレコードに強制します。
これはIgnore*キーワードに優先します。
IncludeUser
ユーザー名に基づいて処理されることをレコードに強制します。
あなたがサーバー上でhttpに基づいた認証を使用すれば、ユーザー名は利用可能です。
これはIgnore*キーワードに優先します。

ダンプ・オブジェクト キーワード:

Dump* キーワードは、データベースやスプレッドシート、その他のプログラムなどがインポートして利用できる、テキストファイルを生成します。
ファイルは標準的なタブで区切られたテキストで、ファイルの中の各カラムはタブキャラクタ(0x09)で区切らてれています。
もし'DumpHeader'キーワードを使用し要求したなら、ヘッダーレコードが含まれているでしょう。
隠れ(hidden)レコードを含めて、これらすべてのものが含まれたファイルは、'DumpPath' で出力する場所を指定できます。 どうでないときは、それらは出力ディレクトリーに作成されるでしょう。
DumpPath
ダンプファイルのための場所を選択します。デフォルトの場所に出力したくない場合に利用します。値にはパスを指定し、通常は絶対パス(つまり、先頭が'/'で始まる)を使用します。相対パスを使ったときは、現在の出力ディレクトリディレクトリからの位置からの相対パスになります。
DumpExtension
ダンプファイル名の拡張子の指定を可能にします。
デフォルトは'tab'です。しかしながら、このオプションはいつか変更されるかもしれません。
DumpHeader
ファイルの最初にヘッダーレコードが書かれることを可能にします。
値は'yes'または'no'のどちらかで、デフォルトは'no'です
DumpSites
タブを区切りとしたサイトのダンプファイルです。
値は'yes'または'no'で指定し、デフォルトは'no'です。
ファイル名は site_YYYYMM.tab (YYYY=年 ,MM=月) が使用されます。
DumpURLs
タブを区切りとしたURLのダンプファイルです。
値は'yes'または'no'で指定し、デフォルトは'no'です。
ファイル名は url_YYYYMM.tab (YYYY=年 ,MM=月) が使用されます。
DumpReferrers
タブを区切りとした参照元のダンプファイルです。
値は'yes'または'no'で指定し、デフォルトは'no'です。
ファイル名は ref_YYYYMM.tab (YYYY=年 ,MM=月) が使用されます。
参照元情報(Referrer information)は、ログの中にある場合のみ利用可能です。(つまりコンビ Webサーバ ログの場合)
DumpAgents
タブを区切りとしたユーザエージェントのダンプファイルです。
値は'yes'または'no'で指定し、デフォルトは'no'です。
ファイル名は agent_YYYYMM.tab (YYYY=年 ,MM=月) が使用されます。
ユーザエージェント情報(Useragent information)は、ログの中にある場合のみ利用可能です。(つまりコンビ Webサーバ ログの場合)
DumpUsers
タブを区切りとしたユーザ名のダンプファイルです。
値は'yes'または'no'で指定し、デフォルトは'no'です。
ファイル名は user_YYYYMM.tab (YYYY=年 ,MM=月) が使用されます。
ユーザ名データは、wu-ftpd の xferlog または httpの認証を使うようにしたWebサーバので、その情報がログにある場合のみ利用可能です。
DumpSearchStr
タブを区切りとした検索文字列のダンプファイルです。
値は'yes'または'no'で指定し、デフォルトは'no'です。
ファイル名は search_YYYYMM.tab (YYYY=年 ,MM=月) が使用されます。
検索文字列は、照会元情報が処理されているログの中にあり、検索エンジンが見つかり処理されたことを認識した場合に利用可能です。

HTML生成 キーワード:

これらのキーワードは、webalizerが生成するHTMLコードのカスタマイズを可能にし、企業ロゴを追加したり他のサイトページへのリンクを加えることを可能にします。
これらのキーワードの多くを好きなだけファイルの中に指定することができます。
値の長さは80文字を超えてはいけません。したがって、長い行のときには2行以上に行を分けなくてはいけないかもしれません。
これらのキーワードにコマンドライン相当物はありません。
HTMLExtension
生成されるページをデフォルトの'html'拡張子以外の何かのファイル名にすることを可能にします。拡張子を指定する場合にはピリオド('.')を含まずに指定してください。
コマンドライン オプション: -x
HTMLPre
HTMLファイルの一番最初に挿入されるコードの指定を可能にします。
デフォルトでは標準的な HTML 3.2 DOCTYPEレコードです。
ファイルの最初が<HTML>タグにならないよう、挿入するHTMLには注意してください。
サーバサイドスクリプトを使うなら、php3のようなスクリプトファイルやディレクティブを書く能力が必要です
HTMLHead
<HEAD></HEAD>ブロックの間にHTMLコードを挿入することを可能にします。
デフォルトはありません。HTMLのページにJavascriptまたはphp3や幾つかのMETAタグをスクリプトで加えるのに役立つでしょう。
HTMLBody
このキーワードは、レポートの<HEAD>セクションの後におかれるHTMLコードを定義します。それはタイトルの後ろで"summary period/generated on"の間の行となります。
使用する場合、HTMLHead行を最初にした上で<BODY>タグを用いなくてはいけません。
あなたが後続の行で必要なことなら何でも書き込めますが、このコードはタイトルに続く他のWebページの外観に影響を与えることを心に留めておいてください。
いくつかの典型的な用途として、ページカラーの変更や、恐らく右上に企業ロゴ(グラフィック)を加えることです。
指定をしなかった場合、デフォルトの<BODY>タグでは、デフォルトのページカラー、テキスト色およびリンク色となります。(例は"sample.conf"ファイルを参照)
HTMLPost
このキーワードは、タイトルと"統計期間(Summary Period)/作成日時(Generated)"の行の後ろに置かれるHTMLコードを定義します。
それは、丁度最初の水平線(罫線)タグ<HR>の前に置かれます。
通常、このキーワードは必要とはしないでしょう。しかしながら、大きなグラフィックを含みたいとき、幾つかの異様なフォーマットのタグを含んだHTMLHeadセクションをクリーンアップしたい時やメインレポートセクションを終了させたい時などに使うことでしょう
HTMLTail
このキーワードは、レポートの一番下・右側に置かれるHTMLコードを定義します。
これは、<TD>..</TD>タグで囲まれた<TABLE>セクションの中に置かれます。
通常このキーワードはあなたのホームページへのリンクバックの提供やページの一番下の右側に小さなグラフィックを挿入するのに使われます
HTMLEnd
これは、ページ終わりに挿入のコードをクローズするために指定します。
デフォルトはクローズとして</BODY>および</HTML>タグを置くきます。
これを貴方自身がが指定したい場合に使用してください。
LinkReferrer
これは、最上位リファラーテーブルにリストされているリファラーをプレーンテキストとして表示するか、リファラーへのリンクとして表示するかを指定します。 値は'yes'または'no'のいずれかで、'no'がデフォルトです。

グラフィックカラーコマンド

これらのキーワードにより、Webalizerによって生成されるさまざまなグラフで使用される色を変更できます。
値は、標準のHTML RGB 16進数カラー文字列として指定され、先頭に '#' 文字はありません。 値は大文字と小文字を区別しません。
指定しない場合、表示されるデフォルトの色が使用されます。
ColorHit Color used for 'Hits'. Default is '00805C' (green)

ColorFile Color used for 'Files'. Default is '0040FF' (blue)

ColorSite Color used for 'Sites'. Default is 'FF8000' (orange)

ColorKbyte Color used for 'KBytes'. Default is 'FF0000' (red)

ColorPage Color used for 'Pages'. Default is '00E0FF' (cyan)

ColorVisit Color used for 'Visits'. Default is 'FFFF00' (yellow)

ColorMisc Color used for miscellaneous titles in various 'Top'
tables (not graphs). Default is '00E0FF' (cyan)

PieColor1 Pie Chart color #1. Default is '800080' (purple)

PieColor2 Pie Chart color #2. Default is '80FFC0' (lt. green)

PieColor3 Pie Chart color #3. Default is 'FF00FF' (lt. purple)

PieColor4 Pie Chart color #4. Default is 'FFC080' (tan)

Webログファイルの注意事項

Webalizerはその役割をすべて働かせるために、CLFログフォーマットをサポートします。
ユーザエージェントや参照元の情報が必要なら、WEBサーバがこの情報をログファイルに提供でき、それがWebalizerが理解できるフォーマットである必要があります。
Webalizerはログフォーマットにおける多くの微妙なバージョンの変化を扱おうとしますが、幾つかは理解できません。
ほとんどのWebサーバはCLFフォーマットのログを出力するのが一般的です。Apacheでは、適切なログフォーマットを生成するために以下のような変更を httpd.confファイルに加えてください。

LogFormat "%h %l %u %t \"%r\" %s %b \"%{Referer}i\" \"%{User-agent}i\""

'{}'で囲まれたこれは、Apache webサーバにおいて参照元(referrer)とユーザエージェント(user agent)の情報を含む各レコードの'コンビネーション(combined)'ログを得る指定です。(これは、Apache と NCSA における標準推奨です。)
Netscape と その他のWebサーバは、ログフォーマットを変更する同様の能力を持っています。(注: ApacheのVer1.2までは同様であったが、Ver1.3以降はログフォーマットを変更する上記のような方法を持った。.... Apacheのドキュメントを参照の事)

FTPログファイルの注意事項

Webalizerは現在、wu-ftpdによって出力される標準の'xferlog'ログファイルをサポートします。ftpログを得るには、-Ff コマンドラインオプションを使うか、コンフィグレーションファイルの中で"LogType ftp"を指定する必要があります。
(wu-ftpdで)間もなくフォーマットへ追加があるかも知れません。しかしながらWebalizerの将来のバージョンではログフォーマットへのユーザによる定義をする機能が利用できるようになりますので、これは問題なくなるでしょう。
Webサーバのものとは違う(つまり、ページタイプやホスト名などが異なる)ため、ftpの解析の為に、あなたがWebサーバの解析用と別のコンフィグレーションファイルを作成することをお勧めします。

Webとftpのログの差のために、少数の制限があります:

参照元(Referrers)の注意事項

照会元(Referrers)は不思議な産物です...
それらは多くの形状および形式をとり、典型的なURLより分析することをはるかに難しくするような、少なくともある規格化があります。
あなたのログファイルの照会元フィールドに含まれているものは、どの照会元からサイトに来たか、実際の照会元によって生成されたシステムのタイプなどです。
ユーザの多くは多くの方法であなたのサイトにたどり着くことができます...
ブラウザのブックマークによったり、他のリモートサイトにページ上のリンクをクリックしたり、あなたのサイトを探し出した検索エンジンの結果によって表示されたインデックスなどによってです。
Webalizerは、参照元文字列に幾つかのことをして、すべてのこれらバージョンについて知的な方法で変化に対処することを試みることで、簡単な分析を行います。
勿論、もしあなたのWebサーバが参照元の情報を提供しないなら、おそらく、このセクションを読んであなた自身にそれが何故なのかを尋ねていることでしょう...

ほとんどの照会者元は"http://somesite.com/somepage.html"の形式をとり、それはあなたが、どのWebサイトのリンク上のユーザ・クリックによってあなたのサイトへ到着したかを得るでしょう
バリエーションの中では、あなたのローカルマシン上のHTMLドキュメントからの参照を"file::/some/such/sillyname"のように見えるでしょう。
いくつかのバリエーションは使われる、使っているシステムのタイプや使用しているネットワークなどに依存するでしょう..。複雑にしているのは、ダイナミックHTMLドキュメントやCGIスクリプトによって生成されたHTMLドキュメントや外部プログラムが生成した追跡のために最後まで付け加る、ありとあらゆる方法による多くの余分な情報です。
ユーザがブラウザからURLをタイプ入力したり、ブックマークをクリックしたならば、これらの参照元の情報は得られず"-"が記録されるでしょう。
これらのバリエーションをすべて扱うために、Webalizerは、ある方法で照会元フィールドを解析します。
最初に、照会元文字列が"http"から始まるなら、それは正常な参照とし、単純化するために"http://"とそれに続くホスト名を小文字に変換する。例えば、参照元が"HTTP://WWW.MyHost.Com/This/Is/A/HTML/Document.html"であったなら、"http://www.myhost.com/This/Is/A/HTML/Document.html"が得られます。小文字に変換されるのは、"http://"とホスト名だけであることに注目してください。
照会元フィールドの残りについてはそのままにしておかれます。
これは標準的な慣習に従います。現実的にはメソッド(HTTP)やホスト名は文字の大きさに無関係ですが、ドキュメントの部分は文字の大きさを変えることに敏感なためです。

検索エンジン、ダイナミックHTMLドキュメント、CGIスクリプトおよび他の外部から来た参照元には、ページを作成するために追跡のための情報を追加されます。
この共通的な例は、Web上で検索エンジンおよび、そのサイト・インデックスから来る参照元で見つけることができます。
時々、これらの参照元URLは数百文字の長さとなり、あなたのサイトを探すためにユーザが打ち込んだすべての情報を含んでいるかも知れません。
Webalizerはこれらの参照元からすべてのクエリ情報を切り取り、それらは疑問符'?'で始まります。
参照元が、 "http://search.yahoo.com/search?p=usa%26global%26link"であるなら、"http://search.yahoo.com/search"へと変換されるでしょう。

ユーザがッブラウザのブックマークやURLをダイレクトに打ち込んできた場合、参照元のフィールドはブランクで"-"として見えます。
ほとんどのサイトではもっと違うタイプで参照元を得たいかもしれません。
Webalizerはこれらのタイプの参照元を"- (Direct Request)"のように変換します。

これは、コマンドライン・オプションかコンフィグファイルによって簡単に隠すことができます。
ず、恐らく他のリファラを隠すこと、それはそうであるべきではありません。
This is because the character "-" is a valid character elsewhere in a referrer field, and if not turned into something unique, could not be hidden without possibly hiding other referrers that shouldn't be.

文字のエスケープについての注意事項

HTTPプロトコルは、URLを見て行動する方法を定義します。
ある程度まで、参照元フィールドも同じような規則に従っています。
エスケープ文字は、非印刷文字や非ASCII文字(またはASCII文字でさえ)をURLに使用できるようにする技術です。
これは、URLにセパレート文字'%'に続く16進の値を置くことによって処理が行われます。
16進の値はASCII文字から構成されるので、どんな文字もエスケープによってURL中で印刷可能文字として使うことができます。
いくつかのシステムは極端で、エスケープが必要ないものまですべての部分をエスケープするような概念をとります。
これに対処するためWebalizerでは、URLと参照元について処理の前に非エスケープを実施します。例えば、URLで"/www.mrunix.net/%7Ebrad/resume.html"は"www.mrunix.net/~brad/resume.html"として、ユーザがWebページにアクセスするのと同様の形式にします。もしURLがエスケープされないなら、それは例え同じものであっても、2つの別々のドキュメントとして扱われるでしょう

検索文字の解析

Webalizerは、よく知られた検索文字列のパターンを見つけることによって、参照元の文字列を最小の分析で行います。
もっとも有名なYahoo!やAltavistaやLycos等の検索エンジンをサポートしています...
不運なことに、検索エンジンは常に内部のCGIクエリフォーマットなどが変化して、新しい検索エンジンは日々現れます。そのため、それらのすべての検索文字列を検知することは不可能です。
しかしながら、あなたのサイトに遭遇した際、ユーザがどんな検索をしていたかの良い指針を得ることは十分に適格でしょう。
注意:バージョン1.31の時点で、検索エンジンをコンフィグファイル内に指定することができます。追加の検索エンジンを指定する方法の例については、sample.confファイルを参照してください。

Visits/Entry/Exit値の注意

Webalizerによるデータ解析された大多数とレポートはインプットされた元のログが正確ならほぼ正しいでしょう。
しかしながら、HTTPプロトコルの制限、ファイアウォールの使用、Proxyサーバー、マルチユーザーシステム、ログファイルのローテーションおよび他の無数の条件により、これらの数のうちのいくつかは絶対的な精度を持った計算をすることができません。
特に、エントリーページ(Entory Pages)とExitページは他の条件などにより高くなることが疑われます。
理由は以下の通りです。

1)ログファイルのサイズと時間間隔は有限です。そして
2) IPアドレスだけを与えられて、多数の個々のユーザを別々に識別する方法はありません。

ログファイルが有限なので、それらには始まりと終わりを持っています。これは固有の時間を持っているいることを表します。
そのため、ログ上の期間以前に起こったか知る方法はありません。また、それに基づいた未来事象を予言することは不可能です。
さらに、同じIPアドレスを持っている多数のユーザはすべてシングルユーザーであるように見えるので、個々のユーザを別々のものとして扱うことはできません。
一般的な企業ユーザの接続は、プロキシやファイアーウォールをい経由するため、同じアドレス(プロキシ/ファイアーウォール自身のアドレス)から来たように見えます。
動的なIPアドレスの割り当て(ダイアルアップでのインターネット。アカウントで使用される)は、多数の場所から利用されてしまうので、同じユーザとして表れてしまい更に問題を起こします。

例えば、2人のユーザがXYZ会社(それらは、Proxyサーバ 'fw.xyz.com' によってインターネットに接続されている)からあなたのサーバを訪ねると仮定します。 ネットワークからのリクエストはすべて、たとえ異なる2人の個別のPCから始められたとしても、あたかもそれらは'fw.xyz.comから始められたように見えます。
Webalizerはリクエストを見て同じ位置から来たものとして、1だけを記録するでしょう。実際に訪れたのは2であっても。
エントリーとexitページが訪問とともに計算されるので、実際に2であってもexitページもまた1として記録されます。

別の例として、XYZ会社の一人のユーザがあなたのWebサイトに訪れたとします。 そしてそれは、月の最後の日の 午後(PM) 11:52 に訪れて、翌月の 午前(AM) 12:30 まで行ったとします。
一般的な慣習で、サーバのログは月末にローテーション(保存とクリア)されるため、今、訪れているユーザのログイン情報は2つの異なるファイルに記録されます。
この(およびWebalizerが月間のヒストリをクリアにするという事実)のため、真夜中の最初に現れたユーザは前から継続されているにも係わらず、1番目のユーザとして記録されます。
それが、新しい月の時にそのIPアドレスが見つけられた最初のリクエストであるので、これを避けれません。

大体において、訪問者数、エントリとexitページのために示した数はかなり良い '推定' です。たとえそれが、100% 正確で無いにしたとしてもです。 それらは、全般的な傾向を示す表示を提供し、それほど実数からかけ離れてはいません。実際の(実数)値は常に等しくあるべきか、すべての場合においてより大きくあるべきであるので、恐らくそれらを可能な '最小の' 量と見なすべきです

Webalizer データのエキスポート(取り出し)

Webalizerは現在、すべてのオブジェクト・テーブルをタブで区切ったasciiテキストファイルにする能力を有し、その結果、それを最もポピュラーなデータベースや表計算プログラムにインポートできます。
これファイルは、通常は作成されず、コンフィグレーションのキーワードのDump*を使い有効にすることで、とても大きなものができる事でしょう。
ファイル名の拡張子はデフォルトでは '.tab' でいつでも 'DumpExtension'キーワードによって変更できます。
このデータにはすべてのアイテムが含まれているので、通常においては隠すようにする為に、普通のWebユーザが見えないようにするために出力ディレクトリに置くことは望ましくありません..
この理由で、 'DumpPath'設定キーワードが用意されていて、これらファイルをWebサーバの通常のドキュメントツリーの外部に配置することができます。
オプションにより、'ヘッダー'レコードをこれらファイルに書く事ができ、スプレッドシートの中にインポートして使えるようにできます..
データベースには通常ヘッダーを必要としないでしょう。
有効にした場合、ヘッダーはファイルの最初のレコードとしてタブで区切られた名前の列となります。

ログファイルとWebalizer

ほとんどのサイトは指定された間隔で cron のからWebalizerを実行するでしょう。このとき、データがログファイルのローテーションの結果、失われないように注意すべきです。
Webalizerの実行は、できるだけ月末の真夜中(これは0時の意味)に近い時間で、貴方のWebサーバのログファイルのローテーションによって'前月'ログファイルによって統計を実行させることです。
私たちのシステムにおいては、'rotate_logs'と呼ばれるシェルスクリプトが、毎月の終わりの真夜中に実行されます。
このスクリプト・ファイルはおおよそ以下のようです:

------------------------- file: rotate_logs ------------------------------
!/bin/sh

# halt the server
kill `cat /var/lib/httpd/logs/httpd.pid`

# define backup names
OLD_ACCESS_LOG=/var/lib/httpd/logs/old/access_log.`date +%y%m%d-%H%M%S`
OLD_ERROR_LOG=/var/lib/httpd/logs/old/error_log.`date +%y%m%d-%H%M%S`

# make end of month copy for analyzer
cp /var/lib/httpd/logs/access_log /var/lib/httpd/logs/access_log.backup

# move files to archive directory
mv /var/lib/httpd/logs/access_log `echo $OLD_ACCESS_LOG`
mv /var/lib/httpd/logs/error_log `echo $OLD_ERROR_LOG`

# restart web server
/usr/sbin/httpd

# compress the archived files
/bin/gzip $OLD_ACCESS_LOG
/bin/gzip $OLD_ERROR_LOG
------------------------- end of file ------------------------------------

このスクリプトは最初に 'kill' コマンドを使用して、ウェブサーバを止めます。
Apacheは、httpd.pidファイルの中でサーバーのPIDを維持します。したがって、私たちは kill のアーギュメントとしてそれを使用します。
次に、いくつかのバックアップ・ファイルの名前を定義します。それは、基本的にファイル名の後ろに日付と時間を追加します。
その後、ログファイルディレクトリの中のログファイルを'.backup'を付けてコピーし、現在のログファイルをアーカイブディレクトリ(/var/lib/httpd/logs/old)に移動し、サーバを再起動します。
このセットアップは、可能な限りWebサーバの停止している時間を短くしています。
それは、使用中のサイトにとっては重要なことです。
サーバを止めたくなければ、'kill'コマンドを外すこともできます。
代わりに '/usr/sbin/httpd' の行を "kill -1 `cat /var/lib/httpd/logs/httpd.pid`"コマンドにします。 殆どのWebサーバでは、これはサーバの再起動となり、ログファイルが新たに作成されるでしょう。

このポイントは、以前の月のログのコピーを作成し、それは通常のビジネスでのWebサーバの実施において、私たちが世界に対しどのような処理を行ったかを得なくてはなりません。
スクリプトの最後の2行はアーカイブされたログの圧縮を GNU の zip(gzip) プログラムで行っています。必要であれば、Webalizerでそれらのログを使っていつでも私たちが実行することができるログのコピーをまだ持っていることを忘れないでください。

次に、2つの crontab エントリを定義します。
1番目はその月末で真夜中に上記の 'rotate_logs' スクリプトを実行します。
2番目は、深夜0時の5分後で上に作成された '.backup' ログファイルでWebalizerを実行します。
これは、他の月次処理のための実行の機会を与え、システムが身動きできずにダウンしないようにしています。
もし、あなたが月次のスタッフで処理が必要ならば、ニーズに適するタイミングで変更することができます。
crontabエントリーは次のもように見えます:

------------------------- crontab entries --------------------------------
# Rotate web server logs and run monthly analysis
0 0 1 * * /usr/local/adm/rotate_logs
5 0 1 * * /usr/bin/webalizer -Q /var/lib/httpd/logs/access_log.backup
------------------------- end of crontab ---------------------------------


ご覧のように、ログのローテーションが真夜中に生じます。また、分析は5分後に行われます。
Webalizerが成功裡に動いたことをあなたが確認すれば、access_log.backup ファイルはもはや必要でないので削除することができます。
分析を再度実行する必要があれば、シェルスクリプトが作成した圧縮したアーカイブ・コピーを持っています。
指示するなら、上記の分析が適切に働くためにあなたのサイトに適している/etc/webalizer.conf設定ファイルを作成するか、そうでなければ、上記のcrontabのコマンドライン上の設定ファイルを適切に指定するべきです。
Webalizerを月一回よりしばしば実行されることを望めば、同様にこれをするために追加のcrontabエントリーを指定することができます。
しかしながら、上記のWebalizerの月処理の行われている時に実施されないように注意するべきです。終了前に別のWebalizerを実施させると、予測不能の結果が起こるかもしれません(ファイル・ロックによりログのローテーションが無効となったり)。
最も容易な方法は、類似のcrontabエントリーは半時間上で経過してから実行することです:

30 * * * * /usr/bin/webalizer

言語サポート

Webalizerのバージョン1.0x は言語のサポートが追加されました。このサポートは、ソースの配布では、その時に利用可能な言語ファイルをすべて含んでいます。また、デフォルトは英語で、私が流暢に話せるただ一つの言語はスペイン語です。
数人の人々にて、様々な言語への翻訳を行う望みを既に示しており、私がが言語ファイルを受け取るとともに、ftp://ftp.mrunix.net/pub/webalizer/からそれらをftpによって利用可能にするでしょう。
配布されたバイナリの中に必要な言語か存在しない場合、プログラムをあなた自身がコンパイルする必要があるでしょう。
英語以外に言語を使用する方法についての情報は、配布されらファイルのINSTALLを参照してください。

HTMLで出力された中のインライン・グラフィックを生産するためにGDグラフィックスライブラリが使用されますが、外字をサポートしていないことに注意してください。したがって、言語ファイルを翻訳するならば、この問題に遭遇するでしょう

新:
現在、ソースからのプログラムの構築時にconfigureスクリプトを使用して使用する言語を指定することができます。
--with-language=language_name を加えるだけです。
'language_name'には、/lang/ ディレクトリの中の有効な言語ファイルの名前です。
例えば、--with-language=french とした時には、構築ではフランス語がデフォルトの言語になります。
あなたが、ソースからのプログラムの構築について助言が必要なら、追加の情報について INSTALL ファイルをご覧下さい。

既知の問題

最後にあたって

結果ができるだけ正確であることを保証するために多くの時間および努力がWebalizerを作ることに注がれました。
もしあなたが、一貫しない結果、バグ、エラー、不具合、あるいちょっと良く分からないものを見つけたなら、どうか私が問題を調査できるように、どんなエラーか知らせてください。
これは、なお最小限度のドキュメンテーションに及びます。
更に将来版への提案や評価を歓迎します。

Homeへ

Copyright© 1998-2003 ROBATA.ORG