いますぐ実践! Linuxシステム管理

[バックナンバーのトップへ] [Linux システム管理のトップへ]


いますぐ実践! Linux システム管理 / Vol.132 / 読者数:1305名

こんばんは、うすだです。

前回発行してから3週間。3週間もあれば余裕だなと思っていたら、 本業がえらいことになって、お客さまのところで、 夜中まで作業したりなどしているうちに、発行日をむかえてしまいました。
(もちろん、ずっと監禁されてたわけじゃじゃないですよ。念のため。)

それはさておき、お客さまのところでは、マスクをしているかたが、 結構見られました。

きっと風邪が流行っているんだ、伝染らないように気をつけようと思い、 トイレでこっそりうがいなどして、対処していました。

でも、後から聞いたところによると、みなさん花粉症だったようです。
最近花粉症になるひとが増えていますが、そこまで顕著だとは思いませんでした。 そのうち、花粉症なのが当り前になるかもしれませんね。

というわけで、うっかり先入観にとらわれて、思い込んでしまうのはよくないなあ、 ということをあらためて思い知らされました。
思い込みに惑わされず、なるべく中立な立場で判断していきたいですね。

教訓のようなそうでもないようなですが、今回もはりきってまいります!

今回のお題 - ログを集計してグラフにする

システム管理者という仕事は、システムが正常に動作している間は、 特にやるべきことがない…なんてことはないですよね。

平常時であっても、トラブルの兆候が見られないか、 はたまた不正侵入を試みるやからがいないかなど、 プログラムや人間がログを監視する必要性は、依然としてあるのではないかと思います。

また、そういった細かい点のチェックだけでなく、 各サービスが滞りなく提供できているかなどを、 大局的に確認する必要があると思います。

さて、普段、なにげなしに蓄積されていくログですが、そのまま放置していますと、 異常がないことを確認する以外は誰も見ないまま、 cron さまが古いログを消してしまっているように思われます。

ここはひとつ、システム管理者という地位を利用して、 ログからなんらかの情報を抜き出し、集計してグラフにしてみたいと思います。
視覚化することによって、今まで気づかなかったことが、何かわかるかもしれない、 という淡い期待を込めまして…。


さて、何を集計するかですが、今回は、メールのログから、 送受信バイト数を時間毎に集計してみたいと思います。

実のところ、ほぼ思いつきですが、以前から、 どの時間帯にメール送受信のピークがあるのか知りたかったので、 やってみることにしました。

 

さて、メールのログといえば、/var/log/maillog だと思います。
(ものによっては、 /var/log/mail.info や /var/log/mail.log だったりするかもしれません。 syslog の設定やログの中身などを確認して、各自ご判断くださいませ。)

/var/log/maillog などの中身を、はじめてご覧になった貴兄は、 なんのことやらさっぱりわからないのかもしれません。 ですが、メールの送受信バイト数をカウントするだけなら、 以下を確認するだけで済みます。

たとえば、sendmail の場合、以下のような出力が該当します。
(注意: 先頭の日時とホスト名は、省略しています。)

  sendmail[PID]: キューID: from=送信者, size=サイズ, ...
  sendmail[PID]: キューID: to=受信者, ..., stat=Sent ...

1行目に、送信者とメッセージのサイズなどが記されています。
そして、後の行で、同じキューID とともに、受信者や、 送信結果などが記されています。stat=Sent となっていれば、 相手のメールサーバに送信できたということになります。 stat=Defered などとなっている場合は、なんらかの理由により、 相手に届けられなかったことを示します。

ということは、stat=Sent という結果のキューID のサイズを、 カウントしていけばよさそうですね。

ちなみに、postfix の場合は、以下のように、やや冗長になります。

  postfix/pickup[PID]: キューID: uid=ユーザID from=<ユーザ名>
  postfix/cleanup[PID]: キューID: message-id=<メッセージID>
  postfix/qmgr[PID]: キューID: from=<送信者>, size=サイズ, ...
  postfix/smtp[PID]: キューID: to=<受信者>, ..., status=sent ...
  postfix/qmgr[PID]: キューID: removed

ですが、メッセージのバイト数と、配送されたかどうかを判断すべき箇所は、 sendmail とほぼ同じであることがわかります。

ただ、いずれの場合も、各行の間に、 別のメッセージのログが入っていることがあります。 (つまり、上記のように連続しているとは限りません。)


ようは、これをスクリプトで集計してやれば、グラフ化に近づきます。
ということで、いつものごとく、Perl でちゃちゃっと書いてみました。

  #!/usr/bin/perl
  use strict;

  my %tm;    # 時刻   (キューID をキーとする連想配列)
  my %sz;    # サイズ (キューID をキーとする連想配列)
  my %tot;   # 送受信バイト数 (時間をキーとする連想配列)
  my %num;   # メッセージ数   (時間をキーとする連想配列)

  while(<>) {
      chop;
      # (1) ↓ size=数字 を含むログかどうか判断
      if(/^\S+\s+\d+\s+(\d+):\d+:\d+[^:]*\]:\s*([^:^\s]+):.*size=(\d+)/) {
          $tm{$2} = $1;  # 時間を記録  ($1 が時間、$2 がキューID)
          $sz{$2} = $3;  # サイズを記録 ($3 がサイズ)
      # (2) ↓ stat=sent か status=Sent を含むログかどうか判断
      } elsif(/^\S+\s+\d+\s+\d+:\d+:\d+[^:]*\]:\s*([^:^\s]+):.*stat[^=^\s]*=[Ss]ent/) {
          if($sz{$1} > 0) {              # 記録済かどうか
              $tot{$tm{$1}} += $sz{$1};  # 送受信バイト数の合計
              $num{$tm{$1}}++;           # メッセージ数
              $tm{$1} = $sz{$1} = 0;
          }
      }
  }

  # (3) 結果を CSV 形式で出力
  foreach my $m (sort keys %tot) {
      printf("%02d:00,%d,%d\n", $m, $tot{$m}, $tot{$m}/$num{$m});
  }

大雑把に説明しますと、中央の while 文でログを集計し、 後の foreach 文で CSV 形式を出力します。

while 文の中では、(1) で、size=数字 のログかどうかの判断を行って、 条件に合えば、時間とサイズを連想配列に記録します。
そして、(2) で、送信できたかどうかのログと一致するかどうか判断しています。 一致して、なおかつ、size=数字 のログが以前出てきた場合に、 やっと送受信バイト数をカウントします。

(1) と (2) の if 文では、正規表現を使って、 条件に合うかどうか判断を行っています。
本来であれば、この正規表現の意味を詳しくご説明したいところですが、 ちゃんと書くとものすごいことになってしまいます。
ですので、ここは思い切って、ばっさりと割愛させていただきました。
申し訳ありませんが、ご了承ください。
(正規表現だけで、ひとつのメルマガになってしまうと思いますので…。)

 

さて、これを、たとえば mtasize.pl というファイル名で保存します。
そして、実行可能な形式にして実行すると、以下のようになります。
(ログを参照するには、root の権限が必要です。 セキュリティを考慮すると sudo したほうがよいのですが、 ここでは簡便さを優先しています。)

  # chmod +x mtasize.pl
  # ./mtasize.pl /var/log/maillog
  00:00,1630112,2953
  01:00,2861009,4541
  ...

時:分,送受信バイト数,メッセージあたりの平均バイト数 という形式で、 出力されます。

これで、CSV 形式の出力が得られますので、あとは、 某表計算ソフトなどに持っていって、グラフにすれば、目的達成です。
表計算ソフトの使いかたは、わたしなんかよりも、 みなさんのほうがよくご存じだと思いますし、 これ以上行数を増やすのもよくありませんので、これまた割愛させていただきます。

ちなみに、実際の usupi.org のログを用いてグラフにしたものが、以下になります。

不思議なことに、朝5時と6時に、やたらとメールが使われていることが、 グラフにすることで明らかになりました。

思いつきでやってみた割には、意外な結果が得られて、有意義でした。
…いやいや、有意義でしたで済ませてはいけませんね。スパムが集中しているのか、 はたまたシステムがどかんと報告メールを送っているためか、 これから、原因を追求してみたいと思います。


以上、メールのログを集計して、時間毎の送受信バイト数をグラフにする方法を、 ご紹介しました。

昔、システム管理に関する発表を社内でしたときには、 メールやプロキシのログを集計して、こんなに帯域を使っているんだ的なことを、 グラフにしたことがありました。
そのときもやはり、上記のようなスクリプトを書いて処理した覚えがあります。 (その頃は、某表計算ソフトではなく、gnuplot とか使ったような気がしますが。)

正規表現のお勉強をしないといけないかもしれませんが、上記以外にも、 パケットフィルタリングや WWW サーバのログを集計してみると、 意外なことがわかるかもしれません。
見様見まね的にやってみてもよいと思いますので、 いろいろとトライしてみてくださいませ。

宿題の答え

前回の宿題は、

  今回のファイルを使用して、実際に debパッケージを作成しましょう。

でした。

前回にひきつづき、Digest::SHA2 の deb パッケージを作成したいと思います。 今回、パッケージ名は、他の Perl のモジュールにあわせまして、 libdigest-sha2-perl としてみました。

さて、まずは、前回同様、以下からソースコードを取り寄せます。

Digest::SHA2
http://www.cpan.org/modules/by-module/Digest/Digest-SHA2-1.1.1.tar.gz

これを展開して、とある場所にインストールします。

  % tar xvfz Digest-SHA2-1.1.1.tar.gz
  % cd Digest-SHA2-1.1.1
  % perl Makefile.pl
  % make
  % make test
  % mkdir /tmp/dest-usu
  % make DESTDIR=/tmp/dest-usu install

このあたりは、RPM のときの手順とまったく同じです。
ちなみに、make コマンド実行時に、怒涛のごとくエラーが出ましたら、 おそらく libc6-dev がありません。apt-get などで入手してください。
(それ以外の問題でしたら、詳細情報とともに、ご連絡いただけますと、 いっしょに考えさせていただくかもしれません。)

次に、deb パッケージ作成のための準備を行います。
なにはともあれ、作業用のディレクトリを作成します。

  % mkdir ~/ubu
  % cd ~/ubu

そして、前々回〜前回と使用しました、以下の雛型を入手します。

http://www.usupi.org/sysad/130_usudigest.tgz

これの中の、アーカイブだけを取り出し、展開します。

  % tar xvfz 130_usudigest.tgz usudigest-0.1.tgz
  % tar xvfz usudigest-0.1.tgz

ディレクトリ名が usudigest-0.1 になっていますので、変更します。

  % mv usudigest-0.1 libdigest-sha2-perl-1.1.1

肝心の中身である dest 以下を入れ換えます。

  % rm -rf libdigest-sha2-perl-1.1.1/dest
  % mv /tmp/dest-usu libdigest-sha2-perl-1.1.1/dest

入れ換えたものを、tar コマンドでアーカイブにします。

  % tar cvfz libdigest-sha2-perl-1.1.1.tgz digest-sha2-perl-1.1.1

そして、またしても前回同様、dh_make コマンドを実行します。

  % cd libdigest-sha2-perl-1.1.1
  % dh_make -e usu@usupi.org -f ../libdigest-sha2-perl-1.1.1.tgz

質問には、library と答えたくなるのをこらえて、s と回答します。
そう、single binary だよ、と答えるわけですね。

上記を実行して、debian/ 以下が無事作成されましたら、 debian/control の Description などを埋めましょう。

  Section: libs
  Priority: optional
  Description: Digest::SHA2 Perl Module
  ...

最後に、dpkg-buildpackage コマンドで、deb パッケージなどを作成してもらいます。

  % dpkg-buildpackage -rfakeroot

なんだかよくわからないかもしれませんが、それでもかまいませんので、 まずは、書いてある通りにやってみてください。
(とか言って、わたしもあまりわかっていないのですが…。)

今回の宿題

今回の宿題は、

  メールのログを集計して、日毎の送受信バイト数を求めましょう。

です。

本題では時間毎でしたが、宿題では日毎に集計してみましょう。
できれば、グラフまで作成しちゃってください。
意外な結果がわかるかどうかは、さだかではありませんが…。

あとがき

先週末、出張から帰ってきまして、たまったメールをはやく読まなければと思い、 家からインターネットを使おうとしたところ、ものすごく重くて使いものにならない、 という現象に出くわしました。

これはプロバイダの障害だなと思って、サポートに電話してみましたが、 お待ちくださいというガイダンスが流れるばかりで、 人間との会話に到達することができません。

しかたがないので、あちこちに ping を打ちながら、 障害が解消されるのを待っていました。
しかし、待てども待てども、約50%のパケットをロスしている状況から、 復活するきざしを感じることができません。

こりゃだめだーなんて思いながら、ふと、 おうちのブロードバンドルータにも ping を打ってみました。
…すると、なぜか、同じように、半分くらいパケットをロスしているではありませんか!

プロバイダの障害だとしたら、 ルータの向こうのマシンとの通信に問題があるというのはわかります。 しかし、ルータはおうち内にありますので、プロバイダは関係ないはずです。

で、いろいろ調べた結果、HUB の故障が原因であることがわかりました。
別の HUB を使用することで、さくさく通信できるようになりました。

というわけで、プロバイダを疑ってしまい申し訳なかったなという気持ちと、 サポートに電話がつながらなくてよかったーという安堵感を、同時に感じた週末でした。

冒頭で、先入観にとらわれないようにしよう、とか思った矢先のできごとだっただけに、 己の学習能力のなさには、本当にあきれてしまいました。

今度こそ、ほんとうに、先入観を捨て去って、考えます!
特に、いま、お仕事で原因不明の不具合に悩まされていますので、 過ちを繰り返さないためのいい機会だと思って、挑みたいと思います。

 

今回も、ここまで読んでいただき、ありがとうございました。
それでは、次回は 3月23日 頃に、お会いしましょう!

 

「いますぐ実践! Linux システム管理」の解除は、以下からできます。
http://www.usupi.org/sysad/ (まぐまぐ ID:149633)

バックナンバーは、こちらにほぼ全部そろっています。
http://www.usupi.org/sysad/backno.html

「栗日記」− 出張続きで危うかった栗の更新も、なんとかなりました。
http://www.usupi.org/kuri/ (まぐまぐ ID:126454)
http://usupi.seesaa.net/ (栗日記ブログ)


[バックナンバーのトップへ] [Linux システム管理のトップへ]

トップ

バックナンバー
    [日付順] [目的別]

プロフィール

▼ リンク

独学Linux
Linuxデスクトップ環境に関する情報が満載です。 メルマガもありますよ。
LINUXで自宅サーバーを構築・導入
(Fedora8)

Fedora8のインストールの仕方から管理方法まで、詳しく載っています。 SearchManには情報がもりだくさんです。
マロンくん.NET
〜サーバ管理者への道〜
Linuxをサーバとして使用するための、いろいろな設定方法が載っています。 マロンくんもかわいいです。 なんといっても、マロンくんという名前がいいですね!!
日本の Linux 情報
日本の、Linux 総本山的なところです。
Linux Square − @IT
@ITが提供する、Linux の情報が満載。 載っていない設定方法はないんじゃないでしょうか。
Open Tech Press
Linux に限らず、オープンソース関連の記事が網羅されています。
ITmediaエンタープライズ:Linux Tips 一覧
Tips というより FAQ 集でしょうか。わからないことがあれば覗きましょう。
IBM developerWorks : Linux
開発者向けですが、勉強になりますよ。
Yahoo!ニュース - Linux
Yahoo!のLinuxに関するニュース一覧です。
栗日記
システム管理とかと全然関係ありませんが、毎日栗の絵を描いています。
システム管理につかれちゃったとき、癒されたいときに、ご覧ください。:-)
WEB RANKING - PC関連
ランキングに参加してみました。押してやってください。

▼ 作ってみました

Add to Google

▼ せんでん





▼ 最近読んだ本

ハリー・ポッターと炎のゴブレット ハリー・ポッターと炎のゴブレット
J.K.Rowling
  ハリポ月刊なので読み直してます
ハリー・ポッターとアズカバンの囚人 ハリー・ポッターとアズカバンの囚人
J.K.Rowling
  ハリポ月刊なので読み直してます
ハリー・ポッターと秘密の部屋 ハリー・ポッターと秘密の部屋
J.K.Rowling
  ハリポ月刊なので読み直してます
ハリー・ポッターと賢者の石 ハリー・ポッターと賢者の石
J.K.Rowling
  ハリポ月刊なので読み直してます
アルケミスト アルケミスト
パウロ・コエーリョ
  また読んだ
賢者の書 賢者の書
喜多川 泰
  違った視点から見られてよかった
セキュリティウォリア セキュリティウォリア
Cyrus Peikari, Anton Chuvakin
  やや冗長…ためにはなりました
CORE MEMORY CORE MEMORY
John Alderman, Mark Richards
  この筐体でPC作ってほしい!
新訳 星の王子さま 新訳 星の王子さま
サン=テグジュベリ
倉橋 由美子
  つまらない大人になったのか…
センネン画報 センネン画報
今日 マチ子
  長編マンガがとてもよかった
.....

[X]
「粟津潔 デザインする言葉」 粟津潔
「Binary Hacks」 高林 哲,鵜飼 文敏,佐藤 祐介,浜地 慎一郎,首藤 一幸
「Make: Volume01」 オライリー・ジャパン
「セーラが町にやってきた」 清野 由実
「手紙屋」 喜多川 泰
「Linuxカーネル2.6解読室」 高橋 浩和,小田 逸郎,山幡 為佐久
「人蕩し術」 無能 唱元
「子育てハッピーアドバイス2」 明橋 大二, 太田 知子
「ラッセル幸福論」 B. Russell
「それでも人生にイエスと言う」 Viktor Emil Frankl
「子育てハッピーアドバイス」 明橋 大二, 太田 知子
「考具」 加藤 昌治
「北欧デザイン<3>」 渡部 千春
「北斎の謎を解く」 諏訪 春雄
「体感美術館」 平野 暁臣
「チベット永遠の書」 Theodore Illion
「リナックスの革命」 Pekka Himanen
「人月の神話」 Frederick Phillips,Jr. Brooks
「ヤバい経済学」 Steven D. Levitt, Stephen J. Dubner
「小布施ッション<2001-2002>」 セーラ・マリ カミングス
「アンパンマン伝説」 やなせ たかし
「夢をかなえるゾウ」 水野 敬也
「ゲーム開発者のためのAI入門」 David M. Bourg, Glenn Seemann
「北欧デザイン<2>」 渡部 千春
「北欧デザイン<1>」 渡部 千春
「ヒューマン2.0」 渡辺 千賀
「中国・ロシア同盟がアメリカを滅ぼす日」 北野 幸伯
「超ロング・セラー 絶滅寸前商品」 湯浅 豊彦
「The BUG(ザ・バグ)」 すずき ひろのぶ,かとう みつあき
「デザインのデザイン」 原 研哉
「マキアヴェッリ語録」 塩野 七生
「ハンバーガーを待つ3分間の値段」 斎藤 由多加
「星の旅人-スペイン「奥の細道」-」 黛 まどか
「食品の裏側」 安部 司
「On Lisp」 Paul Graham
「ぼくが医者をやめた理由 つづき」 永井 明
「あなたならどうする?」 Jack Nikolaschka
「セキュアプログラミング−失敗から学ぶ設計・実装・運用・管理」
      Mark G. Graff, Kenneth R. van Wyk
「「左利き」は天才?−利き手をめぐる脳と進化の謎
      David Wolman
「自分の中に毒を持て」 岡本 太郎
「アトピーの薬を減らす本」 田中 貴子
「岡本太郎「明日の神話」修復960日間の記録」 吉村 絵美留
「X51.ORG THE ODYSSEY」 佐藤 健寿
「アレルギーっ子の暮らし応援BOOK」 佐藤 のり子
「沖縄文化論」 岡本 太郎
「「伝説の社員」になれ!」 土井 英司
「コンピュータの構成と設計(上)」 Patterson & Hennessy
「カラスのジョンソン」 明川 哲也
「ドリルを売るには穴を売れ」 佐藤 義典
「頭がよくなる照明術」 結城 未来
「クロフォードのインタラクティブデザイン論」 Chris Crawford
「いじめの根を絶ち子どもを守るガイド」 Barbara Coloroso
「非常識のすすめ―逆発想の仏教論」 ひろさちや
「Linuxアドバンストネットワーク構築ガイド - HAサーバ構築編」
      デージーネット
「イノベーションの達人!」 Tom Kelly, Jonathan Littman
「クリエーター50人が語る創造の原点」 小原 啓渡
「欺術 - 史上最強のハッカーが明かす禁断の技法」 Kevin Mitnick
「楽しい気象観察図鑑」 武田 康男
「入門 Ajax」 高橋 登史朗
「リリカルな自画像」 岡本 太郎
「やぎの目ゴールデンベスト」 林 雄司
「初めてのPython 第2版」 Mark Lutz,David Ascher
「鼻兎」 小林 賢太郎
「なぜ、これがアートなの?」 Amelia Arenas
「芸術起業論」 村上 隆
「まほう色の瞳」 Enrique Barrios
「ラーメンズつくるひとデコ」 ラーメンズ
「R25 つきぬけた男たち」 R25編集部
「美の呪力」 岡本 太郎
「しろのあお」 上大岡 トメ
「ザ・ゴール」 Eliyahu M. Goldratt
「ハッカーと画家」 Paul Graham
「岡本太郎に乾杯」 岡本 敏子
「Fedore Core Expert」 Software Design
「誰も知らない男」 ブルース・バートン
「子どもが育つ魔法の言葉」 ドロシー・ロー・ノルト
「国家の罠」 佐藤 優
「夜回り先生」 水谷 修
「やぎの目絵日記」 林 雄司
「7つの習慣」 スティーブン・R. コヴィー
「まろ、ん?−大掴源氏物語」 小泉 吉宏
「ザ・サーチ グーグルが世界を変えた」 ジョン・バッテル
「ポストモダン・マーケティング」 スティーブン ブラウン
「機動戦士ガンダムさん」 大和田 秀樹
「小エロのひみつ - Webやぎの目研究発表」 林 雄司
「これ、誰がデザインしたの?」 渡部千春
「60分間・企業ダントツ化プロジェクト」 神田 昌典
「ガルシアへの手紙」 エルバート ハバード
「人生は素晴らしいものだ」 オグ・マンディーノ
「ザ・マインドマップ」 トニー・ブザン,バリー・ブザン
「ワインバーグのシステム思考法」 G.M.ワインバーグ
「渋谷ではたらく社長の告白」 藤田 晋
「渋井真帆の日経新聞読みこなし隊」 渋井 真帆
「コラム息切れ」 小野 法師丸
「早朝起業」 松山 真之介
「変な人が書いた驚くほどツイてる話」 斎藤 一人
「35歳から仕事で大切にしたいこと」 村井 勉
「金融広告を読め」 吉本 佳生
「発想する会社!」 トム・ケリー,ジョナサン・リットマン
「エハイク」 吉田 戦車
「人生の旋律」 神田 昌典
「仕事の思想」 田坂 広志
「CPUの創りかた」 渡波 郁
「非常識な成功法則」 神田 昌典
…これ以前は記録してません…

▼ 気に入ってる本

夢をかなえるゾウ 夢をかなえるゾウ
水野 敬也
  いままでで最高の「笑える」成功本
Linuxデバイスドライバ Linuxデバイスドライバ
Alessandro Rubini,
Jonathan Corbet
  ドライバ作らなくてもためになる
Firefoxの改造テクニック! Firefoxの改造テクニック!
大浦 淳
  いま栗日記拡張を考えてます
Apacheモジュール プログラミングガイド Apacheモジュール プログラミングガイド
小山 浩之
  Apacheの中身もわかるよ
図解 実戦マーケティング戦略 図解 実戦マーケティング戦略
佐藤 義典
  栗日記も戦略的に行こう!
やぎの目ゴールデンベスト やぎの目ゴールデンベスト
林 雄司
  よめも爆笑してました
アルケミスト アルケミスト
パウロ・コエーリョ
  ヘコみそうなとき読みます
X51.ORG THE ODYSSEY X51.ORG THE ODYSSEY
佐藤 健寿
  X51.ORGの集大成
チベット永遠の書 チベット永遠の書
Theodore Illion
  いろんな意味ですごい!!
影響力の武器 影響力の武器
ロバート・B・チャルディーニ
  思わず納得します