ユーザーのためのSpamAssassin解説

まえがき

最近spam(迷惑メール)が増えてきたのでプロバイダや会社はspamを減らすような対策をしています。

ここではそのソフトの1つとして有名なSpamAssassin(スパムアサシン)というソフトがあなたの加入しているプロバイダや会社・学校等のサーバーに導入されたときどうなるかを解説します。

技術的なことには興味がない方は青い太字のところだけ読んでください。

SpamAssassinの動作

SpamAssassinはメールサーバーでひっそりと動作しているソフトです。あなたのパソコンに入れて使うソフトではありません。普通のメールであればそれを意識することなく今まで通り使うことができます。
 ※メールサーバとは、あなたがメールをやり取りする為に使うプロバイダや会社・学校にあるコンピューターです。


SpamAssassinは受け取るメール送るメールについてすべてを調べそれがspamであるかないかを判断します。

判断するポイントは
1)過去にspamを送られたことがあるIPアドレスを経由している
2)本文中にspamで宣伝していたことがあるURLがある
3)援助交際とかSEXとかAdult VideoなどといったNGワードがある
4)ベイズ理論という統計的手法でspamと普通の文章の構造を解析比較
5)1971年とか2020年とかいったありえない日付で送られたかどうか
6)spamを送る者(以下spammerと略す)が常用している大量メール送信ソフトの痕跡
7)spammerが多数いると思われる怪しいIPアドレスから送られているかどうか
8)メールの形式が標準的でないものかどうか

その他spamと判定できそうな非常に多岐な項目にわたって内容を調べます。調べる項目は恐らく数百あると思われます。

それぞれは項目ごとに点数で管理され合計点がある一定の値(標準的には5.2点)を超えるとspamと判定されメールの本文にそのことが(通常は)英語で付加されて自分に届きます。

そのほか管理者によってはhtmlだけしかないメールの点を高くするといったローカルルールを設定していることがあります。

spamでないというマイナスの点数定義もあるので減算もされます。

そして合計が5.2点以下では普通のメールとして届きます。ヘッダに特殊な項目が追加されますがOutlook Expressなどのメールソフトで普通に見ている分には人の目には触れません。

5.2点を超えた時点でそのメールはspamと判定されます。spamと判定されたメールは特殊な形式で届きます。この場合も同じくヘッダに特殊な記述が付加されます。

以下が実例です。

1. spamでないと判定されたメール
今迄と全く変わりなく読むことができます。
メールの本文は何も変わりませんがヘッダにいくつかの項目が付加されます。メールソフトで「詳細なヘッダを見る」と設定していない限り目に触れることはありません。

これが実際にヘッダに付加された例です。

X-Spam-Status: No, score=0.1 required=5.2 tests=DNS_FROM_RFC_ABUSE,
        LOCAL_doller,LOCAL_doller3,LOCAL_ms,LOCAL_nejpmail
autolearn=disabled
        version=3.1.0
X-Spam-Checker-Version: SpamAssassin 3.1.0 (2005-09-13) on XX.XXX_XXX.co.jp
ここでscore=0.1 という点に着目してください。これが5.2より小さいのでspamとは判定されていないことになります。

2. spamと判定されたメール
メールは自分に届きますが一部内容が追加されています。本文の先頭に 「Spam detection software, running on the system "XXX.XXX_XX.co.jp"」というような文章があったらそのメールはspamと判定されていることを意味します。

spamと判定されたメールでは、本文の最後に実際に送信された文章が付加されています。その文章を見ればspamだということがわかるでしょう。


ヘッダは以下のようになっています。score=21.2なのでspamと判定されています。X-Spam-Flag: YESが付加されるので振り分けに便利になっています。(ヘッダを含む全文はこちらです、読みやすく文字コードは変換してあります)

(以下はメールのヘッダのうちSpamAssassinが追加したものです)

X-Spam-Flag: YES
X-Spam-Status: Yes, score=21.2 required=5.2 tests=FORGED_RCVD_HELO,
        LOCAL_chiharu01,LOCAL_chiharu03,LOCAL_chiharu12,LOCAL_chiharu25,
        LOCAL_chiharu26,LOCAL_esc_http,LOCAL_http,NO_REAL_NAME,
        RAZOR2_CF_RANGE_51_100,RAZOR2_CHECK,STAR,SUBJ_ILLEGAL_CHARS,
        URIBL_AB_SURBL,URIBL_JP_SURBL,URIBL_SBL,URIBL_SC_SURBL,URLBL_RBLJP
        autolearn=disabled version=3.0.4
X-Spam-Level: *********************
X-Spam-Checker-Version: SpamAssassin 3.0.4 (2005-06-05) on XXX.XXX_XX.co.jp
さらには本文には英語での簡単な説明と本文が少しだけ表示され、そのあとに何が根拠となってspamと判定されたかの点数の説明があります。

たとえば、
0.6 NO_REAL_NAME From: does not include a real name
を例にとるとNO_REAL_NAMEすなわちFrom: がメールアドレスのみで名前が無いという点で0.6点加算されています。「From: <info@ebi5.com> 山田太郎」ではなく「From: info@ebi5.com」とだけになっているからです。
(以下はメール本文ですーー長いので途中略)
以下のように4つのセクションに分かれています。
1) 英語で 「これはspamですよ」という説明
2) 本文の先頭数行
3) 点数配分
4) 本当の本文

Spam detection software, running on the system "XXX.XXX_XX.co.jp", has
identified this incoming email as possible spam.  The original message
has been attached to this so you can view it (if it isn't spam) or label
similar future email.  If you have any questions, see
the administrator of that system for details.

Content preview:  勝手にメール送ってしまいまして申し訳有りませんが
  、期間人数限
  定の企画を貴方に紹介したいので、ご理解を頂きたく思います。
  当サイトは真剣な出会空間を運営しおかげさまで好評を得ておりま
  す。ハートもボディーもオープン的な女性を広告誌等の募集をかけ、
  約1000名の女性会員が集まりましたので、男性会員不足の為、
  貴方を含めて800名の特選男性に特別企画を紹介致します。 [...]

Content analysis details:   (21.2 points, 5.2 required)

 pts rule name              description
---- ------------------------------------------------------------------------
 0.6 NO_REAL_NAME           From: does not include a real name
 0.3 STAR                   *
 0.5 FORGED_RCVD_HELO       Received: contains a forged HELO
 0.2 SUBJ_ILLEGAL_CHARS     Subject contains too many raw illegal characters
 2.5 RAZOR2_CF_RANGE_51_100 BODY: Razor2 gives confidence level above 50%
                            [cf: 100]
 0.1 RAZOR2_CHECK           Listed in Razor2 (http://razor.sf.net/)
 1.5 URIBL_JP_SURBL         Contains an URL listed in the JP SURBL blocklist
                            [URIs: livedear1.com]
 4.0 URLBL_RBLJP            Has URI in url.rbl.jp
                            [URIs: livedear1.com]
                            
                            
------------=_42F22F17.4691A7B6
Date: 4 Aug 2005 23:54:34 +0900
Message-ID: <20050804145434.19037.qmail@mail.ebi5.com>
From: info@ebi5.com
To: XX@XXX_XX.co.jp
Subject: 確認お願いします。(藤田より)

当サイトは真剣な出会空間を運営しおかげさまで好評を得ておりま
す。ハートもボディーもオープン的な女性を広告誌等の募集をかけ、
約1000名の女性会員が集まりましたので、男性会員不足の為、
貴方を含めて800名の特選男性に特別企画を紹介致します。

<企画詳細> http://www.livedear1.com?num=1151

3. まじめなメールなのにspamであると間違って判定されたメール

SpamAssassinというspam判定ソフトはまじめなメールであってもそれをspamと判定してしまうことがあります。

たとえばあなたがメールに「女性会員」とか「援助交際」のようなspamでよく使われている言葉を沢山入れたり、spamで宣伝しているホームページのURLを示して「昨日ねhttp://www.livedear1.com というような迷惑メールが来たんですけどね」なんて書いた場合です。

このような場合には次回からspamと判定されそうな言葉を多数使わないようにすれば問題ありません。

メールをきれいに見せるために色をつけたり文字飾りをつけたりする(HTMLメールと言います)と特にspamと判定される確率が高くなります。このようなことを防ぐためにもメールはテキスト形式で送るようにしましょう。
 ※テキスト形式でメールを送信する為の設定方法に関しては、お使いのメールソフトのマニュアルをご確認ください。

spamと思われるメールを貼付けて送っても判定されてしまうことがあります。

文章が一切無く画像だけ送ってもspamと判定されてしまうことがあります。

しかしながらspamと判定されてしまっても本文の終わりの方を見れば文章を読むことができます。次からは上で説明したことに気をつけて文章を書きましょう。

spamの情報交換をするためにきたない単語やspamで使っているURLを送りたいような場合には、spamと判定されたメールをあなたのサーバーの管理人に連絡してあなたや友人のメールアドレスからくるメールは絶対にspamではないという設定をしてもらってください。


その場合本文の中程にある以下の情報が役に立ちますのでそれを示すようにしてください。点が高い項目ほどspamと判定される率が高いものです。たとえば以下の例ですと 4.0 URLBL_RBLJP というように4点付けられたことが一番影響があります。
点数配分

pts rule name              description
---- ------------------------------------------------------------------------
 0.6 NO_REAL_NAME           From: does not include a real name
 0.3 STAR                   *
 0.5 FORGED_RCVD_HELO       Received: contains a forged HELO
 0.2 SUBJ_ILLEGAL_CHARS     Subject contains too many raw illegal characters
 2.5 RAZOR2_CF_RANGE_51_100 BODY: Razor2 gives confidence level above 50%
                            [cf: 100]
 0.1 RAZOR2_CHECK           Listed in Razor2 (http://razor.sf.net/)
 1.5 URIBL_JP_SURBL         Contains an URL listed in the JP SURBL blocklist
                            [URIs: livedear1.com]
 4.0 URLBL_RBLJP            Has URI in url.rbl.jp
                            [URIs: livedear1.com]

サーバー管理者の方へ:
本文をあなたが管理するサーバーの状況に応じて修正し独自の文章を使って改変し、あなたのサーバーに掲載してもかまいません。利用したという連絡も不要です。
改訂履歴:
2006-3-27 バージョン 0.9