アカウント名:
パスワード:
spamassassinのようなフィルタプログラムでスパムにマークして、それのマークをprocmailで振り分ければいいだけでは?たまに誤判定もするけど、それは学習させればいいし。定期的に自動学習するようにcronでも設定しておけば、誤判定したメールをspamフォルダに移すだけでよいし。
まず、自分でスパムのどの部分のパターンを取り出してprocmailのレシピにするのかが手間だし、そのパターンもランダムに変わらないところを選ばないと行けないし、あまり一般化すると必要なメールも引っかかるしで、面倒ばかりでいいことあるとは思えないけど。それから、procmailのレシピが肥大化して15秒とか、いったい何件ルールを書いているのだか。ちょっと古めのCPUでも、1000件の処理なんて一瞬でしょう?
自分でルールを厳密に決めて、完璧にスパムをはじきたいなら、もうルールをひたすら書き続ければいいと思う。
たまにある誤判定が業務用には厳しい。
たまに迷惑メールフォルダをチェックする必要はあるだろうね。どんな方法でも誤検出をゼロにすることはできない。従って、どんな方法であろうと、たまには迷惑メールフォルダをチェックする必要はある。例外は、本人チェックのみ。すべて本人チェックする業務負荷と、たまに迷惑メールフォルダをチェックする業務負荷のどちらが大きいかを勘案して決めなよ。
正直、誤判定はゼロ、とは断言できません。SA標準の状態では、日本語メイルに対しては結構誤判定が多いです。自前でuser_prefsを11年ほどメンテしてますが、誤判定ゼロか、と言われるとちょっと自信がない。7〜8年位前に一回だけ、spamディレクトリにhamが紛れ込んだことがあります。それ以来、かなり安全方向にルールを作っています。
私は通称「TLEC の user_prefs」 [spamassassin.jp]を利用しています。あとは、誤判定されないように、普段メールをやりとりする相手はホワイトリストを追加する感じで、だいたい問題ないですね。
あとは、入り口でS25R+tarpitting [srad.jp]を実施。SMTP接続がかかったときに、接続元のIPアドレスを見て「動的IPアドレスっぽい逆引き名のホスト」「逆引き出来ないホスト」からの接続の時は65秒待つ、というだけの処理なんですが、それだけで面白いようにメール受信数が減ります。
なるほど、"S25R+tarpitting" というのはシンプルだけど、強力そうですね。
逆に強力だから、みんながこの方法を使ったら、spammerが音を上げるか、対抗してくるか。抗生物質抵抗性菌みたいなもので。
ああ、まだ拙作user_prefs使って下さってる方がいらっしゃる。ありがとうございます。m(__)m最近更新が滞り気味ですいません。半ばライフワーク化してますが、メイルがなくなるか、spamがなくなるか、SAがなくなるか、自分がキーボード叩けなくなるまで更新し続ける所存です。
ここにも使ってる奴がいますよん
m(__)mm(__)mm(__)m
SA標準の状態では、日本語メイルに対しては結構誤判定が多いです。
これ、よく聞くんだけど、個人的な実感とは合わないんだよなぁ。うちの場合は、ほぼ確実に的確に判定してくれる。
spam/hamがきわどい領域で生活しているユーザーが多いのだろうか。
まずは、あんたのいう「業務用」を定義しろ。話はそれからだ。
どっちかって言うと、「たまに」の定義をまず知りたい。仕事用だろうが私用だろうが、誤判定が致命的なミスにつながる可能性はある。
誤判定をスパムフォルダに移動させる手間と、すり抜けてきたスパムの内容から、ランダムに変わりそうになく特徴的な部分を分析してprocmailのレシピに書き込むのと、どちらが手間でしょうか?大人数を抱える業務システムを運用したことがないので、ストーリーの方法と比較してどれくらい厳し野かがちょっと見当つきません。
私は、SpamAssassinを使い始める前は、procmailで頑張っていた時期がありました。はっきり言って、破綻します。procmailのレシピは書きにくく、記述できる内容も貧弱で、お話になりません。procmailでレシピをゴリゴリ書く位なら、SAのルールをいじる方が遥かに楽です。
spamフィルタの精度にもよりますが、一般的に、誤判定はfalse negativeの方が処理は楽です。false positiveが面倒。
この人間様は誤判定をすることなどないという妄信はいったいどこから来るのだろうか。飛行機だってオートパイロットは信用できないから最初から最後まで人間が張り付いて操作すべきだよね。
ん?飛行機(少なくともジェット推進およびターボプロップ推進旅客機)は四六時中人間張り付き操作になってるだろ?
それって事故率を下げるため?単に人間の方が安いからじゃないの?
いまどきオートパイロットがないジェット機なんて飛んでるの?
普通オートパイロットのついたジェット機には常に人間が張り付いて飛行しているわけですが。
えーっと…「四六時中人間張り付き操作になってるだろ?」に対する反論が「それって事故率を下げるため?単に人間の方が安いからじゃないの?」でその反論が「いまどきオートパイロットがないジェット機なんて飛んでるの?」でその反論が「普通オートパイロットのついたジェット機には常に人間が張り付いて飛行しているわけですが。」…?
「の方が安い」ってどういう意味の主張だったんですかね?
内容によるけど業務用には厳しいね。納期変更とかフィルタリングされたら泣くに泣けない。「フィルタリングされてました」なんて言ったら信用がた落ちだし。
自分で設定したprocmailのレシピでも同じ事が起こる可能性もあるよね?ホワイトリスト作っておけばいいのか?
どう判定するか予測できるか出来ないかの違いかな。
自分で設定してても予想外の誤爆があるからなあ。
それはわかるけどね。
spamassassinつかっていますが、各種SPAM発信源IPv4アドレスを掲載しているDNSへの照会がけっこう時間がかかりますね。うちは30秒くらいかかっています。並列化してもこの部分は高速化できません。
ほかに有用な方法としては、http://www.spamarrest.com/ [spamarrest.com]なんかがあるとおもいます。メールの送信者はメールをおくった後、自動返信メールでこのサイトに誘導され、CAPTCHAをしなければならず、通るとメールが本来の宛先に届くというものです。送信者に手間をかけさせるのがよいのかどうかは議論のわかれるところでしょうが...
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
最初のバージョンは常に打ち捨てられる。
spamassassinでいいのでは? (スコア:0)
spamassassinのようなフィルタプログラムでスパムにマークして、それのマークをprocmailで振り分ければいいだけでは?
たまに誤判定もするけど、それは学習させればいいし。定期的に自動学習するようにcronでも設定しておけば、誤判定したメールをspamフォルダに移すだけでよいし。
まず、自分でスパムのどの部分のパターンを取り出してprocmailのレシピにするのかが手間だし、そのパターンもランダムに変わらないところを選ばないと行けないし、あまり一般化すると必要なメールも引っかかるしで、面倒ばかりでいいことあるとは思えないけど。それから、procmailのレシピが肥大化して15秒とか、いったい何件ルールを書いているのだか。ちょっと古めのCPUでも、1000件の処理なんて一瞬でしょう?
自分でルールを厳密に決めて、完璧にスパムをはじきたいなら、もうルールをひたすら書き続ければいいと思う。
Re: (スコア:0)
たまにある誤判定が業務用には厳しい。
Re:spamassassinでいいのでは? (スコア:1)
たまに迷惑メールフォルダをチェックする必要はあるだろうね。
どんな方法でも誤検出をゼロにすることはできない。従って、どんな方法であろうと、たまには迷惑メールフォルダをチェックする必要はある。例外は、本人チェックのみ。
すべて本人チェックする業務負荷と、たまに迷惑メールフォルダをチェックする業務負荷のどちらが大きいかを勘案して決めなよ。
Re:spamassassinでいいのでは? (スコア:1)
正直、誤判定はゼロ、とは断言できません。
SA標準の状態では、日本語メイルに対しては結構誤判定が多いです。
自前でuser_prefsを11年ほどメンテしてますが、誤判定ゼロか、と言われるとちょっと自信がない。
7〜8年位前に一回だけ、spamディレクトリにhamが紛れ込んだことがあります。
それ以来、かなり安全方向にルールを作っています。
Re:spamassassinでいいのでは? (スコア:2)
Re:spamassassinでいいのでは? (スコア:1)
私は通称「TLEC の user_prefs」 [spamassassin.jp]を利用しています。あとは、誤判定されないように、普段メールをやりとりする相手はホワイトリストを追加する感じで、だいたい問題ないですね。
あとは、入り口でS25R+tarpitting [srad.jp]を実施。
SMTP接続がかかったときに、接続元のIPアドレスを見て「動的IPアドレスっぽい逆引き名のホスト」「逆引き出来ないホスト」からの接続の時は65秒待つ、というだけの処理なんですが、それだけで面白いようにメール受信数が減ります。
Re:spamassassinでいいのでは? (スコア:1)
なるほど、"S25R+tarpitting" というのはシンプルだけど、強力そうですね。
逆に強力だから、みんながこの方法を使ったら、spammerが音を上げるか、対抗してくるか。抗生物質抵抗性菌みたいなもので。
Re:spamassassinでいいのでは? (スコア:1)
ああ、まだ拙作user_prefs使って下さってる方がいらっしゃる。
ありがとうございます。m(__)m
最近更新が滞り気味ですいません。
半ばライフワーク化してますが、メイルがなくなるか、spamがなくなるか、SAがなくなるか、自分がキーボード叩けなくなるまで更新し続ける所存です。
Re: (スコア:0)
ここにも使ってる奴がいますよん
Re:spamassassinでいいのでは? (スコア:1)
m(__)mm(__)mm(__)m
Re: (スコア:0)
これ、よく聞くんだけど、個人的な実感とは合わないんだよなぁ。
うちの場合は、ほぼ確実に的確に判定してくれる。
spam/hamがきわどい領域で生活しているユーザーが多いのだろうか。
Re:spamassassinでいいのでは? (スコア:1)
まずは、あんたのいう「業務用」を定義しろ。
話はそれからだ。
Re: (スコア:0)
どっちかって言うと、「たまに」の定義をまず知りたい。
仕事用だろうが私用だろうが、誤判定が致命的なミスにつながる可能性はある。
Re: (スコア:0)
誤判定をスパムフォルダに移動させる手間と、すり抜けてきたスパムの内容から、ランダムに変わりそうになく特徴的な部分を分析してprocmailのレシピに書き込むのと、どちらが手間でしょうか?
大人数を抱える業務システムを運用したことがないので、ストーリーの方法と比較してどれくらい厳し野かがちょっと見当つきません。
Re:spamassassinでいいのでは? (スコア:1)
私は、SpamAssassinを使い始める前は、procmailで頑張っていた時期がありました。
はっきり言って、破綻します。
procmailのレシピは書きにくく、記述できる内容も貧弱で、お話になりません。
procmailでレシピをゴリゴリ書く位なら、SAのルールをいじる方が遥かに楽です。
spamフィルタの精度にもよりますが、一般的に、誤判定はfalse negativeの方が処理は楽です。
false positiveが面倒。
Re: (スコア:0)
この人間様は誤判定をすることなどないという妄信はいったいどこから来るのだろうか。
飛行機だってオートパイロットは信用できないから最初から最後まで人間が張り付いて操作すべきだよね。
Re: (スコア:0)
ん?飛行機(少なくともジェット推進およびターボプロップ推進旅客機)は四六時中人間張り付き操作になってるだろ?
Re: (スコア:0)
それって事故率を下げるため?
単に人間の方が安いからじゃないの?
Re: (スコア:0)
いまどきオートパイロットがないジェット機なんて飛んでるの?
Re: (スコア:0)
普通オートパイロットのついたジェット機には常に人間が張り付いて飛行しているわけですが。
Re: (スコア:0)
えーっと…
「四六時中人間張り付き操作になってるだろ?」に対する反論が
「それって事故率を下げるため?単に人間の方が安いからじゃないの?」でその反論が
「いまどきオートパイロットがないジェット機なんて飛んでるの?」でその反論が
「普通オートパイロットのついたジェット機には常に人間が張り付いて飛行しているわけですが。」…?
「の方が安い」ってどういう意味の主張だったんですかね?
Re: (スコア:0)
内容によるけど業務用には厳しいね。納期変更とかフィルタリングされたら泣くに泣けない。
「フィルタリングされてました」なんて言ったら信用がた落ちだし。
Re: (スコア:0)
自分で設定したprocmailのレシピでも同じ事が起こる可能性もあるよね?
ホワイトリスト作っておけばいいのか?
Re: (スコア:0)
どう判定するか予測できるか出来ないかの違いかな。
Re: (スコア:0)
自分で設定してても予想外の誤爆があるからなあ。
Re: (スコア:0)
それはわかるけどね。
Re: (スコア:0)
spamassassinつかっていますが、各種SPAM発信源IPv4アドレスを掲載しているDNSへの照会がけっこう時間がかかりますね。
うちは30秒くらいかかっています。
並列化してもこの部分は高速化できません。
ほかに有用な方法としては、http://www.spamarrest.com/ [spamarrest.com]なんかがあるとおもいます。
メールの送信者はメールをおくった後、自動返信メールでこのサイトに誘導され、CAPTCHAをしなければならず、通るとメールが本来の宛先に届くというものです。
送信者に手間をかけさせるのがよいのかどうかは議論のわかれるところでしょうが...