掲示板spam対抗ルーチン
2003年9月26日(金曜日)
掲示板spam対抗ルーチン
というわけで spam対抗ルーチンに着手。あらかじめ NG ワード、NG 条件をリストアップしておいて、それにどれだけマッチしたかで判別することにしました。
最大のポイントは単語の選択と重み付け。単純に、
- 既存の広告書き込み、および手元の spam メールを読んで単語を抽出。
- その単語が spam に特有のものか、それとも一般に使われるものかを考慮して重み付け。
という作業でリストを作成しました。こんな単純なものでも結構うまく判別してくれるのですが、やはり微妙なものもあって難しいですね。
- 「掲示板spam対抗ルーチン」へのコメント (2件)
関連する話題: spam / Web / 掲示板spam / hatomaru.dll
- 前(古い): 新規投稿時は URL が消える
- 次(新しい): DRAG-ON DRAGOON