Ohun ti O Nilo lati Mo Nipa Isọjade Spam Bayesian

Ṣawari bi awọn alaye ṣe n ṣe iranlọwọ lati pa apo-iwọle rẹ mọ

Awọn filẹ ti Ayika Bayesian ṣe iṣiro awọn iṣeeṣe ti ifiranṣẹ kan jẹ àwúrúju ti o da lori awọn akoonu inu rẹ. Kii awọn ohun elo ti o rọrun ti o ni akoonu, Awọn ifọkanwe Spam ti ko eko lati inu àwúrúju ati lati lẹta ti o dara, eyi ti o mu ki o lagbara, ti o ṣe deedee ati iṣedede itọwo ti o dara julọ, eyiti o dara ju gbogbo wọn lọ, o nyika eyikeyi awọn abawọn eke.

Bawo ni O Ṣe Rii Imukuro Imeeli?

Ronu nipa bi o ti n wo ayọkẹlẹ . Wiwo ti o yara ni igba to. O mọ iru àwúrúju ti o dabi, ati pe o mọ ohun ti mail ti o dara.

Awọn iṣeeṣe ti àwúrúju ti o nwa bi mail ti o dara ni ayika ... odo.

Ayẹwo Awọn Ajọ-Aiyipada Awọn akoonu Maa ṣe Ṣatunkọ

Ṣe kii ṣe nla ti awọn aifọwọyi àwúrúju laifọwọyi ṣiṣẹ bi ti, ju?

Ifimaaki awọn awoṣe àwúrúju ti o da lori akoonu-ṣiṣe gbiyanju o kan. Wọn n wa awọn ọrọ ati awọn abuda miiran ti aṣoju. Gbogbo ẹda ti o niye ni a ti yan aami-aaya, ati ami idaniloju fun gbogbo ifiranṣẹ ni a ti ṣe ipinnu lati awọn nọmba kọọkan. Diẹ ninu awọn oluṣọ afẹyinti tun wa fun awọn abuda ti aṣiṣe ti o tọ, fifa igbẹhin ipari ifiranṣẹ kan.

Awọn iyọọda afẹfẹ idanṣe n ṣiṣẹ, ṣugbọn o tun ni ọpọlọpọ awọn drawbacks:

Awọn Ayẹwo Spam Bayesian Tweak ara wọn, Nmu Dara ati Dara

Awọn ohun elo Ayẹwo Bayesian jẹ iru awọn ohun elo ti o da lori akoonu, ju. Ọna wọn wa pẹlu awọn iṣoro ti awọn iyọda afẹfẹ ayọkẹlẹ ti o rọrun, tilẹ, ati pe o ṣe apẹrẹ. Niwon ailera ti awọn iyipada afẹfẹ jẹ ninu akojọpọ ti a ṣe pẹlu ọwọ ati awọn nọmba wọn, a ti pa akojọ yi kuro.

Dipo, awọn oju-iwe afẹfẹ Bayesian ṣe akojọ ara wọn. Bibẹrẹ, o bẹrẹ pẹlu ajọpọ apamọ ti o ti ṣalaye bi àwúrúju, ati ẹgbẹpọ lẹta ti o dara. Awọn awoṣe wo awọn mejeeji ati ṣe itupalẹ awọn iwe imuduro ti o ni ẹtọ bi daradara bi àwúrúju lati ṣe iṣiro awọn iṣeeṣe ti awọn ẹya ara ẹrọ ti o han ni àwúrúju, ati ninu lẹta ti o dara.

Bawo ni Ayẹwo Spam Bayesian Ṣayẹwo Imeli kan

Awọn abuda kan ti Isọmọ Baysian spam le wo ni o le jẹ:

Ti o ba jẹ ọrọ kan, "Cartesian" fun apẹẹrẹ, ko han ni àwúrúju ṣugbọn nigbagbogbo ninu apamọ ti o yẹ ni imeeli ti o gba, iṣeeṣe pe "Cartesian" tọka si burausa ti o sunmọ odo. "Toner", ni apa keji, farahan, ati nigbagbogbo, ni ẹtan. "Toner" ni ipo giga to ga julọ ti a ri ni àwúrúju, kii ṣe pupọ ni isalẹ 1 (100%).

Nigbati ifiranšẹ titun ba de, a ṣe itupalẹ rẹ nipasẹ idanimọ àwúrúju Bayesian, ati awọn iṣeeṣe ti ifiranšẹ pipe ni iṣiro ti wa ni iṣiro nipa lilo awọn ẹya ara ẹni kọọkan.

Ṣe akiyesi ifiranṣẹ kan ni awọn mejeeji "Cartesian" ati "toner". Lati awọn ọrọ wọnyi nikan o ko sibẹsibẹ ko o boya a ni asiri tabi legit mail. Awọn abuda miiran yoo (ireti ati julọ jasi) fihan ami-iṣe kan ti o funni laaye àlẹmọ lati ṣe iyatọ ifiranṣẹ naa gẹgẹbi buluwomii tabi mail to dara.

Awọn Aṣoju Spam Bayesian le Mọ Ni aifọwọyi

Nisisiyi pe a ni ipinnu, ifiranṣẹ naa le ṣee lo lati ṣe akoso idanimọ ara siwaju. Ni idi eyi, boya awọn iṣeeṣe ti "Cartesian" ti o nfihan mail ti o dara ti wa ni isalẹ (ti o ba jẹ pe ifiranṣẹ ti o ni awọn "Cartesian" ati "toner" wa ni àwúrúju), tabi iṣeeṣe ti "toner" ti o nfihan àwúrúju gbọdọ wa ni atunyẹwo.

Lilo ilana imudarasi ara-ẹni, awọn iyọ ti Bayesian le kọ ẹkọ lati ara wọn ati awọn ipinnu aṣiṣe (ti o ba ṣe atunṣe pẹlu aṣeyọri nipasẹ awọn atunṣe). Awọn iyipada ti sisẹ Bayesian tun rii daju pe wọn jẹ julọ munadoko fun awọn olumulo imeeli kọọkan. Lakoko ti ọpọlọpọ awọn àwúrúju eniyan le ni awọn iru iṣe bẹẹ, aṣiṣe ti o tọ ni o yatọ si ti o yatọ si fun gbogbo eniyan.

Bawo ni Awọn Spammers Ṣe Ṣe Awọn Ajọ Bayesian Ti O Wá?

Awọn abuda ti mail ti o ni ẹtọ jẹ bi o ṣe pataki fun ilana sisẹ-aisan ti Bayesian gẹgẹbi awọn àwúrúju jẹ. Ti a ba ti ṣe atunṣe awọn oluṣakoso fun gbogbo olumulo, awọn olutẹpa yoo ni akoko ti o nira pupọ lati ṣawari gbogbo awọn folda (tabi paapa julọ) eniyan, ati awọn awoṣe le ṣatunṣe si fereti ohun gbogbo awọn olutọpa gbiyanju.

Awọn Spammers yoo ṣe pe o ti kọja awọn ifọmọ Bayesian ti o dara daradara ti wọn ba ṣe awọn ifiranṣẹ imiriri wọn wo daradara bi arinrin imeeli ti gbogbo eniyan le gba.

Awọn Spammers ko maa n ranṣẹ apamọ ti awọn apamọ. Jẹ ki a ro pe eyi jẹ nitori awọn apamọ wọnyi ko ṣiṣẹ bi imeeli apamọ. Nitorina, awọn ayidayida ni wọn kii yoo ṣe nigba ti awọn arinrin, awọn apamọ ti ko dara ni ọna kan lati ṣe awọn ohun elo afẹfẹ ti o kọja.

Ti awọn spammers ṣe ayipada si okeere apamọwọ-arinwo, sibẹsibẹ, a yoo ri ọpọlọpọ awọn àwúrúju ninu Awọn apo-iwọle lẹẹkansi, ati imeeli le di idiwọ bi o ṣe wa ni ọjọ ọjọ Pre-Bayesia (tabi paapaa buru). O tun yoo ti dabaru ọja naa fun ọpọlọpọ awọn ami-àwúrúju, tilẹ, ati bayi yoo ko ṣiṣe ni pipẹ.

Awọn Ifi agbara le jẹ Aṣayan Spam Bayesian & # 39; s Achilles & # 39; Igigirisẹ

Ẹyọ kan ni a le fiyesi fun awọn spammers lati ṣiṣẹ ni ọna nipasẹ awọn iyọ ti Bayesian paapaa pẹlu akoonu wọn. O jẹ ninu iru awọn statistiki Bayesian pe ọrọ kan tabi ti iwa ti o han nigbagbogbo ni mail to dara le jẹ ki o ṣe pataki bi lati ṣe ifiranšẹ eyikeyi silẹ lati wo bi àwúrúju lati ṣe àtúnyẹwò bi apata nipasẹ àlẹmọ.

Ti awọn spammers ba wa ọna kan lati mọ awọn ọrọ ti o dara-imeeli rẹ-nipa lilo awọn igbadọ pada HTML lati ri iru awọn ifiranṣẹ ti o ṣii, fun apẹẹrẹ-, wọn le fi ọkan ninu wọn sinu iwe apamọwọ ati ki o de ọdọ rẹ paapaa nipasẹ iwe- o ṣe ayẹwo idanimọ Bayesian.

John Graham-Cumming ti dán eyi wò nipa fifun awọn meji Bayesian se ayẹwo iṣẹ si ara wọn, "iwa buburu" ti o ni imọran si eyi ti awọn ifiranṣẹ wa lati ri nipasẹ idanimọ "ti o dara". O sọ pe o ṣiṣẹ, bi o ṣe jẹ pe ilana naa jẹ akoko ti o n gba ati idiyele. A ko ro pe a yoo ri ọpọlọpọ ti nkan yii, o kere ju kii ṣe lori iwọn-nla kan, ati pe ko ṣe deede si awọn iṣẹ-ṣiṣe ti awọn eniyan kọọkan. Awọn Spammers le (gbiyanju lati) ṣe afihan diẹ ninu awọn koko ọrọ fun awọn agbari (nkankan bi "Almaden" fun diẹ ninu awọn eniyan ni IBM boya?) Dipo.

Nigbakugba, àwúrúju yoo jẹ (significantly) yatọ si lati inu mail tabi o kii yoo jẹ àwúrúju, tilẹ.

Ofin Isalẹ: Isẹjade Bayesian & Ipaja 39; Ṣe Agbara Rẹ

Awọn apo-aitọ ayọkẹlẹ Bayesian jẹ awọn ohun elo ti o ni akoonu :