Google Play badge

ангилал


Ангилалыг ойлгох нь: Цогц гарын авлага

Ангилал нь хяналттай машин сургалтын нэг төрөл бөгөөд зорилго нь өнгөрсөн ажиглалт дээр үндэслэн шинэ ажиглалтын ангиллын шошгыг урьдчилан таамаглах явдал юм. Энэ нь оролтын өгөгдлийг хоёр буюу түүнээс дээш ангилалд ангилах, ангилах явдал юм.

1. Ангиллын үндэс

Ангилал нь үндсэндээ ангиллын гишүүнчлэл нь мэдэгдэж байгаа ажиглалтыг агуулсан сургалтын мэдээллийн багцад тулгуурлан шинэ ажиглалт ямар ангилал, ангилалд хамаарахыг тодорхойлох зорилготой. Жишээлбэл, имэйлийг "спам" эсвэл "спам биш" гэж ангилах нь хоёртын ангиллын ажил юм.

2. Ангиллын асуудлын төрлүүд

Үндсэндээ хоёр төрлийн ангиллын асуудал байдаг:

3. Ангилах нийтлэг алгоритмууд

Ангилах ажилд хэд хэдэн алгоритмыг ихэвчлэн ашигладаг, үүнд:

4. Ангиллын загваруудыг үнэлэх

Ангиллын загваруудын үнэлгээ нь тэдгээрийн гүйцэтгэлийг ойлгоход маш чухал юм. Нийтлэг хэмжүүрүүд нь:

5. Практик жишээ: Имэйлийн ангилал

Имэйлийг "спам" эсвэл "спам биш" гэж ангилах зорилготой хоёртын ангиллын хялбаршуулсан жишээг авч үзье. Бид шошготой имэйлүүдийг агуулсан датасет ашигладаг. Энгийн алгоритм нь спам имэйлтэй холбоотой тодорхой түлхүүр үгсийг хайх явдал байж болно. Хэрэв имэйлд "санал", "үнэгүй" эсвэл "ялагч" гэх мэт үгс орсон бол спам гэж ангилагдана.

6. Ангилалд тулгарч буй бэрхшээлүүд

Ангилал нь хүчирхэг хэдий ч хэд хэдэн сорилттой тулгардаг, тухайлбал:

7. Дүгнэлт

Ангилал нь цахим шуудангийн шүүлтүүрээс авахуулаад эмнэлгийн оношлогоо хүртэлх өргөн хүрээний хэрэглээнд хэрэг болох машин сургалтын чухал бүрэлдэхүүн хэсэг юм. Ангиллын үндэс, түүнд тулгарч буй бэрхшээл, загварыг хэрхэн үнэлэх талаар ойлгох нь өгөгдөлд суурилсан олон төрлийн шийдлүүдийг хүчирхэгжүүлж чадна.

Download Primer to continue