Google Play badge

分類


分類を理解する: 総合ガイド

分類は教師あり機械学習の一種で、過去の観察に基づいて新しい観察のカテゴリクラスラベルを予測することを目的とします。入力データを 2 つ以上のクラスに分類または分類します。

1. 分類の基礎

本質的に、分類の目的は、カテゴリのメンバーシップがわかっている観測値を含むデータのトレーニング セットに基づいて、新しい観測値がどのカテゴリまたはクラスに属するかを識別することです。たとえば、電子メールを「スパム」または「スパムではない」に分類することは、バイナリ分類タスクです。

2. 分類問題の種類

分類問題には主に 2 つの種類があります。

3. 分類のための一般的なアルゴリズム

分類タスクでは、次のようないくつかのアルゴリズムが一般的に使用されます。

4. 分類モデルの評価

分類モデルの評価は、そのパフォーマンスを理解する上で非常に重要です。一般的な指標には次のようなものがあります。

5. 実例: 電子メールの分類

電子メールを「スパム」または「スパムではない」に分類することを目的とした、バイナリ分類の簡単な例を考えてみましょう。ラベル付きの電子メールを含むデータセットを使用します。単純なアルゴリズムとしては、スパム電子メールに関連付けられた特定のキーワードを探すことが考えられます。電子メールに「オファー」、「無料」、「当選者」などの単語が含まれている場合、スパムとして分類される可能性があります。

6. 分類における課題

分類は強力ですが、次のようないくつかの課題にも直面しています。

7. 結論

分類は機械学習の重要な要素であり、電子メールのフィルタリングから医療診断まで、幅広い用途で役立ちます。分類の基礎、その課題、モデルの評価方法を理解することで、さまざまなデータ駆動型ソリューションを強化できます。

Download Primer to continue