カテゴリー: 機械学習

Python, 機械学習, 数学, 統計学

協調フィルタリング cos(コサイン)類似度

    グループ分けを行い、各グループの類似度をベクトルの内積の公式を使って、cosθの値で類似度を判断する。   類似度が高い・・・似てるほど1に近づく、類似度100%で1 類似度が低い・・・似てないほど0に近づく、類似度0%で0     補足1. ベクトルの基本的なところ   補足2. ベクトルの内積の公式 a, bベクトルのなす角θ …

機械学習, 数学, 統計学

k近傍法 k-nearest neighbor algorithm, k-NN

  k近傍法 データのカテゴリが近いかどうかを距離でどれだけ属性が近いかを評価し分類。 レコメンドアルゴリズムの1つ。     評価項目が2つ(2次元、ユークリッド平面) 2つのデータが似ているかどうかを距離で評価する、 三平方の定理でデータの最短距離の直線、 2次元のユークリッド距離が出せます。 シンプルな直線。     ex) 評価項目が5つあ …