DM & ML By R
Data Mining。 Machine Learning。
从大量数据中提取隐藏于其中的规律,并用这些规律来预测或决策。
数据挖掘方法
- 分类 Classification
- 回歸 Regression
- 聚类 Clustering
- 关联
- 预测 Prediction
學習分類
- 有監督學習(with 標籤) Supervised
- 無監督學習 UnSupervised
- 半監督學習 Semi-Supervised
数据分类
定量数据(Quantitative Data)
定量:比如身高和体重。
定性数据(Qualitative Data)
- 定类数据
- 定序数据
- 定距数据
- 定比数据。
應用場景
- 垃圾郵件分類
- 標記Facebook照片
Input Knowledge
輸入知識:特征,標籤。
feature1 | feature2 | label | ||
---|---|---|---|---|
observation1 | "as" | 34 | yes | |
observation2 | "sdf" | 2 | no | |
observation3 | "dd" | 67 | yes |
評估函數
Estimate function 。