溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

對python sklearn one-hot編碼詳解

發布時間:2020-10-22 12:39:27 來源:腳本之家 閱讀:687 作者:HAHAHA- 欄目:開發技術

one-hot編碼的作用

使用one-hot編碼,將離散特征的取值擴展到了歐式空間,離散特征的某個取值就對應歐式空間的某個點

將離散特征通過one-hot編碼映射到歐式空間,是因為,在回歸,分類,聚類等機器學習算法中,特征之間距離的計算或相似度的計算是非常重要的,而我們常用的距離或相似度的計算都是在歐式空間的相似度計算,計算余弦相似性,基于的就是歐式空間。

sklearn的一個例子

from sklearn import preprocessing

enc = preprocessing.OneHotEncoder()

enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])
print(enc.n_values_)//每個特征對應的最大位數

print(enc.transform([[0,1,3]]).toarray())

print(enc.transform([[0,1,1]]).toarray())

上面代碼enc.fit()里有一個4行3列的矩陣

1、每一列對應于一個樣本的特征序列,即一個樣本有三個特征

2、4行表明傳入了4個樣本

3、觀察每一列的值可以知道:第一個特征有兩個取值0,1;第二個特征有三個取值0,1,2;第三個特征有4個取值0,1,2,3

4、所以第一個特征的one-hot編碼是一個兩位的01串,第二個特征是一個三位的01串,第三個特征是一個4位的01串

以上這篇對python sklearn one-hot編碼詳解就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持億速云。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女