1樓:匿名使用者
歐氏距離:(∑(xi-yi)2)1/2,即兩項間的差是每個變數值差的平方和再平方根,目的是計算其間的整體距離即不相似性。
我們熟悉的歐氏距離雖然很有用,但也有明顯的缺點。它將樣品的不同屬性(即各指標或各變數)之間的差別等同看待,這一點有時不能滿足實際要求。例如,在教育研究中,經常遇到對人的分析和判別,個體的不同屬性對於區分個體有著不同的重要性。
因此,有時需要採用不同的距離函式。
如果用dij表示第i個樣品和第j個樣品之間的距離,那麼對一切i,j和k,dij應該滿足如下四個條件:
①當且僅當i=j時,dij=0
②dij>0
③dij=dji(對稱性)
④dij≤dik+dkj(三角不等式)
顯然,歐氏距離滿足以上四個條件。滿足以上條件的函式有多種,本節將要用到的馬氏距離也是其中的一種。
第i個樣品與第j個樣品的馬氏距離dij用下式計算:
dij=(xi一xj)'s-1(xi一xj)
其中,xi和xj分別為第i個和第j個樣品的m個指標所組成的向量,s為樣本協方差矩陣。
馬氏距離有很多優點。它不受量綱的影響,兩點之間的馬氏距離與原始資料的測量單位無關;由標準化資料和中心化資料(即原始資料與均值之差)計算出的二點之間的馬氏距離相同。馬氏距離還可以排除變數之間的相關性的干擾。
它的缺點是誇大了變化微小的變數的作用。
採用巴氏距離特徵選擇的迭代演算法,可以獲得最小錯誤率上界。當特徵維數高時,為了減少巴氏距離特徵選擇計算時間,對樣本先進行k-l變換,將特徵降低到中間維數。然後進行巴氏距離特徵選擇,降低到結果的維數。
用基於mnist手寫體數字庫的試驗表明,該文方法比單純用巴氏距離特徵選擇計算時間大大減少,並比主分量方法(即單純使用k-l變換)特徵選擇的錯誤率小得多
2樓:蓑袂
謝謝樓上的朋友,你說的我都在查的過程中看到過,但我還不是太明白
歐氏距離是空間中兩點的直線距離,巴氏和馬氏呢?
簡述歐幾里得距離與馬氏距離的區別和聯絡
3樓:匿名使用者
歐氏距離定義:歐氏距離( euclidean distance)是一個通常採用的距離定義,它是在m維空間中兩個點之間的真實距離,兩個向量之間的歐氏距離計算公式如下:
其中x,y分別是m維的向量.
馬氏距離
我們熟悉的歐氏距離雖然很有用,但也有明顯的缺點.它將樣品的不同屬性(即各指標或各變數)之間的差別等同看待,這一點有時不能滿足實際要求.例如,在教育研究中,經常遇到對人的分析和判別,個體的不同屬性對於區分個體有著不同的重要性.
因此,有時需要採用不同的距離函式.
如果用dij表示第i個樣品和第j個樣品之間的距離,那麼對一切i,j和k,dij應該滿足如下四個條件:
①當且僅當i=j時,dij=0
②dij>0
③dij=dji(對稱性)
④dij≤dik+dkj(三角不等式)
顯然,歐氏距離滿足以上四個條件.滿足以上條件的函式有多種,本節將要用到的馬氏距離也是其中的一種.
第i個樣品與第j個樣品的馬氏距離dij用下式計算:
dij=(xi一xj)'s-1(xi一xj)
其中,xi和xj分別為第i個和第j個樣品的m個指標所組成的向量,s為樣本協方差矩陣.
馬氏距離有很多優點.它不受量綱的影響,兩點之間的馬氏距離與原始資料的測量單位無關;由標準化資料和中心化資料(即原始資料與均值之差)計算出的二點之間的馬氏距離相同.馬氏距離還可以排除變數之間的相關性的干擾.
它的缺點是誇大了變化微小的變數的作用.
馬氏距離公式中的協方差矩陣為什麼要用逆矩陣呢
協方差矩陣都是正定的,所以一定有逆吧 用逆矩陣的原因是相當於除去scale對距離的影響,想想一維的情況就應該能理解了 比如說同樣距離都是3,但是對於方差大的資料,這個距離就算小了,所以要用距離再除以方差,高維情況就是協方差陣的逆了 劉老師您好,我在文獻中看到hessian矩陣的逆可以用於求協方差矩陣...
馬嵬驛距離岐山縣多遠,馬嵬驛距離昭陵有多遠
駕車路線 全程約75.2公里 起點 馬嵬驛 1.咸陽市內駕車方案 1 從起點向正南方向出發,行駛1.6公里,右後方轉彎進入s1042 沿s104行駛8.3公里,左轉 3 行駛2.0公里,右轉 4 行駛4.7公里,左轉 5 行駛1.5公里,過右側的興城村約250米後,右前方轉彎6 行駛280米,左轉 ...
西安華清池距離乾陵有多遠,馬嵬驛距離乾陵多遠
駕車路線 全程約116.4公里 起點 華清池 1.西安市內駕車方案 1 從起點向正東方向出發,沿華清路行駛300米,過左側的臨潼博物館約200米後,左轉進入秦唐大道 2 沿秦唐大道行駛3.3公里,直行進入陝鼓大街 3 沿陝鼓大街行駛70米,直行進入g108 4 沿g108行駛3.2公里,直行進入於溫...