多國語言翻譯

搜搜搜

You are viewing "資料探勘-相似度與不相似度"
No Comment Add your own!
Filed under 標籤:
Posted on 晚上10:57
Subscribe through Atom feed.

我要打十個

Doll-Doll



部落格觀察

2010年10月30日 星期六

資料探勘-相似度與不相似度

資料探勘上到現在,漸漸地變複雜了,我只列出老師講的其中一部份,相似度與不相似度的基本原理,相似度與不相似度正如字面所講,在講兩個物件相同或不同的程度,相似度的值為0~1之間,值越大相似度越高,不相似度也是一樣,但有時它的範圍可以到0~無限大。

接下來是關於轉換的部分,有時候相似度的值可能會大於0~1之間這一區塊,其值就無法使用,這時就必須想辦法把它轉換成0~1之間的值,有一些公式可供使用,這裡就不多加說明,總之其原本值越大,轉換後的值會越接近1,其值越小則越接近0,雖然要將值對映至0~1的區間有困難,但相似度和不相度的轉換卻滿簡單的,假設兩個值都在0~1之間,那麼相似度=1-不相似度(s=1-d) 不相似度=1-相似度(d=1-s)。

以上先講到這樣,接下來都是有點複雜的問題了,列出兩個常用的衡量公式:

歐幾里德距離
Minkowski距離

0 意見:

張貼留言