Thursday, May 15, 2008

Last.fm 有多準?

一開始完全不準,但多試幾次後,就出現的確符合的項目。
所以,Last.fm 的精準度完全來自於 hit-and-miss,而hit 越多,用戶滿意度越高。

舉例:
我以 Lumin開始
花了至少六首歌才出現 Niyaz,但明明Lumin 下面的similar artist 就有出現 Niyaz。
中間出現比較類似的 Severa,但風格其實對我而言跟Lumin是差很多的。

因此,就暴露出 Last.fm algorithm 的問題 - 這些聽音樂的人其實並不懂自己聽的音樂。
他們的聆聽品味並不能滿足一個真的瞭解自己在聽什麼樣音樂的人的需求。
音樂越趨向綜合 genre, 或冷門 genre,例如 Lumin / Niyaz 等,就越明顯。

Lumin case中,Last.fm 顯然認為 Balkan music 是重點影響,所以首先幾首推薦都是 自稱有以Balkan music為根基的音樂家,殊不知, Lumin的Balkan 影響在他播放的曲子中是很弱的,因此後來幾首曲子挑選的類比程度相對下低很多。

拿這個跟pandora比不準,因為pandora 在world這塊很弱,不過pandora 的hip hop 比對是準得不得了,Lil Wayne 的 Lollipop 引出來的每首我都很喜歡。想來是因為hip hop 是顯學,所以他們雇用的expert對這方面都很懂,但一拿 hossam ramzy 來當seed, 就完全虛掉了。

其實 last.fm 也有同樣問題 - hossam ramzy 比出來的根本不對,無論是音樂種類,或是專輯走向,或是作曲家的曲風,配對組合通通是亂七八糟的。

expert 或許還是比 collaborative filtering來得準,畢竟可以確定 data 來源是更乾淨的。

所以 collaborative filtering的結果必需配上 expert 知識才會準吧 - last.fm 在這塊被他的 free on demand 拖累很多,也沒考慮到world music 中,同一個團體的每張專輯其實差異性可以很大,甚至每首都差異很大,都是因為靈感的文化區域因素。要去除掉這樣的雜音,的確需要 pandora 那種labor intensive 的解決方案。

怎麼想,都是一個大難題。

No comments: