建立分段MP3歌曲重複樣型之分類索引結構
Constructing Classified Index Structures for Repeated Patterns of Segmented MP3 Songs

 

林朝興

電腦工程博士 助教授

南台科技大學資訊管理所

710 台南縣永康市南台街一號

Email: mikelin@mail.stut.edu.tw

 

王怡君

資訊管理碩士 研發工程師

東元電機 綜合研究所

台北市南港區園區街3F4F

Email: novel@msrg.mis.stut.edu.tw

 

 

 

近年來由於MP3音樂壓縮技術的快速演進,建立一大型音樂資料庫提供隨選音樂(Music-on-Demand, MoD),已經變的真實可行。直接以外部資料(external information)例如歌名或歌手名稱,搜尋歌曲雖然方便,但對於不知名或不記得曲名的歌曲,往往無法提供有效的查詢。因此,藉由基於內容擷取(content-based retrieval)技術,使用者可以透過麥克風經由直接哼唱(humming)方式,以旋律方式查詢歌曲。隨著音樂資料庫容量的成長,查詢的等待時間也相對增加。有鑑於此,不少學者提出各種方法來加快查詢比對的速度,最常使用的方法是將音樂中重覆片段(repeated patterns),做為關鍵特徵(key features)索引來代表整首歌曲,以改善搜尋速度。但由於重覆片段的起迄往往落於樂句之間,不符合一般哼唱習慣,造成比對上的困難。

本研究論文首先提出動態擷取(dynamic retrieval)MP3關鍵樂句(key phrase)的方法。其包含二階段,音樂內涵分段階段包括去除背景音樂及動態分段,資料正規劃階段包括音名轉換及擷取關鍵樂句。此方法以少量的關鍵樂句代表整首歌曲,可有效地減少搜尋比對資料量此外,本論文另提出Music-Trie索引結構,以建置所有關鍵樂句索引來快速搜尋歌曲。其提供類似字典的直接索引比對,以廉價的儲存空間提供快速的查詢。文中我們並探討Music-Trie索引結構在深度(depth)及廣度(breadth)的優化(optimization)。模擬實驗結果顯示,相較於循序(sequential)及分類循序(classified sequential)索引結構,不管是真實或人造歌曲測試資料集上,Music-Trie在索引的建立及需求空間上效能稍差,但其搜尋時間幾乎是常數(O(1)),不會隨著音樂資料庫中MP3歌曲的增加而增加。

 

關鍵字:音樂索引結構、Music-Trie、重複樣型、分段、MP3