PRODUCT CLASSIFICATION
產品分類生物信息學主要應用到HMM隱馬可夫鏈的方法。數學中具有馬爾可夫性質的離散時間隨機過程。該過程中,在給定當前知識或信息的情況下,隻有當前的狀態用來預測將來,過去(即當前以前的曆史狀態)對於(yu) 預測將來(即當前以後的未來狀態)是無關(guan) 的。在馬爾可夫鏈的每一步,係統根據概率分布,可以從(cong) 一個(ge) 狀態變到另一個(ge) 狀態,也可以保持當前狀態。狀態的改變叫做過渡,與(yu) 不同的狀態改變相關(guan) 的概率叫做過渡概率。隨機漫步就是馬爾可夫鏈的例子。隨機漫步中每一步的狀態是在圖形中的點,每一步可以移動到任何一個(ge) 相鄰的點,在這裏移動到每一個(ge) 點的概率都是相同的(無論之前漫步路徑是如何
1 評估問題
給定觀測序列O=O1O2O3…Ot和模型參數λ=(A,B,π),怎樣有效計算某一觀測序列的概率,進而可對該HMM做出相關(guan) 評估。例如,已有一些模型參數各異的HMM,給定觀測序列O=O1O2O3…Ot,我們(men) 想知道哪個(ge) HMM模型zui可能生成該觀測序列。通常我們(men) 利用forward算法分別計算每個(ge) HMM產(chan) 生給定觀測序列O的概率,然後從(cong) 中選出*的HMM模型。
這類評估的問題的一個(ge) 經典例子是語音識別。在描述語言識別的隱馬爾科夫模型中,每個(ge) 單詞生成一個(ge) 對應的HMM,每個(ge) 觀測序列由一個(ge) 單詞的語音構成,單詞的識別是通過評估進而選出zui有可能產(chan) 生觀測序列所代表的讀音的HMM而實現的。
2 解碼問題
給定觀測序列O=O1O2O3…Ot和模型參數λ=(A,B,π),怎樣尋找某種意義(yi) 上*的隱狀態序列。在這類問題中,我們(men) 感興(xing) 趣的是馬爾科夫模型中隱含狀態,這些狀態不能直接觀測但卻更具有價(jia) 值,通常利用Viterbi算法來尋找。
這類問題的一個(ge) 實際例子是中文分詞,即把一個(ge) 句子如何劃分其構成才合適。例如,句子“發展中國家”是劃分成“發展-中-國家”,還是“發展-中國-家”。這個(ge) 問題可以用隱馬爾科夫模型來解決(jue) 。句子的分詞方法可以看成是隱含狀態,而句子則可以看成是給定的可觀測狀態,從(cong) 而通過建HMM來尋找出zui可能正確的分詞方法。
3 學習(xi) 問題
即HMM的模型參數λ=(A,B,π)未知,如何調整這些參數以使觀測序列O=O1O2O3…Ot的概率盡可能的大。通常使用Baum-Welch算法以及Reversed Viterbi算法解決(jue) 。
elisa試劑盒,進口elisa試劑盒,國產(chan) elisa試劑盒,elisa試劑盒,明膠酶譜法試劑盒,白介素Elisa試劑盒,睾酮檢測試劑盒,雌二醇檢測試劑盒,進口elisa試劑盒 -ky体育亚洲杯