โมเดลมาร์คอฟที่ซ่อนอยู่

From Wikipedia, the free encyclopedia

แบบจำลองมาร์คอฟที่ซ่อนอยู่ ( HMM ) เป็นแบบจำลองมาร์คอฟทางสถิติ ซึ่งระบบที่กำลังสร้างแบบจำลองจะถือว่าเป็นกระบวนการมาร์คอฟ — เรียกมันว่า— ด้วยสถานะที่ไม่สามารถสังเกตได้ (" ซ่อน ") ส่วนหนึ่งของคำจำกัดความ HMM กำหนดให้มีกระบวนการที่สังเกตได้ซึ่งผลลัพธ์ที่ได้รับ "อิทธิพล" จากผลลัพธ์ของในทางที่ทราบ เนื่องจากไม่สามารถสังเกตได้โดยตรง เป้าหมายคือการเรียนรู้เกี่ยวกับโดยการสังเกตHMM มีข้อกำหนดเพิ่มเติมว่าผลลัพธ์ของในเวลาจะต้อง "ได้รับอิทธิพล" จากผลของที่และผลลัพธ์ของและที่ต้องเป็นอิสระจากเงื่อนไขที่ที่ให้ไว้ในเวลา

แบบจำลองมาร์คอฟ ที่ซ่อนไว้เป็นที่รู้จักสำหรับการประยุกต์ใช้กับอุณหพลศาสตร์กลศาสตร์สถิติฟิสิกส์เคมีเศรษฐศาสตร์การเงินการประมวลผลสัญญาณทฤษฎีข้อมูลการจดจำรูปแบบเช่นคำพูด[1] ลายมือการจดจำท่าทาง , [ 2] ส่วนหนึ่งของ- การติดแท็กคำพูด การ ตามโน้ตเพลง[3] การปลดปล่อยบางส่วน[4]และชีวสารสนเทศ [5] [6]

คำจำกัดความ

อนุญาตและเป็น กระบวนการสุ่มแบบไม่ต่อเนื่องและ. คู่เป็นรูปแบบมาร์คอฟที่ซ่อนอยู่ถ้า

  • เป็นกระบวนการมาร์คอฟซึ่งพฤติกรรมไม่สามารถสังเกตได้โดยตรง ("ซ่อนเร้น");
สำหรับทุกๆ และโบเรล ทุก ชุด.

อนุญาตและเป็นกระบวนการสุ่มแบบเวลาต่อเนื่อง คู่เป็นรูปแบบมาร์คอฟที่ซ่อนอยู่ถ้า

  • เป็นกระบวนการมาร์คอฟซึ่งพฤติกรรมไม่สามารถสังเกตได้โดยตรง ("ซ่อนเร้น");
  • ,
สำหรับทุกๆโบเรลทุกชุดและตระกูลโบเรลทุกชุด

คำศัพท์

สถานะของกระบวนการ(ตอบกลับเรียกว่าสถานะที่ซ่อนอยู่และ(ตอบกลับเรียกว่าความน่าจะเป็นของการปล่อยหรือ ความน่าจะเป็นของการส่งออก

ตัวอย่าง

การวาดลูกบอลจากโกศที่ซ่อนอยู่

รูปที่ 1 พารามิเตอร์ความน่าจะเป็นของโมเดลมาร์คอฟที่ซ่อนอยู่ (ตัวอย่าง)
X — สถานะ
y — การสังเกตที่เป็นไปได้
a — ความน่าจะเป็นการเปลี่ยนสถานะ
b — ความน่าจะเป็นเอาต์พุต

ในรูปแบบที่ไม่ต่อเนื่อง กระบวนการมาร์คอฟที่ซ่อนอยู่สามารถมองเห็นได้ว่าเป็นภาพรวมของปัญหาโกศที่มีการเปลี่ยน (โดยที่แต่ละรายการจากโกศจะถูกส่งกลับไปยังโกศเดิมก่อนขั้นตอนต่อไป) [7]ลองพิจารณาตัวอย่างนี้: ในห้องที่มองไม่เห็นมีมารอยู่ ห้องนี้มีโกศ X1, X2, X3, ... แต่ละอันมีลูกบอลที่รู้จักผสมกัน แต่ละลูกมีป้ายกำกับ y1, y2, y3, ... มารเลือกโกศในห้องนั้นและสุ่มดึงลูกบอลจากโกศนั้น จากนั้นจึงวางลูกบอลลงบนสายพาน ซึ่งผู้สังเกตการณ์สามารถสังเกตลำดับของลูกบอล แต่ไม่ใช่ลำดับของโกศที่ดึงออกมา มารมีขั้นตอนในการเลือกโกศ ทางเลือกของโกศสำหรับn- ลูกบอลลูกที่ 1 ขึ้นอยู่กับตัวเลขสุ่มและตัวเลือกของโกศสำหรับลูกบอล ( n  − 1) -th การเลือกโกศไม่ได้ขึ้นอยู่กับโกศที่เลือกก่อนหน้าโกศก่อนหน้านี้โดยตรง ดังนั้นจึงเรียกว่ากระบวนการมาร์คอฟ สามารถอธิบายได้จากส่วนบนของรูปที่ 1

กระบวนการมาร์กอฟนั้นไม่สามารถสังเกตเห็นได้ มีเพียงลำดับของลูกบอลที่มีป้ายกำกับ ดังนั้นการจัดเรียงนี้จึงเรียกว่า "กระบวนการมาร์กอฟที่ซ่อนอยู่" นี่คือภาพประกอบด้านล่างของแผนภาพที่แสดงในรูปที่ 1 ซึ่งเราจะเห็นว่าสามารถวาดลูกบอล y1, y2, y3, y4 ในแต่ละสถานะได้ แม้ว่าผู้สังเกตจะรู้องค์ประกอบของโกศและเพิ่งสังเกตเห็นลำดับของลูกบอลสามลูกเช่น y1, y2 และ y3 บนสายพาน ผู้สังเกตก็ยังไม่สามารถแน่ใจได้ว่าโกศใด ( เช่นสถานะใด) ที่มารดึงออกมา ลูกที่สามจาก. อย่างไรก็ตาม ผู้สังเกตการณ์สามารถหาข้อมูลอื่นๆ ได้ เช่น ความเป็นไปได้ที่ลูกบอลลูกที่สามจะมาจากแต่ละโกศ

เกมทายสภาพอากาศ

ลองนึกถึงเพื่อนสองคน อลิซและบ็อบ ซึ่งอยู่ห่างไกลกันและคุยกันทุกวันทางโทรศัพท์เกี่ยวกับสิ่งที่พวกเขาทำในวันนั้น บ๊อบสนใจเพียงสามกิจกรรมเท่านั้น: เดินเล่นในสวนสาธารณะ ช้อปปิ้ง และทำความสะอาดอพาร์ทเมนต์ของเขา ทางเลือกของสิ่งที่ต้องทำจะพิจารณาจากสภาพอากาศในวันที่กำหนดเท่านั้น อลิซไม่มีข้อมูลที่แน่นอนเกี่ยวกับสภาพอากาศ แต่เธอรู้แนวโน้มทั่วไป อลิซพยายามเดาว่าสภาพอากาศจะเป็นอย่างไรจากสิ่งที่บ็อบบอกเธอในแต่ละวัน

อลิซเชื่อว่าสภาพอากาศทำงานเป็นห่วงโซ่มาร์คอฟที่ ไม่ต่อเนื่อง มีสองสถานะคือ "Rainy" และ "Sunny" แต่เธอไม่สามารถสังเกตได้โดยตรง นั่นคือถูกซ่อนไว้จากเธอ ในแต่ละวัน มีโอกาสที่ Bob จะทำกิจกรรมอย่างใดอย่างหนึ่งต่อไปนี้ ขึ้นอยู่กับสภาพอากาศ: "เดินเล่น" "ซื้อของ" หรือ "ทำความสะอาด" เนื่องจากบ็อบบอกอลิซเกี่ยวกับกิจกรรมของเขา นั่นคือข้อสังเกต ระบบทั้งหมดเป็นแบบ Markov ที่ซ่อนอยู่ (HMM)

อลิซรู้แนวโน้มสภาพอากาศทั่วไปในพื้นที่ และโดยเฉลี่ยแล้วบ๊อบชอบทำอะไร กล่าวอีกนัยหนึ่ง พารามิเตอร์ของ HMM เป็นที่รู้จัก สามารถแสดงได้ดังนี้ในPython :

รัฐ =  ( "ฝนตก" ,  "แดดออก" )

การสังเกต =  ( "เดิน" ,  "ร้านค้า" ,  "สะอาด" )

start_probability  =  { "ฝนตก" :  0.6 ,  "แดดออก" :  0.4 }

transition_probability  =  { 
    "ฝนตก" :  { "ฝนตก" :  0.7 ,  "แดดจัด" :  0.3 }, 
    "แดดจัด" :  { "ฝนตก" :  0.4 ,  "แดดจัด" :  0.6 }, 
}

emission_probability  =  { 
    "ฝนตก" :  { "เดิน" :  0.1 ,  "ร้านค้า" :  0.4 ,  "สะอาด" :  0.5 }, 
    "แดดออก" :  { "เดิน" :  0.6 ,  "ร้านค้า" :  0.3 ,  "สะอาด" :  0.1 } , 
}

ในโค้ดชิ้นนี้start_probabilityแสดงถึงความเชื่อของอลิซเกี่ยวกับสถานะของ HMM เมื่อบ็อบโทรหาเธอครั้งแรก (ทั้งหมดที่เธอรู้ก็คือโดยเฉลี่ยแล้วฝนมักจะตก) {'Rainy': 0.57, 'Sunny': 0.43}การแจกแจงความน่าจะ เป็นเฉพาะที่ใช้ในที่นี้ไม่ใช่การแจกแจงความน่าจะเป็นแบบสมดุล ซึ่งมีค่าประมาณ แสดงtransition_probabilityถึงการเปลี่ยนแปลงของสภาพอากาศในห่วงโซ่มาร์คอฟ ในตัวอย่างนี้ มีโอกาสเพียง 30% ที่พรุ่งนี้จะมีแดดหากวันนี้ฝนตก แสดงemission_probabilityถึงแนวโน้มที่บ๊อบจะทำกิจกรรมบางอย่างในแต่ละวัน ถ้าฝนตก มีโอกาส 50% ที่เขาทำความสะอาดอพาร์ตเมนต์ ถ้าแดดออก มีโอกาส 60% ที่เขาออกไปเดินเล่นข้างนอก

การแสดงกราฟิกของ HMM ที่กำหนด

ตัวอย่างที่คล้ายกันมีรายละเอียดเพิ่มเติมในหน้าอัลกอริทึม Viterbi

สถาปัตยกรรมโครงสร้าง

แผนภาพด้านล่างแสดงสถาปัตยกรรมทั่วไปของ HMM ที่สร้างอินสแตนซ์ รูปวงรีแต่ละรูปแทนตัวแปรสุ่มที่สามารถรับค่าจำนวนเท่าใดก็ได้ ตัวแปรสุ่มx ( t ) คือสถานะที่ซ่อนอยู่ ณ เวลาt (ด้วยแบบจำลองจากไดอะแกรมด้านบนx ( t ) ∈ {  x 1x 2x 3  }) ตัวแปรสุ่มy ( t ) คือการสังเกตที่เวลาt (กับy ( t ) ∈ {  y 1y 2y 3y 4  }). ลูกศรในแผนภาพ (มักเรียกว่าแผนภาพโครงตาข่าย ) แสดงถึงการพึ่งพาแบบมีเงื่อนไข

จากแผนภาพ เป็นที่ชัดเจนว่าการแจกแจงความน่าจะเป็นแบบมีเงื่อนไขของตัวแปรซ่อนx ( t ) ณ เวลาtกำหนดให้ค่าของตัวแปรซ่อนxตลอดเวลา ขึ้นอยู่กับค่าของตัวแปรซ่อนx ( t  − 1 เท่านั้น ); ค่าที่เวลาt  − 2 และก่อนหน้านั้นไม่มีอิทธิพล สิ่งนี้เรียกว่าคุณสมบัติมาร์คอฟ ในทำนองเดียวกัน ค่าของตัวแปรที่สังเกตได้y ( t ) จะขึ้นอยู่กับค่าของตัวแปรที่ซ่อนอยู่x ( t ) เท่านั้น (ทั้งที่เวลาt )

ในประเภทมาตรฐานของโมเดลมาร์คอฟที่ซ่อนอยู่ซึ่งพิจารณาในที่นี้ พื้นที่สถานะของตัวแปรที่ซ่อนอยู่นั้นไม่ต่อเนื่อง ในขณะที่การสังเกตนั้นสามารถแยกได้ (โดยทั่วไปจะสร้างขึ้นจากการแจกแจงแบบหมวดหมู่ ) หรือแบบต่อเนื่อง (โดยทั่วไปจากการแจกแจงแบบเกาส์เซียน ) พารามิเตอร์ของโมเดลมาร์คอฟที่ซ่อนอยู่มีสองประเภทความน่าจะเป็นของการเปลี่ยนแปลงและความน่า จะ เป็นของ การ ปล่อยก๊าซ ความน่าจะเป็นของการเปลี่ยนแปลงจะควบคุมวิธีการเลือกสถานะที่ซ่อนอยู่ในเวลาtโดยกำหนดสถานะที่ซ่อนอยู่ในเวลา.

พื้นที่สถานะที่ซ่อนอยู่จะถือว่าประกอบด้วยหนึ่งใน ค่าที่เป็นไปได้ Nซึ่งจำลองเป็นการแจกแจงตามหมวดหมู่ (ดูส่วนด้านล่างเกี่ยวกับส่วนขยายสำหรับความเป็นไปได้อื่นๆ) ซึ่งหมายความว่าสำหรับแต่ละสถานะ ที่เป็นไปได้ Nที่ตัวแปรที่ซ่อนอยู่ ณ เวลาtสามารถอยู่ได้ มีความน่าจะเป็นในการเปลี่ยนผ่านจากสถานะนี้ไปยังแต่ละ สถานะที่เป็นไปได้ Nของ ตัวแปรที่ซ่อนอยู่ในเวลารวมเป็นความน่าจะเป็นการเปลี่ยนแปลง โปรดทราบว่าชุดความน่าจะเป็นของการเปลี่ยนสถานะสำหรับการเปลี่ยนจากสถานะใดๆ ก็ตามจะต้องรวมกันเป็น 1 ดังนั้นเมทริกซ์ของความน่าจะเป็นการเปลี่ยนแปลงคือเมทริกซ์มาร์คอฟ เนื่องจากความน่าจะเป็นของการเปลี่ยนแปลงใดๆ สามารถกำหนดได้เมื่อทราบค่าอื่นๆ แล้ว จึงมีทั้งหมดพารามิเตอร์การเปลี่ยนแปลง

นอกจากนี้ สำหรับแต่ละ สถานะที่เป็นไปได้ Nจะมีชุดของความน่าจะเป็นของการปล่อยที่ควบคุมการแจกแจงของตัวแปรที่สังเกตได้ ณ เวลาใดเวลาหนึ่งที่กำหนดสถานะของตัวแปรที่ซ่อนอยู่ในขณะนั้น ขนาดของชุดนี้ขึ้นอยู่กับลักษณะของตัวแปรที่สังเกตได้ ตัวอย่างเช่น หากตัวแปรที่สังเกตได้ไม่ต่อเนื่องกับ ค่าที่เป็นไปได้ของ Mซึ่งควบคุมโดยการแจกแจงแบบหมวดหมู่ก็จะมีแยกพารามิเตอร์ รวมเป็นพารามิเตอร์การปล่อยก๊าซเหนือสถานะที่ซ่อนอยู่ทั้งหมด ในทางกลับกัน หากตัวแปรที่สังเกตได้คือ เวกเตอร์มิติ Mที่กระจายตามการแจกแจงเกาส์เซียน หลายตัวแปร โดยพลการ จะมี พารามิเตอร์ Mควบคุมค่าเฉลี่ยและพารามิเตอร์ที่ควบคุมเมทริกซ์ความแปรปรวนร่วมสำหรับผลรวมของพารามิเตอร์การปล่อย (ในกรณีเช่นนี้ เว้นแต่ค่าของMจะน้อย อาจเป็นประโยชน์มากกว่าที่จะจำกัดธรรมชาติของความแปรปรวนร่วมระหว่างองค์ประกอบแต่ละส่วนของเวกเตอร์การสังเกต เช่น โดยสมมติว่าองค์ประกอบต่างๆ เป็นอิสระจากกัน หรือจำกัดน้อยกว่า เป็นอิสระจากองค์ประกอบทั้งหมด แต่มีองค์ประกอบที่อยู่ติดกันในจำนวนที่แน่นอน)

วิวัฒนาการชั่วคราวของแบบจำลองมาร์คอฟที่ซ่อนอยู่

การอนุมาน

การเปลี่ยนสถานะและความน่าจะเป็นเอาต์พุตของ HMM จะระบุโดยความทึบของเส้นในส่วนบนของไดอะแกรม เนื่องจากเราได้สังเกตลำดับเอาต์พุตในส่วนล่างของแผนภาพ เราอาจสนใจลำดับสถานะที่เป็นไปได้มากที่สุดที่สามารถสร้างได้ ตามลูกศรที่มีอยู่ในแผนภาพ ลำดับสถานะต่อไปนี้คือตัวเลือก:
5 3 2 5 3 2
4 3 2 5 3 2
3 1 2 5 3 2
เราสามารถหาลำดับที่เป็นไปได้มากที่สุดโดยการประเมินความน่าจะเป็นร่วมกันของทั้งลำดับสถานะและการสังเกตสำหรับแต่ละกรณี (ง่ายๆ โดยการคูณค่าความน่าจะเป็น ซึ่งสอดคล้องกับความทึบของลูกศรที่เกี่ยวข้อง) โดยทั่วไป ปัญหาประเภทนี้ (เช่น การค้นหาคำอธิบาย ที่เป็นไปได้มากที่สุดสำหรับลำดับการสังเกต) สามารถแก้ไขได้อย่างมีประสิทธิภาพโดยใช้อัลกอริทึม Viterbi

ปัญหา การอนุมานหลายอย่างเกี่ยวข้องกับโมเดลมาร์คอฟที่ซ่อนอยู่ ดังที่อธิบายไว้ด้านล่าง

ความน่าจะเป็นของลำดับที่สังเกตได้

งานคือการคำนวณด้วยวิธีที่ดีที่สุด โดยพิจารณาจากพารามิเตอร์ของแบบจำลอง ความน่าจะเป็นของลำดับผลลัพธ์เฉพาะ สิ่งนี้ต้องการผลรวมของลำดับสถานะที่เป็นไปได้ทั้งหมด:

ความน่าจะเป็นของการสังเกตลำดับ

ของความยาวLกำหนดโดย

โดยที่ผลรวมจะวิ่งผ่านลำดับโหนดที่ซ่อนอยู่ที่เป็นไปได้ทั้งหมด

การใช้หลักการของการ เขียนโปรแกรมแบบไดนามิกปัญหานี้ก็สามารถจัดการได้อย่างมีประสิทธิภาพโดยใช้อัลกอริทึมการส่งต่อ

ความน่าจะเป็นของตัวแปรแฝง

งานที่เกี่ยวข้องจำนวนหนึ่งถามเกี่ยวกับความน่าจะเป็นของตัวแปรแฝงหนึ่งตัวหรือมากกว่า โดยพิจารณาจากพารามิเตอร์ของแบบจำลองและลำดับของการสังเกต

การกรอง

งานคือการคำนวณโดยกำหนดพารามิเตอร์ของแบบจำลองและลำดับของการสังเกต การกระจายสถานะที่ซ่อนอยู่ของตัวแปรแฝงตัวสุดท้ายที่ส่วนท้ายของลำดับ นั่นคือการคำนวณ. งานนี้มักจะใช้เมื่อลำดับของตัวแปรแฝงถูกมองว่าเป็นสถานะพื้นฐานที่กระบวนการเคลื่อนผ่านตามลำดับของจุดเวลา โดยมีการสังเกตที่สอดคล้องกันในแต่ละจุดของเวลา จากนั้นเป็นเรื่องปกติที่จะถามเกี่ยวกับสถานะของกระบวนการในตอนท้าย

ปัญหานี้สามารถจัดการได้อย่างมีประสิทธิภาพโดยใช้อั ลกอริทึมการส่งต่อ

การปรับให้เรียบ

สิ่งนี้คล้ายกับการกรอง แต่ถามเกี่ยวกับการกระจายของตัวแปรแฝงที่อยู่ตรงกลางของลำดับ เช่น เพื่อคำนวณสำหรับบางคน. จากมุมมองที่อธิบายไว้ข้างต้น สิ่งนี้สามารถคิดได้ว่าเป็นการกระจายความน่าจะเป็น เหนือ สถานะที่ซ่อนอยู่สำหรับจุดในเวลาkในอดีต เทียบกับเวลาt

อัลกอริธึมการย้อนกลับเป็นวิธีที่ดีในการคำนวณค่าที่ราบรื่นสำหรับตัวแปรสถานะที่ซ่อนอยู่ทั้งหมด

คำอธิบายที่เป็นไปได้มากที่สุด

งานนี้จะถามเกี่ยวกับความน่าจะเป็นร่วมของ ลำดับสถานะซ่อนเร้น ทั้งหมดซึ่งสร้างลำดับการสังเกตเฉพาะ (ดูภาพประกอบด้านขวา) ซึ่งแตกต่างจากสองงานก่อนหน้านี้ งานนี้ใช้ได้โดยทั่วไปเมื่อ HMM ถูกนำไปใช้กับปัญหาประเภทต่างๆ จากปัญหาที่เกี่ยวข้องกับงานการกรองและปรับให้เรียบ ตัวอย่างคือการติดแท็กส่วนหนึ่งของคำพูดโดยที่สถานะที่ซ่อนอยู่แสดงถึงส่วนพื้นฐานของคำพูดที่สอดคล้องกับลำดับของคำที่สังเกตได้ ในกรณีนี้ สิ่งที่น่าสนใจคือลำดับทั้งหมดของส่วนของคำพูด แทนที่จะเป็นเพียงส่วนของคำพูดสำหรับคำๆ เดียว เนื่องจากการกรองหรือการปรับให้เรียบจะคำนวณ

งานนี้จำเป็นต้องค้นหาค่าสูงสุดของลำดับสถานะที่เป็นไปได้ทั้งหมด และสามารถแก้ไขได้อย่างมีประสิทธิภาพด้วยอั ลกอริทึม Viterbi

นัยสำคัญทางสถิติ

สำหรับปัญหาข้างต้นบางข้อ อาจเป็นเรื่องที่น่าสนใจที่จะถามเกี่ยวกับนัยสำคัญทางสถิติ อะไรคือความน่าจะเป็นที่ลำดับที่ได้จากการแจกแจงค่าว่างจะมีความน่าจะเป็น HMM (ในกรณีของอัลกอริธึมการส่งต่อ) หรือความน่าจะเป็นของลำดับสถานะสูงสุด (ในกรณีของอัลกอริทึม Viterbi) อย่างน้อยที่สุดเท่ากับความน่าจะเป็นของลำดับเฉพาะ ลำดับผลลัพธ์? [8] เมื่อใช้ HMM เพื่อประเมินความเกี่ยวข้องของสมมติฐานสำหรับลำดับเอาต์พุตหนึ่งๆ นัยสำคัญทางสถิติจะบ่งชี้ถึงอัตราบวกปลอมที่เกี่ยวข้องกับความล้มเหลวในการปฏิเสธสมมติฐานสำหรับลำดับเอาต์พุต

การเรียนรู้

งานการเรียนรู้พารามิเตอร์ใน HMM คือการค้นหา โดยพิจารณาจากลำดับเอาต์พุตหรือชุดของลำดับดังกล่าว ซึ่งเป็นชุดที่ดีที่สุดของการเปลี่ยนสถานะและความน่าจะเป็นในการปล่อยก๊าซ โดยปกติงานจะได้รับ ค่าประมาณ ความเป็นไปได้สูงสุดของพารามิเตอร์ของ HMM ที่กำหนดชุดของลำดับผลลัพธ์ ไม่มีอัลกอริธึมที่เข้าใจยากสำหรับการแก้ปัญหานี้อย่างแน่นอน แต่สามารถหาค่าความน่าจะเป็นสูงสุดในท้องถิ่นได้อย่างมีประสิทธิภาพโดยใช้อัลกอริธึม Baum –Welchหรืออัลกอริทึม Baldi–Chauvin อัลกอริทึม Baum–Welchเป็นกรณีพิเศษของ อัลกอริทึมการเพิ่มความ คาด หวังสูงสุด

หากใช้ HMM สำหรับการทำนายอนุกรมเวลา วิธีการอนุมานแบบเบส์ที่ซับซ้อนกว่า เช่น การสุ่มตัวอย่าง แบบ Markov chain Monte Carlo (MCMC) จะได้รับการพิสูจน์แล้วว่าดีกว่าการหาแบบจำลองความน่าจะเป็นสูงสุดเพียงแบบเดียวทั้งในแง่ของความแม่นยำและความเสถียร [9]เนื่องจาก MCMC กำหนดภาระการคำนวณที่สำคัญ ในกรณีที่ความสามารถในการขยายขนาดการคำนวณเป็นที่สนใจเช่นกัน เราอาจใช้การประมาณค่าความแปรผันตามการอนุมานแบบเบส์ เช่น [10] แท้จริงแล้ว การอนุมานความแปรผันโดยประมาณให้ประสิทธิภาพการคำนวณที่เทียบเคียงได้กับการคาดหวัง-สูงสุด ในขณะที่ ให้โปรไฟล์ความแม่นยำที่ด้อยกว่าการอนุมานแบบเบส์แบบ MCMC ที่แน่นอนเพียงเล็กน้อยเท่านั้น

แอปพลิเคชั่น

โปรไฟล์ HMM ที่สร้างแบบจำลองการจัดตำแหน่งหลายลำดับ

HMM สามารถนำไปใช้ในหลายฟิลด์โดยมีเป้าหมายเพื่อกู้คืนลำดับข้อมูลที่ไม่สามารถสังเกตได้ทันที (แต่ข้อมูลอื่น ๆ ที่ขึ้นอยู่กับลำดับนั้นมีอยู่) แอปพลิเคชันประกอบด้วย:

ประวัติ

แบบจำลองมาร์กอฟที่ซ่อนอยู่ได้รับการอธิบายในชุดเอกสารทางสถิติโดยLeonard E. Baumและผู้เขียนคนอื่น ๆ ในช่วงครึ่งหลังของทศวรรษที่ 1960 [28] [29] [30] [ 31] [32]หนึ่งในแอปพลิเคชั่นแรกๆ ของ HMM คือการรู้จำเสียง [33] [34] [35] [36]

ในช่วงครึ่งหลังของทศวรรษที่ 1980 HMM เริ่มถูกนำ มาใช้กับการวิเคราะห์ลำดับชีวภาพ[37]โดยเฉพาะอย่างยิ่งDNA ตั้งแต่นั้นเป็นต้น มาพวกเขาได้กลายเป็นที่แพร่หลายในสาขาชีวสารสนเทศ [38]

ส่วนขยาย

ในแบบจำลองมาร์คอฟที่ซ่อนอยู่ซึ่งพิจารณาข้างต้น พื้นที่สถานะของตัวแปรที่ซ่อนอยู่นั้นไม่ต่อเนื่อง ในขณะที่การสังเกตนั้นสามารถแยกได้ (โดยทั่วไปจะสร้างขึ้นจากการแจกแจงแบบหมวดหมู่ ) หรือแบบต่อเนื่อง (โดยทั่วไปจากการแจกแจงแบบเกาส์เซียน ) โมเดลมาร์คอฟที่ซ่อนอยู่ยังสามารถทำให้เป็นแบบทั่วไปเพื่อให้มีช่องว่างสถานะต่อเนื่องได้ ตัวอย่างของแบบจำลองดังกล่าวคือแบบจำลองที่กระบวนการ Markov เหนือตัวแปรที่ซ่อนอยู่เป็นระบบไดนามิกเชิงเส้นที่มีความสัมพันธ์เชิงเส้นระหว่างตัวแปรที่เกี่ยวข้องและที่ซึ่งตัวแปรที่ซ่อนอยู่และตัวแปรที่สังเกตได้ทั้งหมดเป็นไปตามการแจกแจงแบบเกาส์เซียน ในกรณีง่ายๆ เช่น ระบบไดนามิกเชิงเส้นที่เพิ่งกล่าวถึง การอนุมานที่แน่นอนสามารถติดตามได้ (ในกรณีนี้ ใช้ตัวกรองคาลมาน); อย่างไรก็ตาม โดยทั่วไป การอนุมานที่แน่นอนใน HMM ที่มีตัวแปรแฝงอย่างต่อเนื่องนั้นเป็นไปไม่ได้ และต้องใช้วิธี การ โดยประมาณ เช่น ตัวกรองคาลมานแบบขยายหรือตัวกรองอนุภาค

แบบจำลองมาร์คอฟที่ซ่อนอยู่เป็นแบบจำลองเชิงกำเนิดซึ่งการกระจายร่วมกันของการสังเกตและสถานะที่ซ่อนอยู่ หรือเทียบเท่าทั้งการกระจายก่อนหน้าของสถานะที่ซ่อนอยู่ ( ความน่าจะเป็นของ การเปลี่ยนแปลง ) และการกระจายแบบมีเงื่อนไขของการสังเกตที่ระบุสถานะ อัลกอริธึมข้างต้นสันนิษฐานโดยปริยายว่ามี การแจกแจงก่อน แบบสม่ำเสมอเหนือความน่าจะเป็นของการเปลี่ยนแปลง อย่างไรก็ตาม คุณสามารถสร้างโมเดลมาร์คอฟที่ซ่อนอยู่ด้วยการแจกแจงก่อนหน้าประเภทอื่นๆ ได้ ตัวเลือกที่ชัดเจน เนื่องจากการแจกแจงแบบหมวดหมู่ของความน่าจะเป็นของการเปลี่ยนแปลง คือการแจกแจงแบบไดริชเลตซึ่งเป็น คอนจูเกต ก่อนการแจกแจงของการแจกแจงหมวดหมู่ โดยทั่วไปแล้ว การแจกแจงแบบไดริชเลตแบบสมมาตรจะถูกเลือก ซึ่งสะท้อนความไม่รู้ว่าสถานะใดมีแนวโน้มมากกว่าสถานะอื่นโดยเนื้อแท้ พารามิเตอร์เดียวของการแจกแจงนี้ (เรียกว่าพารามิเตอร์ความเข้มข้น) ควบคุมความหนาแน่นสัมพัทธ์หรือความเบาบางของเมทริกซ์การเปลี่ยนแปลงที่เป็นผลลัพธ์ ตัวเลือก 1 จะให้การกระจายแบบสม่ำเสมอ ค่าที่มากกว่า 1 จะสร้างเมทริกซ์ที่หนาแน่น ซึ่งความน่าจะเป็นในการเปลี่ยนแปลงระหว่างคู่ของสถานะนั้นเกือบจะเท่ากัน ค่าที่น้อยกว่า 1 ส่งผลให้เกิดเมทริกซ์กระจัดกระจาย ซึ่งสำหรับแต่ละสถานะต้นทางที่กำหนด สถานะปลายทางเพียงจำนวนเล็กน้อยเท่านั้นที่มีความน่าจะเป็นการเปลี่ยนผ่านที่ไม่สำคัญ นอกจากนี้ยังเป็นไปได้ที่จะใช้การแจกแจง Dirichlet แบบสองระดับก่อนหน้านี้ ซึ่งการแจกแจงแบบ Dirichlet หนึ่งรายการ (การกระจายบน) ควบคุมพารามิเตอร์ของการแจกแจงแบบ Dirichlet อีกแบบ (การกระจายล่าง) ซึ่งจะควบคุมความน่าจะเป็นของการเปลี่ยนผ่าน การกระจายตัวบนจะควบคุมการกระจายโดยรวมของรัฐ โดยพิจารณาว่าแต่ละรัฐมีโอกาสเกิดขึ้นมากน้อยเพียงใด พารามิเตอร์ความเข้มข้นกำหนดความหนาแน่นหรือความเบาบางของรัฐ การกระจายก่อนหน้าแบบสองระดับดังกล่าว ซึ่งพารามิเตอร์ความเข้มข้นทั้งสองถูกตั้งค่าเพื่อสร้างการกระจายแบบเบาบาง อาจมีประโยชน์เช่นใน การติดแท็กบางส่วนของคำพูดที่ไม่มีการควบคุมซึ่งบางส่วนของคำพูดเกิดขึ้นบ่อยกว่าส่วนอื่นๆ อัลกอริทึมการเรียนรู้ที่ถือว่าการแจกแจงแบบสม่ำเสมอโดยทั่วไปทำงานได้ไม่ดีในงานนี้ พารามิเตอร์ของแบบจำลองประเภทนี้ ซึ่งมีการแจกแจง ก่อน หน้านี้แบบไม่สม่ำเสมอ สามารถเรียนรู้ได้โดยใช้การสุ่มตัวอย่างแบบกิบส์หรือเวอร์ชันเพิ่มเติมของอัลกอริทึมการเพิ่มความคาดหวังสูงสุด

ส่วนขยายของโมเดล Markov ที่ซ่อนอยู่ที่อธิบายไว้ก่อนหน้านี้กับDirichlet priors ใช้กระบวนการ Dirichletแทนการกระจาย Dirichlet ประเภทของแบบจำลองนี้อนุญาตให้มีสถานะที่ไม่รู้จักและอาจเป็นจำนวนไม่สิ้นสุด เป็นเรื่องปกติที่จะใช้กระบวนการ Dirichlet แบบสองระดับ ซึ่งคล้ายกับแบบจำลองที่อธิบายไว้ก่อนหน้าที่มีการแจกแจงแบบ Dirichlet สองระดับ โมเดลดังกล่าวเรียกว่ากระบวนการ Dirichlet แบบลำดับชั้นที่ซ่อนโมเดล Markovหรือเรียกสั้นๆ ว่าHDP-HMM เดิมทีมันถูกอธิบายไว้ภายใต้ชื่อ "Infinite Hidden Markov Model" [39]และถูกกำหนดให้เป็นทางการเพิ่มเติมใน "Hierarchical Dirichlet Processes" [40]

ส่วนขยายประเภทอื่นใช้แบบจำลองการเลือกปฏิบัติแทนแบบจำลองกำเนิดของ HMM มาตรฐาน แบบจำลองประเภทนี้จำลองการแจกแจงตามเงื่อนไขของสถานะที่ซ่อนอยู่โดยตรงจากการสังเกต แทนที่จะสร้างแบบจำลองการแจกแจงร่วม ตัวอย่างของแบบจำลองนี้เรียกว่าแบบจำลองเอนโทรปีสูงสุดของเอนโทรปี (MEMM) ซึ่งจำลองการแจกแจงตามเงื่อนไขของสถานะโดยใช้การถดถอยโลจิสติก (หรือที่เรียกว่า " เอนโทรปีสูงสุดแบบจำลอง") ข้อดีของแบบจำลองประเภทนี้คือคุณลักษณะตามอำเภอใจ (เช่น ฟังก์ชัน) ของการสังเกตสามารถจำลองได้ ทำให้ความรู้เฉพาะโดเมนของปัญหาที่อยู่ในมือถูกฉีดเข้าไปในแบบจำลอง แบบจำลองของประเภทนี้ไม่จำกัด เพื่อสร้างแบบจำลองการพึ่งพาโดยตรงระหว่างสถานะที่ซ่อนอยู่และการสังเกตที่เกี่ยวข้อง ค่อนข้าง คุณลักษณะของการสังเกตใกล้เคียง การรวมกันของการสังเกตที่เกี่ยวข้องและการสังเกตใกล้เคียง หรือในความเป็นจริงของการสังเกตโดยพลการที่ระยะใด ๆ จากสถานะที่ซ่อนอยู่สามารถรวมอยู่ในกระบวนการ ใช้เพื่อกำหนดค่าของสถานะที่ซ่อนอยู่ นอกจากนี้ ไม่มีความจำเป็นสำหรับคุณสมบัติเหล่านี้ที่จะต้องเป็นอิสระทางสถิติของกันและกัน แล้วแต่กรณีหากใช้คุณลักษณะดังกล่าวในแบบจำลองเชิงกำเนิด สุดท้าย สามารถใช้คุณลักษณะตามอำเภอใจเหนือคู่ของสถานะที่ซ่อนอยู่ที่อยู่ติดกันได้ แทนที่จะใช้ความน่าจะเป็นของการเปลี่ยนแปลงอย่างง่าย ข้อเสียของแบบจำลองดังกล่าวคือ: (1) ประเภทของการกระจายก่อนหน้าที่สามารถวางไว้ในสถานะที่ซ่อนอยู่นั้นมีข้อจำกัดอย่างมาก; (2) เป็นไปไม่ได้ที่จะทำนายความน่าจะเป็นที่จะเห็นการสังเกตโดยพลการ ข้อจำกัดประการที่สองนี้มักไม่เป็นปัญหาในทางปฏิบัติ เนื่องจากการใช้ HMM ทั่วไปจำนวนมากไม่ต้องการความน่าจะเป็นในการทำนายดังกล่าว

ความแตกต่างของแบบจำลองการเลือกปฏิบัติที่อธิบายไว้ก่อนหน้านี้คือฟิลด์สุ่มแบบมีเงื่อนไขแบบสายโซ่เชิงเส้น สิ่งนี้ใช้โมเดลกราฟิกแบบไม่มีทิศทาง (หรือที่เรียกว่าฟิลด์สุ่มของ Markov ) แทนที่จะใช้โมเดลกราฟิกแบบกำกับของ MEMM และโมเดลที่คล้ายกัน ข้อได้เปรียบของแบบจำลองประเภทนี้คือไม่ได้รับผลกระทบจากสิ่งที่เรียกว่า ปัญหา อคติของฉลากของ MEMM และด้วยเหตุนี้อาจทำให้การคาดคะเนแม่นยำยิ่งขึ้น ข้อเสียคือการฝึกอบรมอาจช้ากว่าของ MEMM

อีกตัวแปรหนึ่งคือโมเดลมาร์กอฟที่ซ่อนอยู่แบบแฟกทอเรียลซึ่งช่วยให้การสังเกตเพียงครั้งเดียวถูกกำหนดเงื่อนไขกับตัวแปรซ่อนที่สอดคล้องกันของชุดของโซ่มาร์คอฟอิสระ แทนที่จะเป็นโซ่มาร์คอฟเดี่ยว มันเทียบเท่ากับ HMM เดียวด้วยรัฐ (สมมติว่ามีสถานะสำหรับแต่ละห่วงโซ่) ดังนั้นการเรียนรู้ในรูปแบบดังกล่าวจึงเป็นเรื่องยาก: สำหรับลำดับความยาวอัลกอริทึม Viterbi ที่ตรงไปตรงมามีความซับซ้อน. เพื่อหาทางออกที่แน่นอน อาจใช้อัลกอริทึมแผนผังจุดเชื่อมต่อ แต่ผลลัพธ์ที่ได้คือความซับซ้อน ในทางปฏิบัติ อาจใช้เทคนิคโดยประมาณ เช่น วิธีการแปรผัน [41]

แบบจำลองข้างต้นทั้งหมดสามารถขยายได้เพื่อให้มีการพึ่งพาที่ห่างไกลมากขึ้นระหว่างรัฐที่ซ่อนอยู่ เช่น การอนุญาตให้รัฐหนึ่ง ๆ นั้นขึ้นอยู่กับสองหรือสามรัฐก่อนหน้ามากกว่ารัฐเดียวก่อนหน้านี้ กล่าวคือความน่าจะเป็นของการเปลี่ยนแปลงจะขยายครอบคลุมชุดของสถานะที่อยู่ติดกันสามหรือสี่สถานะ (หรือโดยทั่วไปรัฐที่อยู่ติดกัน) ข้อเสียของโมเดลดังกล่าวคืออัลกอริทึมการเขียนโปรแกรมแบบไดนามิกสำหรับการฝึกอบรมมีเวลาทำงานสำหรับรัฐที่อยู่ติดกันและการสังเกตทั้งหมด (เช่น ความยาว-มาร์คอฟเชน).

ส่วนขยายล่าสุดอีกอันหนึ่งคือแบบจำลองของ triplet Markov , [42]ซึ่งมีการเพิ่มกระบวนการพื้นฐานเสริมเพื่อจำลองข้อมูลเฉพาะบางอย่าง มีการเสนอโมเดลนี้หลายรุ่น เราควรกล่าวถึงความเชื่อมโยงที่น่าสนใจที่ถูกสร้างขึ้นระหว่างทฤษฎีของหลักฐานและแบบจำลองของมาร์คอฟแฝดสาม[43]ซึ่งช่วยให้สามารถหลอมรวมข้อมูลในบริบทของมาร์กอฟ[44]และเพื่อจำลองข้อมูลที่ไม่อยู่กับที่ [45] [46]โปรดทราบว่ามีการเสนอกลยุทธ์การหลอมรวมข้อมูลแบบหลายสตรีมทางเลือกในเอกสารล่าสุด เช่น[47]

ในที่สุด เหตุผลที่แตกต่างกันในการแก้ไขปัญหาการสร้างแบบจำลองข้อมูลที่ไม่อยู่กับที่โดยใช้แบบจำลองมาร์คอฟที่ซ่อนอยู่ได้รับการเสนอแนะในปี 2555 [48]ประกอบด้วยการใช้โครงข่ายประสาทเทียมขนาดเล็ก (RNN) โดยเฉพาะเครือข่ายอ่างเก็บน้ำ[49]เพื่อจับภาพ วิวัฒนาการของการเปลี่ยนแปลงทางโลกในข้อมูลที่สังเกตได้ ข้อมูลนี้เข้ารหัสในรูปแบบของเวกเตอร์มิติสูง ซึ่งใช้เป็นตัวแปรปรับสภาพความน่าจะเป็นของการเปลี่ยนสถานะ HMM ภายใต้การตั้งค่าดังกล่าว ในที่สุดเราก็ได้รับ HMM ที่ไม่อยู่กับที่ซึ่งมีความน่าจะเป็นในการเปลี่ยนแปลงซึ่งพัฒนาขึ้นเมื่อเวลาผ่านไปในลักษณะที่อนุมานจากตัวข้อมูลเอง ซึ่งตรงข้ามกับแบบจำลองเฉพาะกิจที่ไม่สมจริงของวิวัฒนาการทางโลก

แบบจำลองที่เหมาะสมในบริบทของข้อมูลตามยาวมีชื่อว่าแบบจำลองมาร์คอฟแฝง [50]เวอร์ชันพื้นฐานของโมเดลนี้ได้รับการขยายให้รวมถึงตัวแปรร่วมแต่ละรายการ เอฟเฟ็กต์แบบสุ่ม และเพื่อจำลองโครงสร้างข้อมูลที่ซับซ้อนมากขึ้น เช่น ข้อมูลหลายระดับ ภาพรวมที่สมบูรณ์ของแบบจำลองมาร์กอฟที่ซ่อนเร้น พร้อมความสนใจเป็นพิเศษต่อสมมติฐานของแบบจำลองและการใช้งานจริงมีอยู่ใน[51]

ดูเพิ่มเติม

อ้างอิง

  1. ^ "Google Scholar" .
  2. แธด สตาร์เนอร์, อเล็กซ์ เพนต์แลนด์ การรู้จำภาพภาษามืออเมริกันแบบเรียลไทม์จากวิดีโอโดยใช้โมเดลมาร์คอฟที่ซ่อนอยู่ วิทยานิพนธ์ปริญญาโท, MIT, ก.พ. 2538, สาขาวิชามีเดียอาตส์
  3. ^ บี. ปาร์โด และ ดับบลิว. เบอร์มิงแฮม. แบบฟอร์มการสร้างแบบจำลองสำหรับ การติดตามการแสดงดนตรีทางออนไลน์ เก็บถาวรเมื่อ 2012-02-06 ที่ Wayback Machine AAAI-05 Proc., กรกฎาคม 2548
  4. ^ Satish L, Gururaj BI (เมษายน 2546) "การใช้แบบจำลองมาร์คอฟที่ซ่อนอยู่สำหรับการจำแนกรูปแบบการปล่อยบางส่วน ". ธุรกรรม IEEE เกี่ยวกับไดอิ เล็กทริกและฉนวนไฟฟ้า
  5. อรรถ ลี่, เอ็น; สตีเฟนส์, เอ็ม (ธันวาคม 2546) "การสร้างแบบจำลองความไม่สมดุล ของการเชื่อมโยงและการระบุฮอตสปอตการรวมตัวกันอีกครั้งโดยใช้ข้อมูลโพลีมอร์ฟิซึ่มนิวคลีโอไทด์เดี่ยว" พันธุศาสตร์ 165 (4): 2213–33. ดอย : 10.1093/genetics/165.4.2213 . PMC 1462870 . PMID 14704198 .  
  6. ^ เอิร์นส์, เจสัน; เคลลิส, มาโนลิส (มีนาคม 2555). "ChromHMM: การค้นหาและระบุสถานะของโครมาตินโดยอัตโนมัติ" . วิธีธรรมชาติ 9 (3): 215–216. ดอย : 10.1038/nmeth.1906 . PMC 3577932 . PMID 22373907 .  
  7. ^ Lawrence R. Rabiner (กุมภาพันธ์ 1989) "บทแนะนำเกี่ยวกับ Hidden Markov Models และแอปพลิเคชันที่เลือกในการรู้จำเสียง" (PDF) . การ ดำเนินการของ IEEE 77 (2): 257–286. CiteSeerX 10.1.1.381.3454 . ดอย : 10.1109/5.18626 . S2CID 13618539 .    [1]
  8. ^ นิวเบิร์ก แอล. (2552). "สถิติข้อผิดพลาดของโมเดล Markov ที่ซ่อนอยู่และผลลัพธ์ของโมเดล Boltzmann ที่ซ่อนอยู่ " BMC ชีวสารสนเทศ . 10 : 212. ดอย : 10.1186/1471-2105-10-212 . PMC 2722652 . PMID 19589158 .   เปิดการเข้าถึง
  9. ซิโปส, ไอ. โรแบร์ต. การสุ่มตัวอย่าง MCMC แบบแบ่งชั้นขนานของ AR-HMM สำหรับการทำนายอนุกรมเวลาสุ่ม ใน: การประชุมวิชาการ Stochastic Modeling Techniques ครั้งที่ 4 และ Data Analysis International Conference with Demographics Workshop (SMTDA2016), หน้า 295-306. วัลเลตตา, 2559. PDF
  10. ^ Chatzis, Sotirios P.; Kosmopoulos, Dimitrios I. (2011). "ระเบียบวิธีแบบเบย์ที่ผันแปรสำหรับโมเดลมาร์คอฟที่ซ่อนอยู่โดยใช้ส่วนผสมของ Student's-t" (PDF ) การจดจำรูปแบบ 44 (2): 295–306. รหัส : 2011PatRe..44..295C . CiteSeerX 10.1.1.629.6275 . ดอย : 10.1016/j.patcog.2010.09.001 .  
  11. ซิโปส, โรแบร์ต ฉัน; เซฟเฟอร์, อัตติลา ; Levendovszky, János (2559). "การเพิ่มประสิทธิภาพแบบคู่ขนานของพอร์ตโฟลิโอแบบกระจายด้วย AR-HMM" เศรษฐศาสตร์เชิงคำนวณ . 49 (4): 563–578. ดอย : 10.1007/s10614-016-9579-y . S2CID 61882456 _ 
  12. เปโตรปูลอส, อนาสตาซิออส; แชตซิส, โซติริออส พี; Xanthopoulos, Stylianos (2559) "ระบบการจัดอันดับเครดิตองค์กรใหม่ตามโมเดลมาร์คอฟที่ซ่อนอยู่ของนักเรียน" ระบบผู้เชี่ยวชาญพร้อมแอปพลิเคชัน 53 : 87–105. ดอย : 10.1016/j.eswa.2016.01.015 .
  13. นิโคไล, คริสโตเฟอร์ (2013). "การแก้ปัญหาจลนพลศาสตร์ของช่องไอออนด้วยซอฟต์แวร์ QuB" บท วิจารณ์และจดหมายทางชีวฟิสิกส์ 8 (3n04): 191–211. ดอย : 10.1142/S1793048013300053 .
  14. ฮิกกินส์, คาเมรอน; วีแดร์, ดิเอโก้ ; คอลลิ่ง, นิลส์ ; หลิว, หยุนเจ๋อ; เบเรนส์, ทิม ; วูลริช, มาร์ก (2565). "การวิเคราะห์รูปแบบหลายตัวแปรที่แก้ไขเชิงพื้นที่สำหรับ M/EEG " การ ทำแผนที่สมองมนุษย์ 43 (10): 3062–3085. ดอย : 10.1002/hbm.25835 . PMC 9188977 . PMID 35302683 .  
  15. โดมิงโก, เปโดร (2015). อัลกอริทึมต้นแบบ: ภารกิจของ Ultimate Learning Machine จะสร้างโลกของเราขึ้นมาใหม่ได้อย่างไร หนังสือพื้นฐาน. หน้า 37 . ไอเอสบีเอ็น 9780465061921.
  16. คุนดู, อัมลัน, ยางเหอ และปารัมเวียร์ บาห์ล "การรู้จำคำที่เขียนด้วยลายมือ: ลำดับที่หนึ่งและลำดับที่สองที่ซ่อนอยู่ตามแนวทางของโมเดลมาร์คอฟ[ ลิงก์ที่ตายแล้ว ] " การจดจำรูปแบบ 22.3 (1989): 283-297.
  17. ^ สติกเลอร์ เจ; ซีเกลอร์ เอฟ; กีเซเกะ, อ.; เกบฮาร์ดท์, JCM; รีฟ, ม. (2011). "เครือข่ายการพับที่ซับซ้อนของโมเลกุล Calmodulin เดี่ยว" วิทยาศาสตร์ . 334 (6055): 512–516. Bibcode : 2554วิทย์...334..512ส . ดอย : 10.1126/science.1207598 . PMID 22034433 . S2CID 5502662 _  
  18. อรรถ บลาเซียก, เอส.; รังวัล, เอช. (2554). "ตัวแปรแบบจำลองมาร์คอฟที่ซ่อนอยู่สำหรับการจำแนกประเภทลำดับ" IJCAI Proceedings-การประชุมร่วมระหว่างประเทศว่าด้วยปัญญาประดิษฐ์ 22 : 1192.
  19. ^ วงศ์, ว.; แสตมป์ ม. (2549). "ตามล่าหาเครื่องยนต์แปรสภาพ". วารสารไวรัสวิทยาคอมพิวเตอร์ . 2 (3): 211–229. ดอย : 10.1007/s11416-006-0028-7 . S2CID 8116065 _ 
  20. ^ วงศ์, พ. -C.; ชาน, ต. -ม.; เป็ง ซี; ลี่, วาย.; จาง Z. (2013). "การอธิบายแรงจูงใจของ DNA โดยใช้การเผยแพร่ความเชื่อ" . การวิจัยกรดนิวคลีอิก 41 (16):e153. ดอย : 10.1093/nar/gkt574 . PMC 3763557 . PMID 23814189 .  
  21. อรรถ ชาห์, ชาลิน; ดูบี, อภิเชค เค.; รีฟ, จอห์น (2019-05-17). "การปรับปรุงการมัลติเพล็กซ์ด้วยแสงด้วยบาร์โค้ด DNA ชั่วขณะ" ACS ชีววิทยาสังเคราะห์ . 8 (5): 1100–1111. ดอย : 10.1021/acssynbio.9b00010 . PMID 30951289 . S2CID 96448257 _  
  22. อรรถ ชาห์, ชาลิน; ดูบี, อภิเชค เค.; รีฟ, จอห์น (2019-04-10). "การเขียนโปรแกรมบาร์โค้ด DNA ชั่วขณะสำหรับลายนิ้วมือโมเลกุลเดี่ยว". ตัวอักษรนาโน . 19 (4): 2668–2673. Bibcode : 2019NanoL..19.2668S . ดอย : 10.1021/acs.nanolett.9b00590 . ISSN 1530-6984 . PMID 30896178 . S2CID 84841635 _   
  23. ^ "ChromHMM: การค้นพบสถานะของโครมาตินและลักษณะเฉพาะ " compbio.mit.edu _ สืบค้นเมื่อ2018-08-01
  24. เอล ซาร์วี, เฟราซ (พฤษภาคม 2554). "การสร้างแบบจำลองและการพยากรณ์วิวัฒนาการของความชอบเมื่อเวลาผ่านไป: แบบจำลองมาร์คอฟของพฤติกรรมการเดินทางที่ซ่อนอยู่" arXiv : 1707.09133 [ stat.AP ].
  25. ^ Morf, H. (ก.พ. 2541). "แบบจำลองการฉายรังสีดวงอาทิตย์แบบสองสถานะสุ่ม (STSIM)" พลังงานแสงอาทิตย์ . 62 (2): 101–112. Bibcode : 1998SoEn...62..101M . ดอย : 10.1016/S0038-092X(98)00004-8 .
  26. ^ มุนคัมมาร์, เจ; Widén, J. (ส.ค. 2018). "แนวทางการผสมผสานการกระจายความน่าจะเป็นแบบ Markov-chain ไปยังดัชนีฟ้าใส" พลังงานแสงอาทิตย์ . 170 : 174–183. Bibcode : 2018SoEn..170..174M . ดอย : 10.1016/j.solener.2018.05.055 . S2CID 125867684 . 
  27. ^ มุนคัมมาร์, เจ; Widén, J. (ต.ค. 2018). "แบบจำลองการกระจายแบบโซ่มาร์คอฟแบบ N-state ของดัชนีฟ้าใส" พลังงานแสงอาทิตย์ . 173 : 487–495. Bibcode : 2018SoEn..173..487M . ดอย : 10.1016/j.solener.2018.07.056 . S2CID 125538244 . 
  28. อรรถ Baum เลอ; เพทรี ที. (2509). "การอนุมานทางสถิติสำหรับฟังก์ชันความน่าจะเป็นของโซ่จำกัดสถานะมาร์คอฟ" . พงศาวดารของคณิตศาสตร์สถิติ . 37 (6): 1554–1563. ดอย : 10.1214/aoms/1177699147 .
  29. อรรถ Baum เลอ; อีกอน, เจน. (2510). "ความไม่เท่าเทียมกันกับการประยุกต์ใช้ในการประมาณค่าทางสถิติสำหรับฟังก์ชันความน่าจะเป็นของกระบวนการมาร์คอฟและแบบจำลองสำหรับระบบนิเวศน์" . ประกาศของ American Mathematical Society 73 (3): 360. ดอย : 10.1090/S0002-9904-1967-11751-8 . ซบล0157.11101 . 
  30. อรรถ Baum เลอ; ขาย GR (1968) "การแปลงการเติบโตสำหรับฟังก์ชันบนท่อร่วม" . วารสารคณิตศาสตร์แปซิฟิก . 27 (2): 211–227. ดอย : 10.2140/pjm.1968.27.211 . สืบค้นเมื่อ28 พฤศจิกายน 2554 .
  31. อรรถ บาม เลโอ ; เพทรี, ต.; Soules, G.; ไวส์, เอ็น. (1970). "เทคนิคการขยายสูงสุดที่เกิดขึ้นในการวิเคราะห์ทางสถิติของฟังก์ชันความน่าจะเป็นของ Markov Chains" . พงศาวดารของคณิตศาสตร์สถิติ . 41 (1): 164–171. ดอย : 10.1214/aoms/1177697196 . จสท. 2239727 . นาย0287613 . ซบล0188.49603 .   
  32. ^ บอม LE (1972) "ความไม่เท่าเทียมกันและเทคนิคการเพิ่มค่าสูงสุดที่เกี่ยวข้องในการประมาณค่าทางสถิติของฟังก์ชันความน่าจะเป็นของกระบวนการมาร์กอฟ" ความไม่เท่าเทียมกัน . 3 : 1–8.
  33. ^ เบเกอร์ เจ. (1975). "ระบบ DRAGON—ภาพรวม" ธุรกรรม IEEE เกี่ยวกับการประมวลผลเสียง เสียงพูด และสัญญาณ 23 : 24–29. ดอย : 10.1109/TASSP.1975.1162650 .
  34. อรรถ เจลิเนก เอฟ; บาห์ล, ล.; เมอร์เซอร์ อาร์. (1975). "การออกแบบตัวถอดรหัสสถิติทางภาษาสำหรับการรู้จำเสียงพูดต่อเนื่อง". ธุรกรรม IEEE บนทฤษฎีสารสนเทศ 21 (3): 250. ดอย : 10.1109/TIT.1975.1055384 .
  35. ^ เซิงตงหวาง ; เอ็ม. แจ็ค; ย. อาริกิ(2533). โมเดลมาร์คอฟที่ซ่อนอยู่สำหรับการรู้จำเสียง สำนักพิมพ์มหาวิทยาลัยเอดินเบอระ ไอเอสบีเอ็น 978-0-7486-0162-2.
  36. ^ เซิงตงหวาง ; อเล็กซ์ อะเซโร่ ; เซียวเหวินฮอน (2544). การประมวลผลภาษาพูด ศิษย์ฮอลล์. ไอเอสบีเอ็น 978-0-13-022616-7.
  37. ^ เอ็ม. บิชอปและอี. ทอมป์สัน (1986). "การจัดตำแหน่งที่เป็นไปได้สูงสุดของลำดับดีเอ็นเอ" วารสารอณูชีววิทยา . 190 (2): 159–165. ดอย : 10.1016/0022-2836(86)90289-5 . PMID 3641921 .  (ต้องสมัครสมาชิก) การเข้าถึงแบบปิด
  38. เดอร์บิน, ริชาร์ด เอ็ม. ; เอ็ดดี้, ฌอน อาร์ ; โครกห์, แอนเดอร์ส ; มิทชิสัน, แกรม (1998). การวิเคราะห์ลำดับเบสทางชีวภาพ: แบบจำลองความน่าจะเป็นของโปรตีนและกรดนิวคลีอิก (ฉบับที่ 1) เคมบริดจ์ นิวยอร์ก: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์ . ไอเอสบีเอ็น 0-521-62971-3. OCLC593254083  . _
  39. บีล, แมทธิว เจ., ซูบิน กาห์รามานี และคาร์ล เอ็ดเวิร์ด ราสมุสเซน "แบบจำลองมาร์คอฟที่ซ่อนอยู่อย่างไม่มีที่สิ้นสุด" ความก้าวหน้าในระบบประมวลผลข้อมูลประสาท 14 (2545): 577-584.
  40. ^ Teh, Yee Whye และคณะ "กระบวนการไดริชเล็ตแบบลำดับชั้น" วารสารสมาคมสถิติแห่งอเมริกา 101.476 (2549)
  41. ฆฮรามานี, ซูบิน ; จอร์แดน, ไมเคิล ไอ. (1997). "โมเดลมาร์คอฟแฟกทอเรียลซ่อนเร้น" . การเรียน รู้ของเครื่อง 29 (2/3): 245–273. ดอย : 10.1023/A:1007425814087 .
  42. ^ Pieczynski, วอยเชียค (2545). "มาร์คอฟ ทริปเปิ้ล เชนส์" . รายงานทางคณิตศาสตร์ . 335 (3): 275–278. ดอย : 10.1016/S1631-073X(02)02462-7 .
  43. ^ Pieczynski, วอยเชียค (2550). "ห่วงโซ่มาร์คอฟมัลติเซ็นเซอร์และทฤษฎีหลักฐาน" . วารสารระหว่างประเทศของเหตุผลโดยประมาณ . 45 : 1–16. ดอย : 10.1016/j.ijar.2006.05.001 .
  44. ^ บูดาเรนและคณะ เก็บถาวรเมื่อ 2014-03-11 ที่ Wayback Machine , MY Boudaren, E. Monfrini, W. Pieczynski และ A. Aissani, Dempster-Shafer ฟิวชั่นของสัญญาณมัลติเซนเซอร์ในบริบทของ Markovian ที่ไม่อยู่กับที่ วารสาร EURASIP เกี่ยวกับความก้าวหน้าในการประมวลผลสัญญาณ ฉบับที่ 134 , 2555.
  45. ^ แลนชานติน และคณะ , P. Lanchantin และ W. Pieczynski, การคืนค่าแบบไม่มีผู้ดูแลของ Markov chain ที่ไม่อยู่กับที่ที่ซ่อนอยู่โดยใช้หลักฐานแสดงหลักฐาน, ธุรกรรม IEEE ในการประมวลผลสัญญาณ, ฉบับที่ 53 ฉบับที่ 8 หน้า 3091-3098 2548
  46. ^ บูดาเรนและคณะ , MY Boudaren, E. Monfrini และ W. Pieczynski, การแบ่งส่วนข้อมูลแบบไม่ต่อเนื่องแบบสุ่มแบบไม่มีผู้ดูแลซึ่งซ่อนอยู่ด้วยการแจกแจงสัญญาณรบกวนแบบสลับ, จดหมายประมวลผลสัญญาณ IEEE, ฉบับที่ 19 ฉบับที่ 10 หน้า 619-622 ตุลาคม 2555
  47. Sotirios P. Chatzis, Dimitrios Kosmopoulos, "Visual Workflow Recognition using a Variational Bayesian Treatment of Multistream Fused Hidden Markov Models," IEEE Transactions on Circuits and Systems for Video Technology, vol. 22 ไม่ 7 หน้า 1076-1086 กรกฎาคม 2555
  48. ^ Chatzis, Sotirios P.; เดมิริส, ยานนิส (2555). "แบบจำลองมาร์คอฟซ่อนเร้นที่ขับเคลื่อนด้วยอ่างเก็บน้ำ" การจดจำรูปแบบ 45 (11): 3985–3996. รหัส : 2012PatRe..45.3985C . ดอย : 10.1016/j.patcog.2012.04.018 . hdl : 10044/1/12611 .
  49. M. Lukosevicius, H. Jaeger (2009) Reservoir Computing Approach to Recurrent Neural Network Training, Computer Science Review 3 : 127–149.
  50. ^ วิกกินส์ LM (1973) การวิเคราะห์แผง: โมเดลความน่าจะเป็นแฝงสำหรับกระบวนการทัศนคติและพฤติกรรม อัมสเตอร์ดัม: เอลส์เวียร์.
  51. อรรถ บาร์โตลุชชี เอฟ; Farcomeni, A.; เพนโนนี เอฟ. (2013). โมเดลมาร์คอฟแฝงสำหรับข้อมูลตามยาว โบคา ราตัน: แชปแมนและฮอลล์/ซีอาร์ซี ไอเอสบีเอ็น 978-14-3981-708-7.

ลิงค์ภายนอก

แนวคิด