การวิเคราะห์เชิงทำนาย

จากวิกิพีเดีย สารานุกรมเสรี
ข้ามไปที่การนำทาง ข้ามไปที่การค้นหา

การวิเคราะห์เชิงคาดการณ์ครอบคลุมเทคนิคทางสถิติ ที่หลากหลายตั้งแต่ การทำเหมืองข้อมูลการสร้างแบบจำลองการคาดการณ์และการเรียนรู้ของเครื่องที่วิเคราะห์ข้อเท็จจริงในปัจจุบันและในอดีตเพื่อคาดการณ์เกี่ยวกับเหตุการณ์ในอนาคตหรือเหตุการณ์ที่ไม่ทราบ [1]

ในธุรกิจ โมเดลการคาดการณ์ใช้ประโยชน์จากรูปแบบที่พบในข้อมูลในอดีตและธุรกรรมเพื่อระบุความเสี่ยงและโอกาส โมเดลจะรวบรวมความสัมพันธ์ระหว่างปัจจัยต่างๆ เพื่อให้สามารถประเมินความเสี่ยงหรือศักยภาพที่เกี่ยวข้องกับชุดเงื่อนไขเฉพาะ ซึ่งเป็นแนวทางในการตัดสินใจสำหรับธุรกรรมของผู้สมัคร [2]

การกำหนดผลการทำงานของแนวทางทางเทคนิคเหล่านี้คือการวิเคราะห์เชิงคาดการณ์จะให้คะแนนเชิงคาดการณ์ (ความน่าจะเป็น) สำหรับแต่ละบุคคล (ลูกค้า พนักงาน ผู้ป่วยทางการแพทย์ SKU ของผลิตภัณฑ์ ยานพาหนะ ส่วนประกอบ เครื่องจักร หรือหน่วยขององค์กรอื่นๆ) เพื่อกำหนด แจ้ง หรือมีอิทธิพลต่อกระบวนการขององค์กรที่เกี่ยวข้องกับบุคคลจำนวนมาก เช่น ในด้านการตลาด การประเมินความเสี่ยงด้านเครดิต การตรวจจับการฉ้อโกง การผลิต การดูแลสุขภาพ และการดำเนินงานของรัฐบาล รวมถึงการบังคับใช้กฎหมาย

คำจำกัดความ

การวิเคราะห์เชิงคาดการณ์คือชุดของเทคโนโลยีทางธุรกิจ (BI) ที่เปิดเผยความสัมพันธ์และรูปแบบภายในข้อมูลปริมาณมากที่สามารถใช้ในการทำนายพฤติกรรมและเหตุการณ์ ไม่เหมือนเทคโนโลยี BI อื่นๆ การวิเคราะห์เชิงคาดการณ์เป็นการมองไปข้างหน้า โดยใช้เหตุการณ์ในอดีตเพื่อคาดการณ์อนาคต [3]เทคนิคการวิเคราะห์เชิงสถิติเชิงคาดการณ์ ได้แก่การสร้างแบบจำลองข้อมูล การเรียน รู้ ของเครื่องAI อัลกอริธึมการเรียนรู้ เชิงลึกและการทำเหมืองข้อมูล. บ่อยครั้งที่เหตุการณ์ที่น่าสนใจที่ไม่รู้จักเกิดขึ้นในอนาคต แต่การวิเคราะห์เชิงคาดการณ์สามารถนำไปใช้กับสิ่งที่ไม่ทราบประเภทใดก็ได้ ไม่ว่าจะเป็นในอดีต ปัจจุบัน หรืออนาคต ตัวอย่างเช่น การระบุตัวผู้ต้องสงสัยหลังจากก่ออาชญากรรม หรือการฉ้อโกงบัตรเครดิตที่เกิดขึ้น [4]แก่นของการวิเคราะห์เชิงคาดการณ์อาศัยการจับความสัมพันธ์ระหว่างตัวแปรอธิบายและตัวแปรที่คาดการณ์จากเหตุการณ์ในอดีต และใช้ประโยชน์จากพวกมันเพื่อทำนายผลลัพธ์ที่ไม่ทราบ อย่างไรก็ตาม สิ่งสำคัญที่ควรทราบคือความถูกต้องและความสามารถในการใช้งานของผลลัพธ์จะขึ้นอยู่กับระดับของการวิเคราะห์ข้อมูลและคุณภาพของสมมติฐานอย่างมาก [1]

การวิเคราะห์เชิงคาดการณ์มักจะถูกกำหนดเป็นการทำนายในระดับที่ละเอียดมากขึ้น กล่าวคือ การสร้างคะแนนการคาดการณ์ (ความน่าจะเป็น) สำหรับแต่ละองค์ประกอบขององค์กร สิ่งนี้ทำให้แตกต่างจากการคาดการณ์ ตัวอย่างเช่น "การวิเคราะห์เชิงคาดการณ์—เทคโนโลยีที่เรียนรู้จากประสบการณ์ (ข้อมูล) เพื่อทำนายพฤติกรรมในอนาคตของแต่ละบุคคลเพื่อขับเคลื่อนการตัดสินใจที่ดีขึ้น" [5]ในระบบอุตสาหกรรมในอนาคต คุณค่าของการวิเคราะห์เชิงคาดการณ์คือการคาดการณ์และป้องกันปัญหาที่อาจเกิดขึ้นเพื่อให้เกิดการแยกย่อยที่เกือบเป็นศูนย์ และรวมเข้ากับการวิเคราะห์ที่กำหนดล่วงหน้าเพื่อการเพิ่มประสิทธิภาพการตัดสินใจ [6]

ข้อมูลขนาดใหญ่

แม้ว่าจะไม่มีคำจำกัดความสากลของข้อมูลขนาดใหญ่ แต่ส่วนใหญ่หมายถึงการประมวลผลจุดข้อมูลชุดใหญ่เพื่อให้ได้ผลิตภัณฑ์สำเร็จรูป เมื่อชุดข้อมูลมีขนาดใหญ่เกินกว่าจะวิเคราะห์โดยใช้เทคนิคการวิเคราะห์แบบเดิม การวิเคราะห์ข้อมูลขนาดใหญ่ก็เข้ามามีบทบาท อย่างไรก็ตาม ขนาดไม่ใช่ปัจจัยเดียวที่กำหนดข้อมูลขนาดใหญ่

คำจำกัดความของข้อมูลขนาดใหญ่ของ Gartner มีประโยชน์ในการอธิบายคุณสมบัติการกำหนดของข้อมูลขนาดใหญ่: "ข้อมูลขนาดใหญ่เป็นสินทรัพย์ข้อมูลที่มีปริมาณมาก ความเร็วสูง และ/หรือมีความหลากหลายสูง ซึ่งต้องการรูปแบบการประมวลผลข้อมูลที่สร้างสรรค์และคุ้มค่า ซึ่งช่วยให้เข้าใจได้ดีขึ้น การตัดสินใจและกระบวนการอัตโนมัติ” [7]คุณสมบัติเหล่านี้บางครั้งเรียกว่า 3 Vs ของข้อมูลขนาดใหญ่

เมื่อเราพูดถึงปริมาณข้อมูล ให้คิดถึงขนาดของข้อมูล ไม่มีเกณฑ์สากลสำหรับขนาดที่กำหนดว่าชุดข้อมูล "ใหญ่" หรือไม่ เนื่องจากขนาดสัมพันธ์กัน ข้อมูลขนาดเทราไบต์ถือได้ว่าเป็นข้อมูลขนาดใหญ่สำหรับบริษัทแห่งหนึ่ง ในขณะที่อีกบริษัทหนึ่งใช้หน่วยจัดเก็บข้อมูลที่ใหญ่ขึ้นเป็นเกณฑ์สำหรับข้อมูลขนาดใหญ่ เช่น เพตาไบต์หรือเอ็กซาไบต์

ความเร็วของข้อมูลหมายถึงความเร็วของข้อมูลและระยะเวลาที่ใช้ในการสร้าง จัดเก็บ และวิเคราะห์ข้อมูล การประมวลผลแบบกลุ่มมักใช้ในการประมวลผลกลุ่มข้อมูลขนาดใหญ่ แต่ต้องใช้เวลามากและจะมีประโยชน์ก็ต่อเมื่อการตัดสินใจประสบความสำเร็จโดยไม่ต้องประมวลผลข้อมูลอย่างรวดเร็ว อย่างไรก็ตาม ตลาดในยุคปัจจุบันต้องการการประมวลผลแบบเรียลไทม์เพื่อการตัดสินใจที่มีประสิทธิภาพและประสบความสำเร็จในสภาพแวดล้อมที่หลากหลายและแข่งขันได้

นอกจากนี้ยังมีข้อมูลหลายประเภท ซึ่ง Gartner มีความหมายตามความหลากหลาย ข้อมูลสามารถมีโครงสร้าง กึ่งโครงสร้าง หรือไม่มีโครงสร้างก็ได้ “ข้อมูลที่มีโครงสร้างเป็นข้อมูลที่ยึดตามแบบจำลองข้อมูลที่กำหนดไว้ล่วงหน้า ดังนั้นจึงง่ายต่อการวิเคราะห์” [7]ข้อมูลที่มีโครงสร้างโดยทั่วไปมีแถวและคอลัมน์ที่สามารถจัดเรียงและค้นหาด้วยเทคนิคพื้นฐาน สเปรดชีตและฐานข้อมูลเชิงสัมพันธ์เป็นตัวอย่างทั่วไปของข้อมูลที่มีโครงสร้าง ข้อมูลที่ไม่มีโครงสร้างโดยพื้นฐานแล้วเป็นสิ่งที่ตรงกันข้ามกับข้อมูลที่มีโครงสร้างตรงที่จะไม่ยึดติดกับโมเดลข้อมูลที่กำหนดไว้ล่วงหน้า และไม่มีคอลัมน์หรือแถวที่จะช่วยจัดระเบียบข้อมูล ทำให้ข้อมูลที่ไม่มีโครงสร้างเข้าใจยากกว่าข้อมูลที่มีโครงสร้าง ซึ่งสามารถประมวลผลได้อย่างง่ายดายโดยใช้โปรแกรมดั้งเดิม เช่น Excel และ SQL ตัวอย่างข้อมูลที่ไม่มีโครงสร้าง ได้แก่ อีเมล ไฟล์ PDF และการค้นหาโดย Google การจัดเก็บและประมวลผลข้อมูลที่ไม่มีโครงสร้างทำได้ง่ายขึ้นมากในช่วงไม่กี่ปีที่ผ่านมา เนื่องจากโปรแกรมอย่าง Power BI และ Tableau

“ข้อมูลกึ่งโครงสร้างอยู่ระหว่างข้อมูลที่มีโครงสร้างและไม่มีโครงสร้าง ไม่ยึดติดกับโครงสร้างข้อมูลที่เป็นทางการ แต่มีแท็กและเครื่องหมายอื่น ๆ เพื่อจัดระเบียบข้อมูล” [8]หมวดหมู่ข้อมูลกึ่งโครงสร้างนั้นวิเคราะห์ได้ง่ายกว่าข้อมูลที่ไม่มีโครงสร้างมาก เครื่องมือข้อมูลขนาดใหญ่จำนวนมากสามารถ 'อ่าน' และประมวลผลข้อมูลรูปแบบกึ่งโครงสร้าง เช่น ไฟล์ XML หรือ JSON

ปริมาณ ความหลากหลาย และความเร็วของข้อมูลขนาดใหญ่ทำให้เกิดความท้าทายในการจับภาพ จัดเก็บ ค้นหา แบ่งปัน วิเคราะห์ และแสดงภาพ ตัวอย่างของแหล่งข้อมูลขนาดใหญ่ ได้แก่บันทึกการใช้เว็บ , RFID , ข้อมูลเซ็นเซอร์ , โซเชียลเน็ตเวิร์ก , การทำดัชนีการค้นหาทางอินเทอร์เน็ต , บันทึกรายละเอียดการโทร , การเฝ้าระวังทางทหาร และข้อมูลที่ซับซ้อนในด้านดาราศาสตร์ ชีวธรณีเคมี จีโนมิกส์ และวิทยาศาสตร์บรรยากาศ ด้วยความก้าวหน้าทางเทคโนโลยีในฮาร์ดแวร์คอมพิวเตอร์—ซีพียูที่เร็วขึ้น หน่วยความจำที่ถูกกว่า และ สถาปัตยกรรม MPP—และเทคโนโลยีใหม่ เช่นHadoop , MapReduceและ การวิเคราะห์ ในฐานข้อมูลและข้อความสำหรับการประมวลผลข้อมูลขนาดใหญ่ ตอนนี้มีความเป็นไปได้ที่จะรวบรวม วิเคราะห์ และขุดข้อมูลที่มีโครงสร้างและไม่มีโครงสร้าง จำนวนมาก สำหรับข้อมูลเชิงลึกใหม่ นอกจากนี้ยังสามารถเรียกใช้อัลกอริธึมการคาดการณ์บนข้อมูลสตรีมมิงได้อีกด้วย ทุกวันนี้ การสำรวจข้อมูลขนาดใหญ่และการใช้การวิเคราะห์เชิงคาดการณ์นั้นอยู่ไม่ไกลเกินเอื้อมขององค์กรต่างๆ มากกว่าที่เคย และมีการเสนอวิธีการใหม่ๆ ที่สามารถจัดการชุดข้อมูลดังกล่าวได้

เทคนิคการวิเคราะห์

วิธีการและเทคนิคที่ใช้ในการวิเคราะห์เชิงคาดการณ์สามารถจัดกลุ่มกว้างๆ ได้เป็นเทคนิคการถดถอยและเทคนิคการเรียนรู้ของเครื่อง

การเรียนรู้ของเครื่อง

การเรียนรู้ด้วยเครื่องสามารถกำหนดได้ว่าเป็นความสามารถของเครื่องในการเรียนรู้แล้วเลียนแบบพฤติกรรมของมนุษย์ที่ต้องใช้สติปัญญา ซึ่งทำได้โดยใช้ปัญญาประดิษฐ์ อัลกอริธึม และแบบจำลอง [9]

Autoregressive Integrated Moving Average (ARIMA)

โมเดล ARIMA เป็นตัวอย่างทั่วไปของแบบจำลองอนุกรมเวลา โมเดลเหล่านี้ใช้การถดถอยอัตโนมัติ ซึ่งหมายความว่าโมเดลสามารถติดตั้งซอฟต์แวร์การถดถอยที่จะใช้การเรียนรู้ของเครื่องเพื่อทำการวิเคราะห์การถดถอยและการปรับให้เรียบเป็นส่วนใหญ่ ทราบว่าแบบจำลอง ARIMA ไม่มีแนวโน้มโดยรวม แต่มีการแปรผันรอบค่าเฉลี่ยที่มีแอมพลิจูดคงที่ ส่งผลให้รูปแบบเวลาใกล้เคียงกันทางสถิติ ด้วยวิธีนี้ ตัวแปรจะถูกวิเคราะห์และกรองข้อมูลเพื่อให้เข้าใจและคาดการณ์ค่าในอนาคตได้ดีขึ้น [10] [11]

ตัวอย่างหนึ่งของวิธีการ ARIMA คือ โมเดลการปรับให้เรียบแบบเอ็กซ์โปเนนเชียล การปรับให้เรียบแบบเอ็กซ์โปเนนเชียลคำนึงถึงความแตกต่างในความสำคัญระหว่างชุดข้อมูลที่เก่ากว่าและใหม่กว่า เนื่องจากข้อมูลล่าสุดมีความถูกต้องและมีค่ามากกว่าในการทำนายค่าในอนาคต เพื่อให้บรรลุสิ่งนี้ เลขชี้กำลังถูกใช้เพื่อให้ชุดข้อมูลที่ใหม่กว่ามีน้ำหนักในการคำนวณมากกว่าชุดที่เก่ากว่า (12)

รุ่นอนุกรมเวลา

โมเดลอนุกรมเวลาเป็นส่วนย่อยของแมชชีนเลิร์นนิงที่ใช้อนุกรมเวลาเพื่อทำความเข้าใจและคาดการณ์ข้อมูลโดยใช้ค่าในอดีต อนุกรมเวลาคือลำดับของค่าของตัวแปรในช่วงเวลาที่เว้นระยะเท่ากัน เช่น ปีหรือไตรมาสในการใช้งานทางธุรกิจ [13]เพื่อให้บรรลุสิ่งนี้ ข้อมูลจะต้องเรียบหรือต้องลบความแปรปรวนแบบสุ่มของข้อมูลเพื่อแสดงแนวโน้มในข้อมูล มีหลายวิธีในการบรรลุสิ่งนี้

Single Moving Average

วิธีการเฉลี่ยเคลื่อนที่เดี่ยวใช้ชุดข้อมูลในอดีตที่มีตัวเลขน้อยกว่าและเล็กกว่าเพื่อลดข้อผิดพลาดที่เกี่ยวข้องกับการหาค่าเฉลี่ยเดียว ทำให้เป็นค่าเฉลี่ยที่แม่นยำมากกว่าการหาค่าเฉลี่ยของชุดข้อมูลทั้งหมด [14]

ค่าเฉลี่ยเคลื่อนที่ศูนย์กลาง

วิธีค่าเฉลี่ยเคลื่อนที่แบบกึ่งกลางใช้ข้อมูลที่พบในวิธีค่าเฉลี่ยเคลื่อนที่เดียวโดยใช้ค่าเฉลี่ยของชุดข้อมูลที่มีตัวเลขมัธยฐาน อย่างไรก็ตาม เนื่องจากชุดข้อมูลเลขมัธยฐานคำนวณได้ยากด้วยชุดข้อมูลเลขคู่ วิธีนี้จึงทำงานได้ดีกับชุดข้อมูลเลขคี่มากกว่าคู่ [15]

การสร้างแบบจำลองเชิงทำนาย

Predictive Modeling เป็นเทคนิคทางสถิติที่ใช้ในการทำนายพฤติกรรมในอนาคต ใช้แบบจำลองการคาดการณ์เพื่อวิเคราะห์ความสัมพันธ์ระหว่างหน่วยเฉพาะในกลุ่มตัวอย่างที่กำหนดและคุณลักษณะอย่างน้อยหนึ่งอย่างของหน่วย วัตถุประสงค์ของแบบจำลองเหล่านี้คือเพื่อประเมินความเป็นไปได้ที่หน่วยในอีกตัวอย่างหนึ่งจะแสดงรูปแบบเดียวกัน โซลูชันแบบจำลองเชิงทำนายถือได้ว่าเป็นเทคโนโลยีการทำเหมืองข้อมูลประเภทหนึ่ง แบบจำลองสามารถวิเคราะห์ข้อมูลทั้งในอดีตและปัจจุบัน และสร้างแบบจำลองเพื่อคาดการณ์ผลลัพธ์ที่อาจเกิดขึ้นในอนาคต [8]

โดยไม่คำนึงถึงวิธีการที่ใช้ โดยทั่วไป กระบวนการสร้างแบบจำลองการทำนายเกี่ยวข้องกับขั้นตอนเดียวกัน ประการแรก จำเป็นต้องกำหนดวัตถุประสงค์ของโครงการและผลลัพธ์ที่ต้องการ และแปลสิ่งเหล่านี้เป็นวัตถุประสงค์และภารกิจการวิเคราะห์เชิงคาดการณ์ จากนั้น วิเคราะห์ข้อมูลต้นทางเพื่อกำหนดข้อมูลที่เหมาะสมที่สุดและแนวทางการสร้างแบบจำลอง (แบบจำลองมีประโยชน์พอๆ กับข้อมูลที่เกี่ยวข้องที่ใช้ในการสร้างเท่านั้น) เลือกและแปลงข้อมูลเพื่อสร้างแบบจำลอง สร้างและทดสอบแบบจำลองเพื่อประเมินว่าถูกต้องหรือไม่ และจะสามารถบรรลุเป้าหมายและตัวชี้วัดของโครงการได้ นำผลลัพธ์ของโมเดลไปใช้กับกระบวนการทางธุรกิจที่เหมาะสม (การระบุรูปแบบในข้อมูลไม่ได้หมายความว่าธุรกิจจะเข้าใจวิธีใช้ประโยชน์หรือใช้ประโยชน์จากมัน) หลังจากนั้น[3]

เทคนิคการถดถอย

โดยทั่วไป การวิเคราะห์การถดถอยจะใช้ข้อมูลโครงสร้างควบคู่ไปกับค่าในอดีตของตัวแปรอิสระและความสัมพันธ์ระหว่างตัวแปรเหล่านี้กับตัวแปรตามเพื่อสร้างการทำนาย [10]

การถดถอยเชิงเส้น

ในการถดถอยเชิงเส้น พล็อตถูกสร้างขึ้นด้วยค่าก่อนหน้าของตัวแปรตามที่กำหนดบนแกน Y และตัวแปรอิสระที่กำลังวิเคราะห์อยู่บนแกน X จากนั้นเส้นการถดถอยจะถูกสร้างขึ้นโดยโปรแกรมทางสถิติที่แสดงถึงความสัมพันธ์ระหว่างตัวแปรอิสระและตัวแปรตามซึ่งสามารถใช้เพื่อทำนายค่าของตัวแปรตามตามตัวแปรอิสระเท่านั้น ด้วยเส้นถดถอย โปรแกรมยังแสดงสมการสกัดกั้นความชันของเส้นตรง ซึ่งรวมถึงการเพิ่มระยะความผิดพลาดของการถดถอย โดยที่ค่าของระยะข้อผิดพลาดสูง แบบจำลองการถดถอยจะแม่นยำน้อยกว่า เพื่อลดค่าของระยะข้อผิดพลาด ตัวแปรอิสระอื่นๆ จะถูกนำไปใช้กับแบบจำลอง และการวิเคราะห์ที่คล้ายกันจะดำเนินการกับตัวแปรอิสระเหล่านี้[10] [16]

แอปพลิเคชัน

การทบทวนเชิงวิเคราะห์และความคาดหวังตามเงื่อนไขในการตรวจสอบ

ลักษณะสำคัญของการตรวจสอบรวมถึงการทบทวนเชิงวิเคราะห์ ในการตรวจสอบเชิงวิเคราะห์ ความสมเหตุสมผลของยอดคงเหลือในบัญชีที่รายงานจะถูกตรวจสอบ ผู้ตรวจสอบทำกระบวนการนี้ให้สำเร็จผ่านการสร้างแบบจำลองการคาดการณ์เพื่อสร้างการคาดการณ์ที่เรียกว่าความคาดหวังแบบมีเงื่อนไขของเครื่องชั่งที่กำลังตรวจสอบโดยใช้วิธีค่าเฉลี่ยเคลื่อนที่แบบถดถอยอัตโนมัติ (ARIMA) และวิธีการวิเคราะห์การถดถอยทั่วไป[10]โดยเฉพาะอย่างยิ่งผ่านวิธีทางสถิติสำหรับการทบทวนเชิงวิเคราะห์ (STAR) [17]

วิธี ARIMA สำหรับการตรวจทานเชิงวิเคราะห์ใช้การวิเคราะห์อนุกรมเวลากับยอดคงเหลือที่ตรวจสอบแล้วในอดีต เพื่อสร้างความคาดหวังแบบมีเงื่อนไข ความคาดหวังตามเงื่อนไขเหล่านี้จะถูกเปรียบเทียบกับยอดดุลจริงที่รายงานในบัญชีที่ตรวจสอบแล้ว เพื่อกำหนดว่ายอดดุลที่รายงานใกล้เคียงกับความคาดหวังมากน้อยเพียงใด หากยอดดุลที่รายงานใกล้เคียงกับที่คาดไว้ บัญชีจะไม่ได้รับการตรวจสอบเพิ่มเติม หากยอดดุลที่รายงานแตกต่างจากที่คาดการณ์ไว้มาก อาจมีความเป็นไปได้สูงที่จะเกิดข้อผิดพลาดทางบัญชีที่มีสาระสำคัญและมีการตรวจสอบเพิ่มเติม [17]

วิธีการวิเคราะห์การถดถอยถูกปรับใช้ในลักษณะเดียวกัน ยกเว้นโมเดลการถดถอยที่ใช้ถือว่ามีตัวแปรอิสระเพียงตัวเดียว สาระสำคัญของตัวแปรอิสระที่ส่งผลต่อยอดคงเหลือในบัญชีที่ตรวจสอบแล้วจะกำหนดโดยใช้ยอดคงเหลือในบัญชีที่ผ่านมาพร้อมกับข้อมูลโครงสร้างปัจจุบัน [10]สาระสำคัญคือความสำคัญของตัวแปรอิสระในความสัมพันธ์กับตัวแปรตาม[18 ] ในกรณีนี้ ตัวแปรตามคือยอดเงินในบัญชี ด้วยเหตุนี้ ตัวแปรอิสระที่สำคัญที่สุดจึงถูกใช้เพื่อสร้างความคาดหวังแบบมีเงื่อนไข และคล้ายกับวิธี ARIMA จากนั้นจึงเปรียบเทียบความคาดหวังแบบมีเงื่อนไขกับยอดคงเหลือในบัญชีที่รายงาน และการตัดสินใจขึ้นอยู่กับความใกล้เคียงของยอดคงเหลือทั้งสอง [10]

วิธี STAR ทำงานโดยใช้การวิเคราะห์การถดถอย และแบ่งออกเป็นสองวิธี วิธีแรกคือวิธียอดคงเหลือรายเดือนของ STAR และการคาดการณ์แบบมีเงื่อนไขและการวิเคราะห์การถดถอยที่ใช้นั้นเชื่อมโยงกับการตรวจสอบหนึ่งเดือน อีกวิธีหนึ่งคือวิธีสมดุลประจำปีของ STAR ซึ่งเกิดขึ้นในสเกลที่ใหญ่ขึ้นโดยพิจารณาจากความคาดหวังแบบมีเงื่อนไขและการวิเคราะห์การถดถอยในหนึ่งปีที่ได้รับการตรวจสอบ นอกจากความแตกต่างของเวลาที่ได้รับการตรวจสอบแล้ว ทั้งสองวิธียังดำเนินการเหมือนกัน โดยการเปรียบเทียบยอดคงเหลือที่คาดหวังและที่รายงานเพื่อกำหนดว่าบัญชีใดที่จะตรวจสอบเพิ่มเติม [17]

มูลค่าทางธุรกิจ

ขณะที่เราก้าวเข้าสู่โลกแห่งความก้าวหน้าทางเทคโนโลยีที่มีการสร้างและจัดเก็บข้อมูลดิจิทัลมากขึ้นเรื่อยๆ ธุรกิจต่างๆ กำลังมองหาวิธีที่จะใช้ประโยชน์จากโอกาสนี้และใช้ข้อมูลนี้เพื่อช่วยสร้างผลกำไร การวิเคราะห์เชิงคาดการณ์สามารถใช้และสามารถให้ประโยชน์มากมายแก่ธุรกิจที่หลากหลาย รวมถึงบริษัทจัดการสินทรัพย์ บริษัทประกันภัย บริษัทสื่อสาร และบริษัทอื่นๆ อีกมากมาย ในการศึกษาที่ดำเนินการโดย IDC Analyze the Future Dan Vasset และ Henry D. Morris อธิบายว่าบริษัทจัดการสินทรัพย์ใช้การวิเคราะห์เชิงคาดการณ์เพื่อพัฒนาแคมเปญการตลาดที่ดีขึ้นได้อย่างไร พวกเขาเปลี่ยนจากแนวทางการตลาดแบบมวลชนมาเป็นแนวทางที่เน้นลูกค้าเป็นศูนย์กลาง ซึ่งแทนที่จะส่งข้อเสนอเดียวกันให้กับลูกค้าแต่ละราย พวกเขาจะปรับเปลี่ยนข้อเสนอแต่ละข้อเสนอตามลูกค้าของตน การวิเคราะห์เชิงคาดการณ์ใช้เพื่อคาดการณ์แนวโน้มที่ลูกค้าที่เป็นไปได้จะยอมรับข้อเสนอส่วนบุคคล เนื่องจากแคมเปญการตลาดและการวิเคราะห์เชิงคาดการณ์ อัตราการตอบรับของบริษัทจึงพุ่งสูงขึ้น โดยมีผู้ตอบรับข้อเสนอส่วนบุคคลมากกว่าถึงสามเท่า(19)

ความก้าวหน้าทางเทคโนโลยีในการวิเคราะห์เชิงคาดการณ์ได้เพิ่มมูลค่าให้กับบริษัท ความก้าวหน้าทางเทคโนโลยีอย่างหนึ่งคือคอมพิวเตอร์ที่ทรงพลังกว่า และด้วยการวิเคราะห์เชิงคาดการณ์นี้ ก็สามารถที่จะสร้างการคาดการณ์บนชุดข้อมูลขนาดใหญ่ได้รวดเร็วยิ่งขึ้น ด้วยพลังการประมวลผลที่เพิ่มขึ้นทำให้มีข้อมูลและแอปพลิเคชันมากขึ้น ซึ่งหมายถึงอาร์เรย์อินพุตที่กว้างขึ้นเพื่อใช้กับการวิเคราะห์เชิงคาดการณ์ ความก้าวหน้าทางเทคโนโลยีอีกประการหนึ่งรวมถึงอินเทอร์เฟซที่เป็นมิตรต่อผู้ใช้มากขึ้น ทำให้มีอุปสรรคในการเข้าใช้งานน้อยลงและมีการฝึกอบรมที่กว้างขวางน้อยกว่าที่จำเป็นสำหรับพนักงานในการใช้ซอฟต์แวร์และแอพพลิเคชั่นอย่างมีประสิทธิภาพ จากความก้าวหน้าเหล่านี้ บริษัทจำนวนมากขึ้นใช้การวิเคราะห์เชิงคาดการณ์และเห็นประโยชน์ในด้านประสิทธิภาพและประสิทธิผลของพนักงาน ตลอดจนผลกำไร (20)

การคาดการณ์กระแสเงินสด

แบบจำลองตัวแปรเดียวและหลายตัวแปรของ ARIMAสามารถใช้ในการคาดการณ์กระแสเงินสด ในอนาคตของบริษัท โดยใช้สมการและการคำนวณตามค่าในอดีตของปัจจัยบางอย่างที่ส่งผลต่อกระแสเงินสด เมื่อใช้การวิเคราะห์อนุกรมเวลา ค่าของปัจจัยเหล่านี้สามารถวิเคราะห์และคาดการณ์เพื่อคาดการณ์กระแสเงินสดในอนาคตของบริษัทได้ สำหรับแบบจำลองที่ไม่แปรผัน มูลค่าในอดีตของกระแสเงินสดเป็นปัจจัยเดียวที่ใช้ในการทำนาย ในขณะเดียวกัน ตัวแบบหลายตัวแปรใช้ปัจจัยหลายอย่างที่เกี่ยวข้องกับข้อมูลคงค้าง เช่น รายได้จากการดำเนินงานก่อนค่าเสื่อมราคา (21)

อีกรูปแบบหนึ่งที่ใช้ในการทำนายกระแสเงินสดได้รับการพัฒนาในปี 2541 และเป็นที่รู้จักในชื่อแบบจำลอง Dechow, Kothari และ Watts หรือ DKW (1998) DKW (1998) ใช้การวิเคราะห์การถดถอยเพื่อกำหนดความสัมพันธ์ระหว่างตัวแปรหลายตัวและกระแสเงินสด ด้วยวิธีนี้ แบบจำลองพบว่าการเปลี่ยนแปลงของกระแสเงินสดและเงินคงค้างมีความสัมพันธ์เชิงลบ โดยเฉพาะอย่างยิ่งผ่านรายได้ปัจจุบัน และการใช้ความสัมพันธ์นี้คาดการณ์กระแสเงินสดสำหรับงวดถัดไป แบบจำลอง DKW (1998) ได้มาจากความสัมพันธ์นี้ผ่านความสัมพันธ์ของเงินคงค้างและกระแสเงินสดกับบัญชีเจ้าหนี้และลูกหนี้ ควบคู่ไปกับสินค้าคงคลัง [22]

การคุ้มครองเด็ก

หน่วยงานสวัสดิการเด็กบางแห่งได้เริ่มใช้การวิเคราะห์เชิงคาดการณ์เพื่อระบุกรณีที่มีความเสี่ยงสูง [23]ตัวอย่างเช่น ในฮิลส์โบโรเคาน์ตี้ ฟลอริดาหน่วยงานสวัสดิการเด็กใช้เครื่องมือสร้างแบบจำลองการคาดการณ์ได้ป้องกันการเสียชีวิตของเด็กที่เกี่ยวข้องกับการล่วงละเมิดในประชากรเป้าหมาย [24]

ระบบสนับสนุนการตัดสินใจทางคลินิก

การวิเคราะห์เชิงคาดการณ์พบว่ามีการใช้ในการดูแลสุขภาพในการพิจารณาว่าผู้ป่วยรายใดมีความเสี่ยงต่อภาวะต่างๆ เช่น เบาหวาน โรคหอบหืด หรือโรคหัวใจ นอกจากนี้ระบบสนับสนุนการตัดสินใจทางคลินิก ที่ซับซ้อน ยังรวมการวิเคราะห์เชิงคาดการณ์เพื่อสนับสนุนการตัดสินใจทางการแพทย์

การศึกษาความผิดปกติของระบบประสาท ในปี 2559 เป็นตัวอย่างที่มีประสิทธิภาพของแพลตฟอร์ม CDS เพื่อวินิจฉัย ติดตาม คาดการณ์ และติดตามความก้าวหน้าของโรคพาร์กินสัน [25]

การทำนายผลการตัดสินใจทางกฎหมาย

การทำนายผลการพิจารณาคดีสามารถทำได้โดยโปรแกรม AI โปรแกรมเหล่านี้สามารถใช้เป็นเครื่องมือช่วยเหลือสำหรับวิชาชีพในอุตสาหกรรมนี้ได้ [26] [27]

ผลงาน ผลิตภัณฑ์ หรือการคาดการณ์ระดับเศรษฐกิจ

บ่อยครั้งจุดเน้นของการวิเคราะห์ไม่ใช่ผู้บริโภคแต่อยู่ที่ผลิตภัณฑ์ พอร์ตโฟลิโอ บริษัท อุตสาหกรรม หรือแม้แต่เศรษฐกิจ ตัวอย่างเช่น ผู้ค้าปลีกอาจสนใจที่จะคาดการณ์ความต้องการระดับร้านค้าเพื่อวัตถุประสงค์ในการจัดการสินค้าคงคลัง หรือคณะกรรมการธนาคารกลางสหรัฐอาจสนใจคาดการณ์อัตราการว่างงานในปีหน้า ปัญหาประเภทนี้สามารถแก้ไขได้ด้วยการวิเคราะห์เชิงคาดการณ์โดยใช้เทคนิคอนุกรมเวลา (ดูด้านล่าง) พวกเขายังสามารถแก้ไขได้ด้วยวิธีการเรียนรู้ด้วยเครื่องซึ่งเปลี่ยนอนุกรมเวลาดั้งเดิมเป็นพื้นที่เวกเตอร์ของคุณลักษณะ โดยที่อัลกอริธึมการเรียนรู้จะค้นหารูปแบบที่มีพลังการทำนาย [28] [29]

การรับประกันภัย

ธุรกิจจำนวนมากต้องคำนึงถึงความเสี่ยงจากบริการที่แตกต่างกันและกำหนดต้นทุนที่จำเป็นเพื่อให้ครอบคลุมความเสี่ยง การวิเคราะห์เชิงคาดการณ์สามารถช่วยรับประกันปริมาณเหล่านี้โดยคาดการณ์โอกาสของการเจ็บป่วย การผิด สัญญา การล้มละลายฯลฯ การวิเคราะห์เชิงคาดการณ์สามารถปรับปรุงกระบวนการได้มาซึ่งลูกค้าโดยคาดการณ์พฤติกรรมความเสี่ยงในอนาคตของลูกค้าโดยใช้ข้อมูลระดับแอปพลิเคชัน การวิเคราะห์เชิงคาดการณ์ในรูปแบบของคะแนนเครดิตได้ลดระยะเวลาที่ใช้ในการอนุมัติเงินกู้ โดยเฉพาะอย่างยิ่งในตลาดสินเชื่อที่อยู่อาศัย การวิเคราะห์เชิงคาดการณ์ที่เหมาะสมสามารถนำไปสู่การตัดสินใจด้านราคาที่เหมาะสม ซึ่งจะช่วยลดความเสี่ยงในการผิดนัดในอนาคต การวิเคราะห์เชิงคาดการณ์สามารถใช้เพื่อลดอันตรายทางศีลธรรมและป้องกันไม่ให้เกิดอุบัติเหตุได้[30]

ดูเพิ่มเติม

อ้างอิง

  1. ^ a b "จะทำนายหรือไม่ทำนาย" . mccoy-partners.com . สืบค้นเมื่อ2022-05-05 .
  2. ^ โคเกอร์, แฟรงค์ (2014). Pulse: การทำความเข้าใจสัญญาณสำคัญของธุรกิจของคุณ (ฉบับที่ 1 ) Bellevue, WA: สำนักพิมพ์ Ambient Light น. 30, 39, 42, เพิ่มเติม ISBN 978-0-9893086-0-1.
  3. อรรถเป็น บี เอคเคอร์สัน, เวย์น, ดับเบิลยู (2007). "การวิเคราะห์เชิงคาดการณ์ การขยายมูลค่าการลงทุนในคลังข้อมูลของคุณ" (PDF )
  4. ฟินเลย์, สตีเวน (2014). การวิเคราะห์เชิงทำนาย การขุดข้อมูล และบิ๊กดาต้า ตำนาน ความเข้าใจผิด และวิธีการ (ฉบับที่ 1) . เบซิงสโต๊ค: พัลเกรฟ มักมิลลัน. หน้า 237. ISBN 978-1137379276.
  5. ซีเกล, เอริค (2013). การวิเคราะห์เชิงทำนาย: พลังในการทำนายว่าใครจะคลิก ซื้อ โกหก หรือตาย (ฉบับที่ 1 ) ไวลีย์. ISBN 978-1-1183-5685-2.
  6. ^ สปาเลก, ซิเวริน (2019). การวิเคราะห์ข้อมูลในการจัดการโครงการ เทย์เลอร์ แอนด์ ฟรานซิส กรุ๊ป, LLC
  7. อรรถเป็น "คำจำกัดความของข้อมูลขนาดใหญ่ - อภิธานศัพท์เทคโนโลยีสารสนเทศของกา ร์ตเนอ ร์ " การ์ ทเนอร์. สืบค้นเมื่อ2022-04-28 .
  8. อรรถเป็น แมคคาร์ธี ริชาร์ด; แม็กคาร์ธี, แมรี่; เซกกุชชี่, เวนดี้ (2021). การใช้ Predictive Analytics: ค้นหาคุณค่าในข้อมูล สปริงเกอร์.
  9. ^ "การเรียนรู้ของเครื่อง อธิบาย" . เอ็มไอที สโลน สืบค้นเมื่อ2022-05-06 .
  10. อรรถa b c d e f Kinney, William R. (1978) "ARIMA และการถดถอยในการทบทวนเชิงวิเคราะห์: การทดสอบเชิงประจักษ์" . สอบบัญชี . 53 (1): 48–60. ISSN 0001-4826 . 
  11. ^ "แนะนำโมเดล ARIMA" . people.duke.edu . สืบค้นเมื่อ2022-05-06 .
  12. ^ "6.4.3. การทำให้เรียบแบบเอ็กซ์โพเนนเชียลคืออะไร" . www.itl.nist.gov . สืบค้นเมื่อ2022-05-06 .
  13. ^ "6.4.1. คำจำกัดความ การใช้งาน และเทคนิค" . www.itl.nist.gov . สืบค้นเมื่อ2022-05-06 .
  14. ^ "6.4.2.1. Single Moving Average" . www.itl.nist.gov . สืบค้นเมื่อ2022-05-06 .
  15. ^ "6.4.2.2. Centered Moving Average" . www.itl.nist.gov . สืบค้นเมื่อ2022-05-06 .
  16. ^ "การถดถอยเชิงเส้น" . www.stat.yale.edu ครับ สืบค้นเมื่อ2022-05-06 .
  17. อรรถเป็น c คินนีย์ วิลเลียม อาร์.; แซลมอน, เจอรัลด์ แอล. (1982). การวิเคราะห์การถดถอยในการตรวจสอบ: การเปรียบเทียบกฎการสอบสวนทางเลือก วารสารวิจัยการบัญชี . 20 (2): 350–366. ดอย : 10.2307/2490745 . ISSN 0021-8456 . 
  18. ไพรซ์วอเตอร์เฮาส์คูเปอร์ส. "สาระสำคัญในการตรวจสอบ" . พี ดับเบิลยูซี. สืบค้นเมื่อ2022-05-03 .
  19. ^ เวสเซท แดน; มอร์ริส, เฮนรี่ ดี. (มิถุนายน 2554). "มูลค่าธุรกิจของ Predictive Analytics" (PDF ) เอกสารไวท์เปเปอร์ : 1–3.
  20. ^ สโตน พอล (เมษายน 2550) "แนะนำ Predictive Analytics: โอกาส" .
  21. ^ Lorek เคนเนธเอส.; วิลลิงเจอร์, จี. ลี (1996). "รูปแบบการทำนายอนุกรมเวลาหลายตัวแปรสำหรับข้อมูลกระแสเงินสด " สอบบัญชี . 71 (1): 81–102. ISSN 0001-4826 . 
  22. ^ บาร์ธ แมรี่ อี.; อัด, โดนัลด์พี.; เนลสัน, คาเรน เค. (2001). "เงินคงค้างและการทำนายกระแสเงินสดในอนาคต" . สอบบัญชี . 76 (1): 27–58. ISSN 0001-4826 . 
  23. ^ ปฏิรูป อุปถัมภ์ (2016-02-03). "กลยุทธ์ใหม่ ที่ค้างชำระมานานในการวัดความเสี่ยงด้านสวัสดิการเด็ก" . สำนักพิมพ์. สืบค้นเมื่อ2022-05-03 .
  24. ^ "ในขอบเขตของเรา: ยุทธศาสตร์ระดับชาติเพื่อขจัดการทารุณกรรมเด็กและละเลยการเสียชีวิต" (PDF ) คณะกรรมการเพื่อขจัดการทารุณกรรมเด็กและละเลยการเสียชีวิต 2559.
  25. ไดนอฟ, อีโว ดี.; เฮฟเนอร์, เบ็น; ถัง, หมิง; กลัสมัน, กุสตาโว; ชาร์ด ไคล์; ดาร์ซี, ไมค์; มทุรี, ราวี; ปะ, จูดี้; สปิโน, เคธี่; เคสเซลแมน, คาร์ล; ฟอสเตอร์, เอียน (2016-08-05). "การวิเคราะห์ข้อมูลขนาดใหญ่เชิงพยากรณ์: การศึกษาโรคพาร์กินสันโดยใช้การสังเกตขนาดใหญ่ ซับซ้อน ต่างกัน ไม่สอดคล้องกัน หลายแหล่ง และไม่สมบูรณ์ " กรุณาหนึ่ง 11 (8): e0157077. ดอย : 10.1371/journal.pone.0157077 . ISSN 1932-6203 . พี เอ็มซี 4975403 . PMID 27494614 .   
  26. อเลทราส, นิโคลอส; Tsarapatsanis, ดิมิทริออส; เพรโอซิก-ปิเอโตร, แดเนียล; ลัมโปส, วาซิลิโอส (2016). "การทำนายคำตัดสินของศาลสิทธิมนุษยชนยุโรป: มุมมองการประมวลผลภาษาธรรมชาติ" .
  27. ^ UCL (2016-10-24). “AI ทำนายผลการพิจารณาคดีสิทธิมนุษยชน” . ข่าวยูซีแอสืบค้นเมื่อ2022-05-03 .
  28. ^ Dhar, วสันต์ (6 พฤษภาคม 2554). "การคาดการณ์ในตลาดการเงิน: กรณีการแยกย่อยเล็กน้อย" . ธุรกรรม ACM บนระบบและเทคโนโลยีอัจฉริยะ 2 (3): 1–22. ดอย : 10.1145/1961189.1961191 . ISSN 2157-6904 . 
  29. ^ ดาร์ วสันต์; โจว, ดาชิน; พระครูฟอสเตอร์ (2000-10-01). "ค้นพบรูปแบบที่น่าสนใจสำหรับการตัดสินใจลงทุนกับ GLOWER ◯-A Genetic Learner ที่ซ้อนทับกับการลดเอนโทรปี " การทำเหมืองข้อมูลและการค้นพบความรู้ 4 (4): 251-180. ดอย : 10.1023/A:1009848126475 . ISSN 1384-5810 . 
  30. มอนต์เซอร์รัต, กิลเลน; เซโวลินี, อัลเบร์โต (พฤศจิกายน 2021) "การใช้การวิเคราะห์ความเสี่ยงเพื่อป้องกันอุบัติเหตุก่อนที่จะเกิดขึ้น – อนาคตของการประกันภัย " วารสารการเปลี่ยนแปลงทางการเงิน .

อ่านเพิ่มเติม

  • อาเกรสตี, อลัน (2002). การวิเคราะห์ข้อมูลตาม หมวดหมู่ โฮโบเก้น: John Wiley and Sons ISBN 0-471-36093-7.
  • ค็อกเกอฮอลล์, สตีเฟน, เดวีส์, จอห์น, โจนส์, โรเจอร์ และ Schutzer, Daniel, "Intelligent Security Systems" ในFreedman, Roy S., Flein, Robert A. และ Lederman, Jess, Editors (1995) ปัญญาประดิษฐ์ในตลาดทุน ชิคาโก: เออร์วิน ISBN 1-55738-811-3. {{cite book}}: |author=มีชื่อสามัญ ( ช่วยเหลือ )CS1 maint: multiple names: authors list (link)
  • แอล. เดฟรอย; ล. Györfi; จี. ลูโกซี (1996). ทฤษฎีความน่าจะเป็นของการรู้จำรูปแบบ นิวยอร์ก: สปริงเกอร์-แวร์แล็ก. ISBN 9781461207115.
  • เอนเดอร์ส, วอลเตอร์ (2004). เศรษฐมิติอนุกรมเวลาประยุกต์ โฮโบเก้น: John Wiley and Sons ISBN 0-521-83919-X.
  • กรีน, วิลเลียม (2012). การวิเคราะห์ทางเศรษฐมิติ ครั้งที่ 7 . ลอนดอน: Prentice Hall ISBN 978-0-13-139538-1.
  • Guidère, มาติเยอ; ฮาวเวิร์ด เอ็น, ช. อาร์กามอน (2009). การวิเคราะห์ภาษาที่หลากหลายเพื่อการต่อต้านการก่อการร้าย เบอร์ลิน ลอนดอน นิวยอร์ก: Springer-Verlag ISBN 978-3-642-01140-5.
  • มิทเชลล์, ทอม (1997). การเรียนรู้ ของเครื่อง นิวยอร์ก: McGraw-Hill ISBN 0-07-042807-7.
  • ซีเกล, เอริค (2016). การวิเคราะห์เชิงทำนาย: พลังในการทำนายว่าใครจะคลิก ซื้อ โกหก หรือตาย จอห์น ไวลีย์. ISBN 978-1119145677.
  • ทูคีย์, จอห์น (1977). การวิเคราะห์ข้อมูล เชิงสำรวจ นิวยอร์ก: แอดดิสัน-เวสลีย์ ISBN 0-201-07616-0.
  • ฟินเลย์, สตีเวน (2014). การวิเคราะห์เชิงทำนาย การขุดข้อมูล และบิ๊กดาต้า ตำนาน ความเข้าใจผิด และวิธีการ เบซิงสโต๊ค: พัลเกรฟ มักมิลลัน. ISBN 978-1-137-37927-6.
  • โคเกอร์, แฟรงค์ (2014). Pulse: การทำความเข้าใจสัญญาณสำคัญของธุรกิจของคุณ Bellevue, WA: สำนักพิมพ์ Ambient Light ISBN 978-0-9893086-0-1.