การทดสอบสมมติฐาน Hypothesis Testing
MATLAB BKK CENTER
Hypothesis Testing หรือการทดสอบสมมติฐาน คือกระบวนการที่เราใช้ข้อมูลจาก Sample มาตัดสินเกี่ยวกับ Population โดยจะตัดสินเลือกสมมติฐาน (Hypothesis) ที่มีข้อมูลสนับสนุนว่าน่าจะถูกต้องมากกว่า
การจะบอกว่า
“ สิ่งที่เราสงสัยนั้น…จริงหรือไม่ ?
หลักการ : Null Hypothesis, H0 (H null หรือ H ตามด้วยศูนย์) : เป็นแนวความคิดเดิมที่เป็นที่ยอมรับในปัจจุบันมักจะมีเครื่องหมาย = อยู่ อาจจะเป็น =,>=,<=
Alternative Hypothesis, Ha: แนวความคิดใหม่ ที่เราอยากจะนำเสนอ หรือบางทีก็เรียกว่า Research Hypothesisมีเครื่องหมาย ตรงข้ามกับ H0
ตัวอย่างกรณีศึกษา Hypothesis test
บริษัทแห่งหนึ่งผลิตยานอนหลับซึ่งในขวดควรจะมีปริมาตรเฉลี่ย 200 cc ขึ้นไป ทางลูกค้าที่อยากซื้อยานอนหลับไปใช้เกิดความสงสัยว่ายานอนหลับในขวดอาจมีการใส่ตัวยาน้อยเกินไป (กลัวคนกินแล้วจะไม่หลับ) จึงมีสมมติฐานดังนี้
H0 : µ >= 200 cc (ถ้ามันมากกว่าหรือเท่ากับ 200 แสดงว่ายานอนหลับเยอะดี ok)
Ha: µ < 200 cc (ที่กำลังอยากจะทดสอบ ว่ามันน้อยกว่า 200 ป่าว ซึ่งจะต้องใส่ให้ตรงข้ามกับ H0)
หลักการคิดก็คือ
- ให้เรา Assume ว่า Null Hypothesis (H0) นั้นถูกต้องไว้ก่อน
- ดูหลักฐานจากการทดสอบของเรา เช่น จากข้อมูลที่สุ่มออกมา
ถ้าสิ่งที่สุ่มออกมามีความน่าจะเป็นต่ำ แสดงว่า H0 ไม่จริง (Reject H0) ดังนั้นเราก็จะหันมาสนับสนุน Ha แทน
ถ้าสิ่งที่สุ่มออกมามีความน่าจะเป็นไม่ต่ำ แสดงว่าเราไม่สามารถปฏิเสธ H0 ได้ (Fail to Reject H0)
แล้วเราจะดูยังไงว่าหลักฐานจากการทดสอบของเรามีความน่าจะเป็นต่ำ ??
H0 : µ >= 200 cc (ถ้ามันมากกว่าหรือเท่ากับ 200 แสดงว่ายานอนหลับเยอะดี ok)
Ha: µ < 200 cc (ที่กำลังอยากจะทดสอบ ว่ามันน้อยกว่า 200 ป่าว ซึ่งจะต้องใส่ให้ตรงข้ามกับ H0)
p-value จะแปลว่า ความน่าจะเป็น ที่เราสุ่มแล้วได้ค่าเฉลี่ย น้อยกว่าหรือเท่ากับ 180 เมื่อ assume ว่า Ho จริง นั่นเอง (ซึ่ง P-Value ออกมาเป็นความน่าจะเป็น “น้อยกว่า”หรือเท่ากับ 180 เพราะ Ha ทิศทางคือ”น้อยกว่า” ซึ่งเป็นทิศทางที่โต้แย้ง H0 นั่นเอง)
ระดับนัยสำคัญนั้นมีอยู่หลายระดับ ซึ่งเรียกว่า significant level (α) เราจึงควรกำหนดเอาไว้ก่อนว่า เราจะคิด p-Value เทียบกับเกณ์ significant level (α) ที่ระดับเท่าไหร่ดี ซึ่ง ปกติแล้วเรามักจะใช้ significant level (α) ที่ 0.05 หรือ 5%
p value ≤ 0.05 หรือ 5% → ความแตกต่างที่พบนั้น Significant หรือ “มีนัยสำคัญ” นั่นเอง
ตัวอย่าง Matlab Code — t-test
สามารถติดตามเนื้อหาความรู้ต่างๆ โดยเฉพาะการใช้ประยุกต์ใช้กับโปรแกรม Matlab ได้ที่ Facebook Page :(20) Matlab bkk center | Facebook
Machine Learning for #Predictive #Maintenance Course
NEURAL NETWORK AND DEEP LEARNING COMPLETE COURSE :
ใครอยากเรียนรู้จากตัวอย่างการ Apply จาก #ProjectMachinelearning ต้องไม่พลาด
#Matlab Code ร่วมแชร์ความรู้ สาระผ่านกลุ่ม ->
(กลุ่ม Facebook Matlab Bkk AI & Data science & Other Classroom)>
https://web.facebook.com/groups/403881684322230/