อัลกอริทึม Random Forest
“คืออะไร…ใช้เมื่อไหร่… มีหลักการทำงานอย่างไร…พร้อมโค้ดในโปรแกรม Matlab”
Tin Kam Ho
•นักวิทยาศาสตร์คอมพิวเตอร์ที่ IBM Watson Health
•มีส่วนร่วมในการเรียนรู้ ศึกษาทางด้าน Machine Learning, data mining และ classification ผู้แนะนำให้รู้จักในนาม “Random Forest Algorithm”
เกริ่นนำ
- Random Forest Algorithm เป็นอัลกอริธึมการเรียนรู้ของเครื่องที่ได้รับความนิยมและมีประสิทธิภาพ
- Random Forest Algorithm สามารถทำงานได้ทั้ง Regression และ Classification
- ตามชื่อที่แนะนำคือ“ Random Forest” อัลกอริทึมนี้จะสร้างป่าที่มีต้นไม้ตัดสินใจจำนวนหนึ่ง ยิ่งมีต้นไม้ในป่ามากเท่าไหร่การทำนายก็จะยิ่งมีความแม่นยำมากขึ้นเท่านั้น
Ensemble Learning
สมมติว่าเรากำลังสับสนเกี่ยวกับการเลือกหลักสูตร ว่าจะสมัครเข้าเรียนหลักสูตรนี้หรือไม่
เราจะทำยังไง ??? จะขอคำแนะนำจากเพื่อนดีมั้ย? แต่คำแนะนำของเขาเพียงพอสำหรับการเลือกตัดสินใจหรือไม่? แน่นอนว่าไม่… แล้วจะทำอะไรได้อีก ???
ไปถามญาติ ,อาจารย์, เพื่อนหลายๆคน, คนอื่นๆ …ทีนี้จะเกิดอะไรขึ้น? เราก็จะได้รับคำแนะนำ ดังนั้นเมื่อมีข้อเสนอแนะเพิ่มเติมแล้วจะตัดสินใจขั้นสุดท้ายได้อย่างไรว่าจะเลือกเรียนหลักสูตรหรือไม่
“คำตอบคือการโหวตเสียงข้างมาก”
“ใน Random Forest จะใช้เฉพาะอัลกอริทึม Decision trees เท่านั้น ด้วยเหตุนี้จึงเรียกว่า Random Forests จะเรียกว่าสร้างป่าที่มีต้นไม้หลายต้นและตรงตัวนั่นเอง
ตัวอย่าง Matlab Function สำหรับ Random Forest
model=fitensemble(dataTrain,’category_encoded’,’Bag’,100,’Tree’,’Type’,’classification’);
prediction=predict(model,testing);
สามารถติดตามเนื้อหาความรู้ต่างๆ โดยเฉพาะการใช้ประยุกต์ใช้กับโปรแกรม Matlab ได้ที่ Facebook Page :(20+) Matlab bkk center | Facebook