ข้อดี-ข้อเสีย ของแต่ละ Machine Learning Algorithm
MATLAB BKK CENTER
- Linear Regression เป็น Algorithm ที่ ง่ายต่อการใช้งานและมีประสิทธิภาพในการ Training แต่มีโอกาสเกิด Overfitting ได้สูงเนื่องจากตัวมันเองจะ Sensitive กับ Outlier data แต่อย่างไรก็ตาม สามารถแก้ปัญหานี้ได้จากการทำ Regularization
2. Logistic Regression มีโอกาสเกิด Overfitting ได้ต่ำ แต่ก็อาจจะเกิดได้ถ้า High dimensional dataset วิธีนี้ง่ายต่อการนำ Train และผลที่ได้ก็มีประสิทธิภาพ แต่ก็ต้องระมัดระวังข้อมูลบางประเภทมี่มี Feature data น้อย
3. Decision Tree เป็น Machine Learning Algorithm ที่มักจะใช้กับปัญหา Non-linear และสามารถใช้กับ Data ที่มีขนาดใหญ่ โดยที่ยังให้ผลความแม่นยำสูง ตัวมันเองยังสามารถเข้าใจในการแสดงผลและการอธิบายได้ง่าย แต่ตัวมันเองก็มีข้อเสียคือเกิด Over fitting ได้ แต่สามารถแก้ปัญหาได้ด้วย Random Forest Algorithm
4. K Nearest Neighbour สามารถ Prediction ได้โดยไม่ต้อง Training โดยยังสามารถใช้ได้ทั้ง Classification และ Regression แต่จะไม่เหมาะกับ Dataset ที่มีขนาดใหญ่ และตัวมันเอง Sensitive กับ Missing data , data Outlier หรือ Noise data
5. K Means เป็น Machine Learning Algorithm ที่ Implement ได้ง่าย ใช้กับ Data ขนาดใหญ่ได้ แต่ Sensitive กับ Outlier และการกำหนดค่า K ดด้วยการ Manual นั้นให้ได้ผลที่ดีเลยไม่ง่ายนัก
6. Principal Component Analysis (PCA) ช่วยเรื่อง Improve performance ได้ดี ซึ่งจะลดการเกิด Overfitting แต่สามารถตีความอธิบายเหตุและผลที่ได้ของ Algorithm ได้ไม่ง่าย
สามารถติดตามเนื้อหาความรู้ต่างๆ โดยเฉพาะการใช้ประยุกต์ใช้กับโปรแกรม Matlab ได้ที่ Facebook Page :(20) Matlab bkk center | Facebook
Machine Learning for #Predictive #Maintenance Course
NEURAL NETWORK AND DEEP LEARNING COMPLETE COURSE :
ใครอยากเรียนรู้จากตัวอย่างการ Apply จาก #ProjectMachinelearning ต้องไม่พลาด
#Matlab Code ร่วมแชร์ความรู้ สาระผ่านกลุ่ม ->
(กลุ่ม Facebook Matlab Bkk AI & Data science & Other Classroom)>
https://web.facebook.com/groups/403881684322230/