Machine Learning กับปัญหาของ Training data ที่ใช้

MATLAB BKK
Jan 24, 2021

--

ปัญหาอย่างหนึ่งเกี่ยวกับ Training data คือ data ไม่มีคุณภาพมากพอ หากผลจากการสร้าง Prediction model แล้วให้ผลที่ออกมาแย่ มีความคลาดเคลื่อนจาก Actual output จริงมาก แทนที่จะมุ่งประเด็นไปที่การปรับจูน Model อาจจะต้องคำนึงถึงแหล่งที่มาของ Data ด้วยเช่นกัน

Machine Learning — Basics

ถ้าเรามาพิจารณาถึง Machine Learning ตอนนี้เป็นการผสานกันระหว่างทางด้านเทคโนโลยีและทางด้านธุรกิจ Machine Learning สร้าง Algorithm เพื่อให้สามารถเรียนรู้ด้วยตัวเอง ในการวิเคราะห์ข้อมูล หากเป็นการสร้าง Mapping กันระหว่าง Input และ Output ก็เป็นรูปแบบการเรียนรู้แบบ Supervised Learning แต่ถ้าเป็นการ Detect รูปแบบ Pattern ก็เป็นการเรียนรู้แบบ Unsupervised Learning หรือถ้าเป็นการเรียนรู้จากการให้รางวัล การลงโทษ ก็เป็นการเรียนรู้แบบ Reinforcement Learning ยิ่งข้อมูลที่ใช้เรียนรู้มีมากขึ้นเท่าไหร่ ความสามารถของ Algorithm ก็จะมากยิ่งขึ้นเท่านั้น

รูปแบบการเรียนรู้ของ Machine Learning

การเปลี่ยนแปลงของ Digital Transformation ในทางด้านธุรกิจนั้น คุณภาพของ Data ที่นำมาใช้มีความสำคัญมาก ปัจจัยสำคัญ 3 ประการ ที่นำมาเป็นตัวขับเคลื่อนในการทำ Digital Marketing คือ

  • คุณภาพของข้อมูล
  • Data Scientists เอง
  • เครื่องมือที่ใช้ในการแสดงภาพการวิเคราะห์และสรุปข้อมูล

ปัญหาประสิทธิภาพของโมเดล

ปัญหาประสิทธิภาพของโมเดล

จากภาพข้างต้น กำหนดให้ x แทน Training dataset และตำแหน่งแต่ละชั้นของวงกลม คือผลทดสอบความแม่นยำของโมเดลที่ได้ ซึ่งมีผลต่อความแม่นยำในการตัดสินนั่นเอง การพยายามที่จะปรับปรุงโมเดลเป็นเรื่องที่ดี แต่หลายครั้งที่คุณภาพของข้อมูล ที่มาที่ได้มีซึ่งข้อมูล อาจเป็นตัวก่อให้เกิดปัญหาก็ได้เช่นกัน

เพื่อให้เห็นภาพมากขึ้น ในกรณีของ Email เราคงเคยเห็น Email ที่มีการแยกข้อความที่ถูกส่งเข้ามาว่าเป็นประเภท Spam Email หรือไม่ Algorithm เบื้องหลัง จะใช้เรื่องของการจับคำต่างๆ เช่น Lotto ,Free ,Casino เป็นต้น ตัว Machine Learning จะทำหน้าที่ประมวลคำเป็นล้านๆคำ เหล่านี้ เพื่อใช้ในการตรวจ Scan Email แล้วคัดแยก Spam Email ออกมาให้ได้มากที่สุด กระบวนการต่างๆเหล่า Data Training จึงต้องให้ความสำคัญ

สามารถติดตามเนื้อหาความรู้ต่างๆ โดยเฉพาะการใช้ประยุกต์ใช้กับโปรแกรม Matlab ได้ที่ Facebook Page : (5) Matlab bkk center | Facebook

--

--

No responses yet