การศึกษาเชิงเปรียบเทียบของวิธีการเรียนรู้ของเครื่องสำหรับการจำแนกลักษณะทางสัณฐานของอะแคนทามีบา
การประยุกต์ใช้ Vision Transformer และ Machine Learning Classifier เพื่อจำแนกซีสต์ Acanthamoeba spp. จากภาพจุลทรรศน์
ผู้จัดทำ: นางสาวรวงข้าว โพธิ์ทอง, นางสาวชาลิสา ผิวไผ่
อาจารย์ที่ปรึกษา: ผู้ช่วยศาสตราจารย์ ดร.ศรีศุภางค์ ทิ้วสุวรรณ
ที่มาและความสำคัญ
อะแคนทามีบา (Acanthamoeba spp.) เป็นโปรโตซัวอิสระที่เป็นสาเหตุของโรคกระจกตาอักเสบและโรคสมองอักเสบแบบแกรนูโลมาทัส ซึ่งอาจทำให้สูญเสียการมองเห็นหรือเสียชีวิตหากวินิจฉัยล่าช้า การจำแนกประเภทด้วยกล้องจุลทรรศน์โดยผู้เชี่ยวชาญต้องใช้ความชำนาญสูงและมีความแปรปรวนระหว่างผู้ตรวจในระดับที่มีนัยสำคัญ โครงงานนี้จึงพัฒนาระบบสกัดคุณลักษณะจากภาพจุลทรรศน์ด้วย Vision Transformer ร่วมกับ Machine Learning Classifier เพื่อเป็นแนวทางพัฒนาระบบช่วยวินิจฉัยอัตโนมัติในอนาคต
โครงสร้างระบบและการทำงาน
ระบบแบ่งออกเป็น 4 ระยะหลัก ดังนี้
ระยะที่ 1 การเตรียมชุดข้อมูล — โหลดภาพจุลทรรศน์ซีสต์จากชุดข้อมูล Buppan et al. (2018) จำนวน 1,800 ภาพ แบ่งเป็น GI, GII และ GIII กลุ่มละ 600 ภาพ แบ่ง Training set 1,440 ภาพ และ Validation set 360 ภาพ ปรับขนาดภาพเป็น 224×224 พิกเซล
ระยะที่ 2 การสกัดคุณลักษณะด้วย ViT — สร้าง Vision Transformer 5 Variant ได้แก่ ViT-B/16, ViT-B/32, ViT-L/16, ViT-L/32 และ ViT-H/14 โดยดึง Feature Vector จาก CLS Token Output ของ Transformer Layer สุดท้าย
ระยะที่ 3 การจำแนกประเภทและประเมินผล — นำ Feature Vector ไปใช้กับ ML Classifier 6 ชนิด ได้แก่ SVM (RBF), SVM (Linear), Random Forest, KNN, Logistic Regression และ Gradient Boosting ประเมินผลด้วย Repeated Stratified K-Fold Cross-Validation (K=5, Repeat=5)
ระยะที่ 4 การทดสอบทางสถิติ — ทดสอบนัยสำคัญด้วย One-Way ANOVA และ TukeyHSD Post-hoc Test นำเสนอผลในรูป Accuracy Table, Confusion Matrix, ANOVA Boxplot และ TukeyHSD Heatmap
ผลการดำเนินงาน
ผลบนชุดประเมินผลพบว่า ViT-H14 ร่วมกับ Random Forest ให้ค่า Accuracy สูงสุดที่ร้อยละ 90.28 ส่วนผลจาก Repeated Cross-Validation พบว่า ViT-L16 ร่วมกับ Random Forest ให้ค่า Accuracy เฉลี่ยสูงสุดที่ 0.8674 และ F1-Score 0.8670 โดย Random Forest และ Gradient Boosting ให้ประสิทธิภาพสูงสุดอย่างสม่ำเสมอ ในขณะที่ Logistic Regression ให้ผลต่ำสุดในทุกกรณี
ผลการทดสอบ ANOVA ยืนยันความแตกต่างอย่างมีนัยสำคัญ (F = 253.23, p = 0.000) และ TukeyHSD พบคู่ที่แตกต่างกัน 310 คู่จาก 435 คู่ โดยความแตกต่างของประสิทธิภาพเกิดจากการเลือก Classifier เป็นหลัก ไม่ใช่การเลือก ViT Variant
บทสรุปและข้อเสนอแนะ
ระบบที่พัฒนาสามารถจำแนกซีสต์ Acanthamoeba spp. ได้ในระดับที่น่าพอใจ โดยปัจจัยสำคัญที่สุดต่อประสิทธิภาพคือการเลือก Classifier มิใช่การเลือก ViT Variant โดยมีข้อเสนอแนะสำหรับการพัฒนาต่อดังนี้
- นำ ViT ที่ผ่านการฝึกสอนจาก ImageNet (Pretrained Weight) มาใช้เป็น Feature Extractor แทนการสุ่มค่าน้ำหนัก
- เพิ่มขนาดชุดข้อมูลและใช้เทคนิค Data Augmentation เช่น การหมุนภาพและการปรับความสว่าง
- พัฒนาสู่โมเดล End-to-End ด้วยการ Fine-tuning ViT ร่วมกับ Classification Head โดยตรง
- ดำเนินการ Hyperparameter Tuning อย่างเป็นระบบสำหรับ Classifier ทุกชนิด
- นำเทคนิค Explainability เช่น Attention Map Visualization หรือ SHAP Value มาวิเคราะห์คุณลักษณะที่สำคัญต่อการจำแนกกลุ่ม GI, GII และ GIII