นันทวรรณ ปาสาเขา / Saturday, May 30, 2026

การศึกษาเชิงเปรียบเทียบของวิธีการเรียนรู้ของเครื่องสำหรับการจำแนกลักษณะทางสัณฐานของอะแคนทามีบา

การประยุกต์ใช้ Vision Transformer และ Machine Learning Classifier เพื่อจำแนกซีสต์ Acanthamoeba spp. จากภาพจุลทรรศน์

ผู้จัดทำ: นางสาวรวงข้าว โพธิ์ทอง, นางสาวชาลิสา ผิวไผ่
อาจารย์ที่ปรึกษา: ผู้ช่วยศาสตราจารย์ ดร.ศรีศุภางค์ ทิ้วสุวรรณ

ที่มาและความสำคัญ

อะแคนทามีบา (Acanthamoeba spp.) เป็นโปรโตซัวอิสระที่เป็นสาเหตุของโรคกระจกตาอักเสบและโรคสมองอักเสบแบบแกรนูโลมาทัส ซึ่งอาจทำให้สูญเสียการมองเห็นหรือเสียชีวิตหากวินิจฉัยล่าช้า การจำแนกประเภทด้วยกล้องจุลทรรศน์โดยผู้เชี่ยวชาญต้องใช้ความชำนาญสูงและมีความแปรปรวนระหว่างผู้ตรวจในระดับที่มีนัยสำคัญ โครงงานนี้จึงพัฒนาระบบสกัดคุณลักษณะจากภาพจุลทรรศน์ด้วย Vision Transformer ร่วมกับ Machine Learning Classifier เพื่อเป็นแนวทางพัฒนาระบบช่วยวินิจฉัยอัตโนมัติในอนาคต

โครงสร้างระบบและการทำงาน

ระบบแบ่งออกเป็น 4 ระยะหลัก ดังนี้

ระยะที่ 1 การเตรียมชุดข้อมูล — โหลดภาพจุลทรรศน์ซีสต์จากชุดข้อมูล Buppan et al. (2018) จำนวน 1,800 ภาพ แบ่งเป็น GI, GII และ GIII กลุ่มละ 600 ภาพ แบ่ง Training set 1,440 ภาพ และ Validation set 360 ภาพ ปรับขนาดภาพเป็น 224×224 พิกเซล

ระยะที่ 2 การสกัดคุณลักษณะด้วย ViT — สร้าง Vision Transformer 5 Variant ได้แก่ ViT-B/16, ViT-B/32, ViT-L/16, ViT-L/32 และ ViT-H/14 โดยดึง Feature Vector จาก CLS Token Output ของ Transformer Layer สุดท้าย

ระยะที่ 3 การจำแนกประเภทและประเมินผล — นำ Feature Vector ไปใช้กับ ML Classifier 6 ชนิด ได้แก่ SVM (RBF), SVM (Linear), Random Forest, KNN, Logistic Regression และ Gradient Boosting ประเมินผลด้วย Repeated Stratified K-Fold Cross-Validation (K=5, Repeat=5)

ระยะที่ 4 การทดสอบทางสถิติ — ทดสอบนัยสำคัญด้วย One-Way ANOVA และ TukeyHSD Post-hoc Test นำเสนอผลในรูป Accuracy Table, Confusion Matrix, ANOVA Boxplot และ TukeyHSD Heatmap

ผลการดำเนินงาน

ผลบนชุดประเมินผลพบว่า ViT-H14 ร่วมกับ Random Forest ให้ค่า Accuracy สูงสุดที่ร้อยละ 90.28 ส่วนผลจาก Repeated Cross-Validation พบว่า ViT-L16 ร่วมกับ Random Forest ให้ค่า Accuracy เฉลี่ยสูงสุดที่ 0.8674 และ F1-Score 0.8670 โดย Random Forest และ Gradient Boosting ให้ประสิทธิภาพสูงสุดอย่างสม่ำเสมอ ในขณะที่ Logistic Regression ให้ผลต่ำสุดในทุกกรณี

ผลการทดสอบ ANOVA ยืนยันความแตกต่างอย่างมีนัยสำคัญ (F = 253.23, p = 0.000) และ TukeyHSD พบคู่ที่แตกต่างกัน 310 คู่จาก 435 คู่ โดยความแตกต่างของประสิทธิภาพเกิดจากการเลือก Classifier เป็นหลัก ไม่ใช่การเลือก ViT Variant

บทสรุปและข้อเสนอแนะ

ระบบที่พัฒนาสามารถจำแนกซีสต์ Acanthamoeba spp. ได้ในระดับที่น่าพอใจ โดยปัจจัยสำคัญที่สุดต่อประสิทธิภาพคือการเลือก Classifier มิใช่การเลือก ViT Variant โดยมีข้อเสนอแนะสำหรับการพัฒนาต่อดังนี้
- นำ ViT ที่ผ่านการฝึกสอนจาก ImageNet (Pretrained Weight) มาใช้เป็น Feature Extractor แทนการสุ่มค่าน้ำหนัก
- เพิ่มขนาดชุดข้อมูลและใช้เทคนิค Data Augmentation เช่น การหมุนภาพและการปรับความสว่าง
- พัฒนาสู่โมเดล End-to-End ด้วยการ Fine-tuning ViT ร่วมกับ Classification Head โดยตรง
- ดำเนินการ Hyperparameter Tuning อย่างเป็นระบบสำหรับ Classifier ทุกชนิด
- นำเทคนิค Explainability เช่น Attention Map Visualization หรือ SHAP Value มาวิเคราะห์คุณลักษณะที่สำคัญต่อการจำแนกกลุ่ม GI, GII และ GIII

9 Rate this article:

No rating

Documents to download

การศึกษาเชิงเปรียบเทียบของวิธีการเรียนรู้ของเครื่องสำหรับการจำแนกลักษณะทางสัณฐาน_compressed(.pdf, 4.84 MB) - 2 download(s)