This study presents a comparative analysis of two popular clustering algorithms, K-Means and K-Medoids, focusing on clustering quality, computational efficiency, and robustness to outliers. Using the Wine Dataset, which contains various chemical properties of wines, we evaluated the performance of both algorithms with multiple evaluation metrics, including Silhouette Score, Calinski-Harabasz Score, Davies-Bouldin Score, and processing time. The results indicate that K-Means outperforms K-Medoids in computational efficiency, with faster execution times and higher Silhouette and Calinski-Harabasz scores. However, K-Medoids demonstrates greater robustness to outliers and noise, producing more stable clustering results. This study suggests that K-Means is more suitable for large, relatively clean datasets, while K-Medoids is recommended for datasets with significant noise or outliers. The findings provide valuable insights for selecting the optimal clustering algorithm based on data characteristics and application requirements.
Penelitian ini menyajikan analisis perbandingan antara dua algoritma clustering yang populer, K-Means dan K-Medoids, dengan fokus pada kualitas clustering, efisiensi komputasi, dan ketahanan terhadap outlier. Menggunakan Wine Dataset, yang berisi berbagai sifat kimia dari anggur, kami mengevaluasi kinerja kedua algoritma dengan menggunakan beberapa metrik evaluasi, termasuk Silhouette Score, Calinski-Harabasz Score, Davies-Bouldin Score, dan waktu pemrosesan. Hasil penelitian menunjukkan bahwa K-Means unggul dalam hal efisiensi komputasi, dengan waktu eksekusi yang lebih cepat dan skor Silhouette serta Calinski-Harabasz yang lebih tinggi dibandingkan K-Medoids. Namun, K-Medoids menunjukkan ketahanan yang lebih baik terhadap outlier dan noise, menghasilkan hasil clustering yang lebih stabil. Penelitian ini menyarankan bahwa K-Means lebih cocok digunakan untuk dataset besar yang relatif bersih, sementara K-Medoids lebih disarankan untuk dataset yang mengandung banyak noise atau outlier. Penelitian ini memberikan wawasan yang berharga dalam memilih algoritma clustering yang optimal berdasarkan karakteristik data dan kebutuhan aplikasi.
You may also start an advanced similarity search for this article.