Deteksi Bot Twitter menggunakan Model Hybrid Local Outlier Factor dan CatBoost
Keywords:
Deteksi Bot, Twitter, Local Outlier Factor, Catboost, Pembelajaran Mesin, Keamanan Media SosialAbstract
Maraknya bot otomatis pada platform Twitter menimbulkan tantangan signifikan terhadap integritas media sosial dan pengalaman pengguna. Metode deteksi bot tradisional sering kali kesulitan menghadapi perilaku bot yang semakin canggih, sehingga memerlukan pendekatan deteksi yang lebih maju. Penelitian ini mengusulkan model hybrid yang menggabungkan Local Outlier Factor (LOF) untuk deteksi anomali dan CatBoost untuk klasifikasi. Model dievaluasi pada dataset lebih dari 140.000 sampel Twitter, menggunakan 11 fitur yang mencakup karakteristik profil, metrik konten, dan skor anomali LOF sebagai fitur baru. Kinerja diukur menggunakan akurasi, presisi, recall, F1-score, dan AUC-ROC. Model hybrid yang diusulkan mencapai akurasi 87,5%, mewakili peningkatan 15,6% dibandingkan model dasar CatBoost saja. Fitur LOF menempati peringkat #2 dalam kepentingan fitur dengan kontribusi 15,6%. Validasi statistik melalui analisis bootstrap mengkonfirmasi signifikansi peningkatan (CI 95%: [0,875-0,877]). Integrasi deteksi anomali LOF dengan klasifikasi CatBoost memberikan pendekatan yang efektif untuk deteksi bot Twitter. Model ini menunjukkan kinerja unggul dan menawarkan penerapan praktis untuk sistem keamanan media sosial di dunia nyata.
References
A. H. Wang, “Detecting spam bots in online social networking sites: A machine learning approach,” in Proceedings of the IFIP Conference on Human-Computer Interaction, 2010, pp. 579-588.
C. Yang, R. Harkreader, and G. Gu, “Die free or live hard? Empirical evaluation of bot detection techniques,” in Proceedings of the International Conference on Detection of Intrusions and Malware & Vulnerability Assessment, 2010, pp. 1-20.
E. Ferrara, O. Varol, F. Menczer, and A. Flammini, “The rise of social bots,” Communications of the ACM, vol. 59, no. 7, pp. 96-104, 2016.
J. P. Dickerson, V. Kagan, and V. Subrahmanian, “Using sentiment to detect bots on Twitter: Are you a sentiment bot?,” in Proceedings of the International Conference on Web and Social Media, 2014, pp. 311-320.
K. Lee, J. Caverlee, and S. Webb, “Uncovering social spammers: Social honeypots + machine learning,” in Proceedings of the International Conference on Web Search and Data Mining, 2010, pp. 35-44.
L. Prokhorenkova, G. Gusev, A. Vorobev, A. V. Dorogush, and A. Gulin, “CatBoost: unbiased boosting with categorical features,” in Advances in Neural Information Processing Systems, 2018, pp. 6638-6648.
M. Goldstein and S. Uchida, “A comparative evaluation of unsupervised anomaly detection algorithms for multivariate data,” PloS one, vol. 11, no. 4, p. e0152173, 2016.
M. M. Breunig, H. P. Kriegel, R. T. Ng, and J. Sander, “LOF: identifying density-based local outliers,” in Proceedings of the ACM SIGMOD International Conference on Management of Data, 2000, pp. 93-104.
S. Kudugunta and E. Ferrara, “Automatically detecting cryptocurrency pump-and-dump schemes on social media,” in Proceedings of the International Conference on Web and Social Media, 2018, pp. 191-200.
Y. Boshmaf, I. Muslukhov, K. Beznosov, and M. Ripeanu, “The socialbot network: When bots socialize with humans,” ACM Transactions on the Web, vol. 7, no. 3, pp. 1-25, 2013.
Z. Chu, S. Gianvecchio, H. Wang, and S. Jajodia, “Detecting automation of Twitter accounts: Are you a human, bot, or cyborg?,” IEEE Transactions on Dependable and Secure Computing, vol. 9, no. 6, pp. 811-824, 2010.





