PHISHING EMAIL DETECTION USING LARGE LANGUAGE MODELS (LLMS): A PERFORMANCE EVALUATION OF QWEN AND GEMINI

Andyana Muhandhatul Nabila; Moh Sulthan Arief Rahmatullah

doi:10.2238/v2btct32

Articles

Vol. 8 No. 5 (2025): Kohesi: Jurnal Sains dan Teknologi

PHISHING EMAIL DETECTION USING LARGE LANGUAGE MODELS (LLMS): A PERFORMANCE EVALUATION OF QWEN AND GEMINI

Andyana Muhandhatul Nabila^▸^▾
Moh Sulthan Arief Rahmatullah^▸^▾

pdf

DOI:: https://doi.org/10.2238/v2btct32
Submitted: June 14, 2025
Published: 2025-06-14

Abstract

The increasing complexity of network infrastructure and the increasing sophistication of phishing attacks require advanced cybersecurity solutions. Artificial Intelligence for IT Operations (AIOps) integrates big data analytics, machine learning and automation to improve real-time detection and response to security threats. This study evaluates the zero-shot performance of Large Language Models (LLMs) - Gemini 2.5 Pro, Gemini 2.5 Flash, and Qwen 3 - in detecting phishing emails in an AIOps environment at Institut Teknologi Sepuluh Nopember (ITS). The findings show different strengths: Gemini 2.5 Pro achieved 99.8% accuracy in identifying legitimate emails, minimizing false positives and workflow disruption, while Gemini 2.5 Flash excelled in detecting phishing attempts with 89.1% accuracy, prioritizing threat prevention. Qwen 3 performed poorly, most likely due to its lack of alignment with the nuances of English-language phishing. Achieved without refinement, these results highlight LLM's out-of-the-box efficacy for cybersecurity, offering an accessible and high-performance tool for organizations with limited AI resources. This study underscores the potential of LLM in AIOps to improve automated security monitoring and incident response, advocating for a layered approach that combines smart technology, user training, and organizational policies to effectively combat evolving phishing threats.

Keywords

AIOps
Phishing Detection
Large Language Models
Cybersecurity
Zero-Shot Evaluation

Copyright Notice

How to Cite

PHISHING EMAIL DETECTION USING LARGE LANGUAGE MODELS (LLMS): A PERFORMANCE EVALUATION OF QWEN AND GEMINI. (2025). Kohesi: Jurnal Sains Dan Teknologi, 8(5), 81-90. https://doi.org/10.2238/v2btct32

Similar Articles

Maulina Nur Laila, Qoyyimil Jamilah, Sintiarani Febyan Putri, ANALISIS KOMPARATIF KEMAMPUAN GPT DAN BURP SUITE DALAM PENGUJIAN KERENTANAN APLIKASI WEB , Kohesi: Jurnal Sains dan Teknologi: Vol. 8 No. 8 (2025): Kohesi: Jurnal Sains dan Teknologi
Anida Fadla Silvia, Mugiarso Mugiarso, Dwi Swasono Rachmad, SISTEM PENDUKUNG KEPUTUSAN BERBASIS WEB UNTUK MENENTUKAN GURU TERBAIK DENGAN ALGORITMA SMART PADA MTS NURUSY SYIFA , Kohesi: Jurnal Sains dan Teknologi: Vol. 8 No. 9 (2025): Kohesi: Jurnal Sains dan Teknologi
Muhamad Zaky Priambada Anugrah, Muhammad Lutfi, Muhammad Fahmi Abdillah Mahri, Anggraini Puspita Sari, SISTEM ANALISIS SENTIMEN ULASAN PRODUK BERBAHASA INDONESIAMENGGUNAKAN METODE LEXICON DENGAN VISUALISASI INTERAKTIF , Kohesi: Jurnal Sains dan Teknologi: Vol. 8 No. 12 (2025): Kohesi: Jurnal Sains dan Teknologi
Khabib Khoirul Yazid, Abdul Haris Indrakusuma, PENGEMBANGAN MEDIA PEMBELAJARAN MENGGUNAKAN APLIKASI ARTICULATE STORYLINE 3 PADA MATA PELAJARAN DASAR-DASAR DESAIN KELAS X PSPT DI SMK 1 ISLAM DURENAN , Kohesi: Jurnal Sains dan Teknologi: Vol. 9 No. 6 (2025): Kohesi: Jurnal Sains dan Teknologi
Devano Arayudha Adlim, Iksan Ramadhan, Bambang Irawan, Sawali Wahyu, IMPLEMENTASI OBJECT DETECTION KLASIFIKASI SAMPAH ORGANIK DAN ANORGANIK MENGGUNAKAN RASPBERRY PI DENGAN ALGORITMA YOLO , Kohesi: Jurnal Sains dan Teknologi: Vol. 10 No. 3 (2025): Kohesi: Jurnal Multidisiplin Saintek
Akhmad Azrul Arsyadhany, Muhammad Naufal Dzaki Adani, Muhammad Rizki Darmawan, Anggraini Puspita Sari, PREDIKSI GANGGUAN TIDUR PADA USIA PRODUKTIF MENGGUNAKAN METODE FUZZY MAMDANI , Kohesi: Jurnal Sains dan Teknologi: Vol. 8 No. 11 (2025): Kohesi: Jurnal Sains dan Teknologi
Muh. Razin Chcaskay Al Ghazalie, Mas Suryanto HS, PENERAPAN VALUE ENGINEERING PADA PROYEK PEMBANGUNAN KAMPUS UIN MAULANA MALIK IBRAHIM MALANG III , Kohesi: Jurnal Sains dan Teknologi: Vol. 9 No. 2 (2025): Kohesi: Jurnal Sains dan Teknologi
Muhammad Ramdhani, Dwi Sari Ida Aflaha, PENERAPAN ORANGE MACHINE LEARNING UNTUK MEMPREDIKSI KEBUTUHAN PEMELIHARAAN DAN EFISIENSI PANEL SURYA BERDASARKAN DATA KINERJA DAN DATA LINGKUNGAN , Kohesi: Jurnal Sains dan Teknologi: Vol. 9 No. 2 (2025): Kohesi: Jurnal Sains dan Teknologi
Lismawati Lismawati, Destitias Baha, Sri Anggun Dwi Putri, Revitalisasi Pariwisata Indonesia melalui Machine Learning: Analisis Potensi dan Penerapannya , Kohesi: Jurnal Sains dan Teknologi: Vol. 10 No. 1 (2025): Kohesi: Jurnal Multidisiplin Saintek
Siti Rokhmah, Wahyu Dwi Jayanto , Tino Feri Efendi, ANALISIS SENTIMEN PUBLIK PADA APLIKASI X TERHADAP FATWA MUI PRODUK PRO ISRAEL DENGAN METODE GATED RECURRENT UNIT , Kohesi: Jurnal Sains dan Teknologi: Vol. 8 No. 9 (2025): Kohesi: Jurnal Sains dan Teknologi

1-10 of 48 Next

You may also start an advanced similarity search for this article.