IMPLEMENTASI SISTEM DETEKSI PHISHING URL MENGGUNAKAN MACHINE LEARNING: RANDOM FOREST DAN BOOSTING UNTUK PENCEGAHAN CYBERCRIME

Khairunnisya, Aqilla (2025) IMPLEMENTASI SISTEM DETEKSI PHISHING URL MENGGUNAKAN MACHINE LEARNING: RANDOM FOREST DAN BOOSTING UNTUK PENCEGAHAN CYBERCRIME. Diploma thesis, Politeknik Negeri Sriwijaya.

[img] Text (Cover)
cover.pdf - Published Version

Download (2MB)
[img]
Preview
Text (Abstrak)
Abstrak.pdf - Published Version

Download (247kB) | Preview
[img] Text (Bab I)
BAB I.pdf - Published Version
Restricted to Repository staff only

Download (306kB)
[img] Text (Bab II)
BAB II.pdf - Published Version
Restricted to Repository staff only

Download (512kB)
[img] Text (Bab III)
BAB III.pdf - Published Version
Restricted to Repository staff only

Download (633kB)
[img] Text (Bab IV)
BAB IV.pdf - Published Version
Restricted to Repository staff only

Download (1MB)
[img] Text (Bab V)
BAB V.pdf - Published Version
Restricted to Repository staff only

Download (186kB)
[img] Text (Daftar Pustaka)
DAFTAR PUSTAKA.pdf - Published Version
Restricted to Repository staff only

Download (231kB)
[img] Text (Lampiran)
LAMPIRAN.pdf - Published Version
Restricted to Repository staff only

Download (4MB)

Abstract

Serangan phishing melalui URL berbahaya telah menjadi ancaman serius dalam bidang keamanan siber, menyebabkan kerugian finansial yang besar dan kebocoran data secara global. Pendekatan konvensional seperti blacklisting dan deteksi berbasis aturan sering kali tertinggal karena metode phishing semakin canggih, termasuk munculnya phishing URL zero-day. Dalam penelitian ini, dikembangkan dan diuji model machine learning berbasis Random forest dan Gradient boosting untuk mengidentifikasi phishing URL secara akurat. Dataset yang digunakan diperoleh dari Kaggle, terdiri dari 11.430 URL dengan fitur-fitur yang diekstraksi, mencakup karakteristik seperti panjang URL, jumlah subdomain, status HTTPS, dan usia domain. Kedua model dilatih dan divalidasi menggunakan skema stratified train-test split serta teknik cross validation. Evaluasi performa model dilakukan menggunakan beberapa indikator, antara lain akurasi, presisi, recall, F1-score, dan ROC AUC. Hasil eksperimen menunjukkan bahwa Gradient boosting sedikit melampaui performa Random forest, dengan akurasi mencapai 98,0%, presisi 98,1%, dan F1-score 98,0%. Model dengan performa terbaik kemudian diintegrasikan ke dalam aplikasi web berbasis Streamlit untuk menyediakan deteksi phishing secara real-time bagi pengguna akhir. Penelitian ini berkontribusi dalam pengembangan sistem deteksi phishing URL yang adaptif dan efisien, sehingga dapat meningkatkan pertahanan keamanan siber terhadap ancaman phishing yang terus berkembang. Implementasi sistem menunjukkan penerapan yang praktis dan kemudahan penggunaan, bahkan bagi pengguna non-ahli.

Item Type: Thesis (Diploma)
Uncontrolled Keywords: Keamanan Siber, Gradient boosting, Machine learning, Phishing URL, Random forest, Streamlit.
Subjects: T Technology > TK Electrical engineering. Electronics Nuclear engineering
Divisions: Telecommunication Engineering > Undergraduate Theses
Depositing User: Pustaka Teknik Elektro
Date Deposited: 27 Aug 2025 07:16
Last Modified: 27 Aug 2025 07:16
URI: http://eprints.polsri.ac.id/id/eprint/19002

Actions (login required)

View Item View Item