Khairunnisya, Aqilla (2025) IMPLEMENTASI SISTEM DETEKSI PHISHING URL MENGGUNAKAN MACHINE LEARNING: RANDOM FOREST DAN BOOSTING UNTUK PENCEGAHAN CYBERCRIME. Diploma thesis, Politeknik Negeri Sriwijaya.
![]() |
Text (Cover)
cover.pdf - Published Version Download (2MB) |
|
|
Text (Abstrak)
Abstrak.pdf - Published Version Download (247kB) | Preview |
|
![]() |
Text (Bab I)
BAB I.pdf - Published Version Restricted to Repository staff only Download (306kB) |
|
![]() |
Text (Bab II)
BAB II.pdf - Published Version Restricted to Repository staff only Download (512kB) |
|
![]() |
Text (Bab III)
BAB III.pdf - Published Version Restricted to Repository staff only Download (633kB) |
|
![]() |
Text (Bab IV)
BAB IV.pdf - Published Version Restricted to Repository staff only Download (1MB) |
|
![]() |
Text (Bab V)
BAB V.pdf - Published Version Restricted to Repository staff only Download (186kB) |
|
![]() |
Text (Daftar Pustaka)
DAFTAR PUSTAKA.pdf - Published Version Restricted to Repository staff only Download (231kB) |
|
![]() |
Text (Lampiran)
LAMPIRAN.pdf - Published Version Restricted to Repository staff only Download (4MB) |
Abstract
Serangan phishing melalui URL berbahaya telah menjadi ancaman serius dalam bidang keamanan siber, menyebabkan kerugian finansial yang besar dan kebocoran data secara global. Pendekatan konvensional seperti blacklisting dan deteksi berbasis aturan sering kali tertinggal karena metode phishing semakin canggih, termasuk munculnya phishing URL zero-day. Dalam penelitian ini, dikembangkan dan diuji model machine learning berbasis Random forest dan Gradient boosting untuk mengidentifikasi phishing URL secara akurat. Dataset yang digunakan diperoleh dari Kaggle, terdiri dari 11.430 URL dengan fitur-fitur yang diekstraksi, mencakup karakteristik seperti panjang URL, jumlah subdomain, status HTTPS, dan usia domain. Kedua model dilatih dan divalidasi menggunakan skema stratified train-test split serta teknik cross validation. Evaluasi performa model dilakukan menggunakan beberapa indikator, antara lain akurasi, presisi, recall, F1-score, dan ROC AUC. Hasil eksperimen menunjukkan bahwa Gradient boosting sedikit melampaui performa Random forest, dengan akurasi mencapai 98,0%, presisi 98,1%, dan F1-score 98,0%. Model dengan performa terbaik kemudian diintegrasikan ke dalam aplikasi web berbasis Streamlit untuk menyediakan deteksi phishing secara real-time bagi pengguna akhir. Penelitian ini berkontribusi dalam pengembangan sistem deteksi phishing URL yang adaptif dan efisien, sehingga dapat meningkatkan pertahanan keamanan siber terhadap ancaman phishing yang terus berkembang. Implementasi sistem menunjukkan penerapan yang praktis dan kemudahan penggunaan, bahkan bagi pengguna non-ahli.
Item Type: | Thesis (Diploma) |
---|---|
Uncontrolled Keywords: | Keamanan Siber, Gradient boosting, Machine learning, Phishing URL, Random forest, Streamlit. |
Subjects: | T Technology > TK Electrical engineering. Electronics Nuclear engineering |
Divisions: | Telecommunication Engineering > Undergraduate Theses |
Depositing User: | Pustaka Teknik Elektro |
Date Deposited: | 27 Aug 2025 07:16 |
Last Modified: | 27 Aug 2025 07:16 |
URI: | http://eprints.polsri.ac.id/id/eprint/19002 |
Actions (login required)
![]() |
View Item |