IMPLEMENTASI NATURAL LANGUAGE PROCESSING DAN ALGORITMA SUPPORT VECTOR MACHINE UNTUK MENDETEKSI URL PHISHING BERBASIS WEBSITE

Nabila, - (2025) IMPLEMENTASI NATURAL LANGUAGE PROCESSING DAN ALGORITMA SUPPORT VECTOR MACHINE UNTUK MENDETEKSI URL PHISHING BERBASIS WEBSITE. Diploma thesis, Politeknik Negeri Sriwijaya.

Preview

Text (Cover)
Cover.pdf - Published Version
Download (1MB) | Preview

Preview

Text (Abstrak)
ABSTRAK.pdf - Published Version
Download (218kB) | Preview

Text (BAB I)
BAB I.pdf - Published Version
Restricted to Repository staff only
Download (264kB) | Request a copy

Text (BAB II)
BAB II.pdf - Published Version
Restricted to Repository staff only
Download (826kB) | Request a copy

Text (BAB III)
BAB III.pdf - Published Version
Restricted to Repository staff only
Download (464kB) | Request a copy

Text (BAB IV)
BAB IV.pdf - Published Version
Restricted to Repository staff only
Download (694kB) | Request a copy

Text (BAB V)
BAB V.pdf - Published Version
Restricted to Repository staff only
Download (188kB) | Request a copy

Text (Daftar Pustaka)
DAFTAR PUSTAKA.pdf - Published Version
Restricted to Repository staff only
Download (189kB) | Request a copy

Text (Lampiran)
lampiran.pdf - Published Version
Restricted to Repository staff only
Download (4MB) | Request a copy

Text (FULLTEXT)
FULLTEXT.pdf - Published Version
Restricted to Repository staff only
Download (7MB) | Request a copy

Abstract

Phishing merupakan bahaya yang signifikan dalam keamanan siber, menggunakan URL jahat untuk menyesatkan pengguna agar mengungkapkan informasi penting. Penelitian ini berupaya untuk membuat model deteksi URL phishing menggunakan pembelajaran mesin melalui integrasi ekstraksi fitur URL struktural, metodologi Natural Language Processing (NLP), dan algoritma klasifikasi Support Vector Machine (SVM). Indikator tren phishing diperoleh dari fitur-fitur seperti panjang URL, jumlah titik, dan garis miring, sementara konten URL dikuantifikasi sebagai vektor numerik menggunakan Term Frequency-Inverse Document Frequency (TF-IDF). Semua karakteristik selanjutnya diintegrasikan sebagai input ke dalam model support vector machine dengan kernel linier untuk klasifikasi. Hasil evaluasi dari laporan klasifikasi menunjukkan bahwa integrasi TF-IDF dan SVM kernel linier mencapai kinerja optimal, dengan akurasi 90%, presisi 92%, recall 89%, dan F1- score 90%. Sebaliknya, convusion matrix menunjukkan akurasi 90,29%, presisi 91,66%, ingatan 88,62%, dan F1-Score 90,12%. Studi ini terutama berkontribusi dengan mengintegrasikan NLP dan SVM ke dalam model deteksi phishing adaptif terpadu melalui penggabungan aspek struktural dan tekstual URL. Strategi ini memfasilitasi deteksi phishing yang lebih baik dibandingkan dengan teknik yang hanya bergantung pada karakteristik manual. Model ini, tidak seperti penelitian lain yang difokuskan pada contoh tertentu atau NLP yang dikecualikan, dirancang untuk mengidentifikasi banyak kategori URL phishing secara luas, sehingga meningkatkan relevansinya dalam menangani serangan siber yang terus berkembang.

Item Type:	Thesis (Diploma)
Uncontrolled Keywords:	Phishing; Natural Language Processing; Support Vector Machine; Term Frequency-Inverse Document Frequency
Subjects:	T Technology > TK Electrical engineering. Electronics Nuclear engineering
Divisions:	Telecommunication Engineering > Undergraduate Theses
Depositing User:	Pustaka Teknik Elektro
Date Deposited:	29 Aug 2025 08:18
Last Modified:	29 Aug 2025 08:18
URI:	http://eprints.polsri.ac.id/id/eprint/19273

Actions (login required)

View Item