Nabila, - (2025) IMPLEMENTASI NATURAL LANGUAGE PROCESSING DAN ALGORITMA SUPPORT VECTOR MACHINE UNTUK MENDETEKSI URL PHISHING BERBASIS WEBSITE. Diploma thesis, Politeknik Negeri Sriwijaya.
|
Text (Cover)
Cover.pdf - Published Version Download (1MB) | Preview |
|
|
Text (Abstrak)
ABSTRAK.pdf - Published Version Download (218kB) | Preview |
|
![]() |
Text (BAB I)
BAB I.pdf - Published Version Restricted to Repository staff only Download (264kB) | Request a copy |
|
![]() |
Text (BAB II)
BAB II.pdf - Published Version Restricted to Repository staff only Download (826kB) | Request a copy |
|
![]() |
Text (BAB III)
BAB III.pdf - Published Version Restricted to Repository staff only Download (464kB) | Request a copy |
|
![]() |
Text (BAB IV)
BAB IV.pdf - Published Version Restricted to Repository staff only Download (694kB) | Request a copy |
|
![]() |
Text (BAB V)
BAB V.pdf - Published Version Restricted to Repository staff only Download (188kB) | Request a copy |
|
![]() |
Text (Daftar Pustaka)
DAFTAR PUSTAKA.pdf - Published Version Restricted to Repository staff only Download (189kB) | Request a copy |
|
![]() |
Text (Lampiran)
lampiran.pdf - Published Version Restricted to Repository staff only Download (4MB) | Request a copy |
|
![]() |
Text (FULLTEXT)
FULLTEXT.pdf - Published Version Restricted to Repository staff only Download (7MB) | Request a copy |
Abstract
Phishing merupakan bahaya yang signifikan dalam keamanan siber, menggunakan URL jahat untuk menyesatkan pengguna agar mengungkapkan informasi penting. Penelitian ini berupaya untuk membuat model deteksi URL phishing menggunakan pembelajaran mesin melalui integrasi ekstraksi fitur URL struktural, metodologi Natural Language Processing (NLP), dan algoritma klasifikasi Support Vector Machine (SVM). Indikator tren phishing diperoleh dari fitur-fitur seperti panjang URL, jumlah titik, dan garis miring, sementara konten URL dikuantifikasi sebagai vektor numerik menggunakan Term Frequency-Inverse Document Frequency (TF-IDF). Semua karakteristik selanjutnya diintegrasikan sebagai input ke dalam model support vector machine dengan kernel linier untuk klasifikasi. Hasil evaluasi dari laporan klasifikasi menunjukkan bahwa integrasi TF-IDF dan SVM kernel linier mencapai kinerja optimal, dengan akurasi 90%, presisi 92%, recall 89%, dan F1- score 90%. Sebaliknya, convusion matrix menunjukkan akurasi 90,29%, presisi 91,66%, ingatan 88,62%, dan F1-Score 90,12%. Studi ini terutama berkontribusi dengan mengintegrasikan NLP dan SVM ke dalam model deteksi phishing adaptif terpadu melalui penggabungan aspek struktural dan tekstual URL. Strategi ini memfasilitasi deteksi phishing yang lebih baik dibandingkan dengan teknik yang hanya bergantung pada karakteristik manual. Model ini, tidak seperti penelitian lain yang difokuskan pada contoh tertentu atau NLP yang dikecualikan, dirancang untuk mengidentifikasi banyak kategori URL phishing secara luas, sehingga meningkatkan relevansinya dalam menangani serangan siber yang terus berkembang.
Item Type: | Thesis (Diploma) |
---|---|
Uncontrolled Keywords: | Phishing; Natural Language Processing; Support Vector Machine; Term Frequency-Inverse Document Frequency |
Subjects: | T Technology > TK Electrical engineering. Electronics Nuclear engineering |
Divisions: | Telecommunication Engineering > Undergraduate Theses |
Depositing User: | Pustaka Teknik Elektro |
Date Deposited: | 29 Aug 2025 08:18 |
Last Modified: | 29 Aug 2025 08:18 |
URI: | http://eprints.polsri.ac.id/id/eprint/19273 |
Actions (login required)
![]() |
View Item |