Phát hiện URL độc hại bằng Deep Learning

Hieu Nguyen
2 min readOct 29, 2020

--

Ngày 29/10/2020: Đăng bài đặt gạch!

Nội dung của bài viết này sẽ được công bố sau khi tôi báo cáo thành công tại Hội thảo Quốc gia lần thứ XXIII “Một số vấn đề chọn lọc của Công nghệ thông tin và Truyền thông” do Viện Công nghệ thông tin — Viện Hàn lâm Khoa học và Công nghệ Việt Nam và Trường Đại học Hạ Long, đồng tổ chức tại Quảng Ninh vào ngày 5–6 tháng 11 năm 2020.

Thời gian gần đây việc nghiên cứu các giải pháp tự động phân tích dữ liệu mạng để phát triển các hệ thống IDS (Intrusion Detection System — Hệ thống phát hiện xâm nhập) được đặc biệt quan tâm không chỉ bởi khả năng bảo vệ ở mức độ hệ thống tổng thể mà còn bởi công nghệ tính toán xử lý dữ liệu lớn ngày càng tiến bộ. Trong số các dữ liệu mạng được quan tâm phân tích, các nghiên cứu gần đây tập trung vào xử lý ở các mức độ khác nhau như: phân tích URL ,header gói tin, phân tích nội dung đính kèm , phân tích dữ liệu mạng được mã hóa…

Riêng đối với các Website thì địa chỉ URL là thông tin liên kết đầu tiên thường xuyên được tương tác với người dùng. Các nhà nghiên cứu bảo mật đã phát triển các hệ thống khác nhau để bảo vệ thông tin của người dùng khỏi những cuộc tấn công trên Website. Có nhiều kỹ thuật phân tích website khác nhau nhằm tìm ra các trang web độc hại. Trong đó hướng tiếp cận sử dụng học máy để dự đoán các trang web độc hại nhận được nhiều sự quan tâm.

Công nghệ học sâu (Deep learning) hiện đang chiếm ưu thế so với các kỹ thuật học máy khác trong lĩnh vực xử lý ảnh và xử lý ngôn ngữ tự nhiên với khả năng tự động tìm và phát hiện đặc trưng của đối tượng. Đã có những nghiên cứu đánh giá so sánh giữa hai công nghệ trong bài toán phát hiện URL độc hại cho thấy Deep learning tỏ ra ưu thế vượt trội về tốc độ xử lý và phản hồi thông tin theo thời gian thực

Các bạn theo dõi để biết thêm chi tiết nhé.

--

--

Hieu Nguyen
Hieu Nguyen

Written by Hieu Nguyen

Đang nghiên cứu về Python và Machine Learning. Rất mong được trao đổi thêm với các bạn cùng lĩnh vực

No responses yet