Post

RiftNet: Ứng dụng RiftNet cho bài toán phân loại tín hiệu

Nội dung

1. Giới thiệu

RiftNet là mô hình học sâu được thiết kế để phân loại và nhận dạng thiết bị dựa trên tín hiệu vô tuyến (Radio Frequency - RF). Trong bối cảnh mạng không dây phát triển nhanh, bảo mật và nhận diện thiết bị trở thành thách thức lớn. Kỹ thuật Radio Frequency Fingerprinting (RFF) giúp nhận dạng thiết bị bằng đặc trưng tín hiệu riêng biệt, và RiftNet tận dụng các phương pháp học sâu để nâng cao độ chính xác nhận diện này.

2. Kiến trúc của RiftNet

RiftNet gồm hai nhánh xử lý tín hiệu song song, nhằm khai thác đặc trưng theo các mức thời gian khác nhau.

kiến trúc mô hình RiftNet kiến trúc mô hình RiftNet

2.1 Hai nhánh xử lý tín hiệu

Mô hình RiftNet gồm hai nhánh xử lý tín hiệu riêng biệt, nhằm khai thác đặc trưng đa cấp độ thời gian của tín hiệu RF:

  • Nhánh trái nhận đoạn tín hiệu dài 16μs, cho phép mô hình nắm bắt các đặc trưng dài hạn, như các biến đổi chậm, cấu trúc tổng thể của sóng, hoặc các đặc điểm ổn định của thiết bị. Nhánh này giúp phân tích tín hiệu trên phạm vi thời gian rộng hơn, từ đó nâng cao khả năng nhận diện tổng thể.

  • Nhánh phải xử lý đoạn tín hiệu ngắn hơn, chỉ 4μs, tập trung vào những đặc trưng ngắn hạn, tức là các chi tiết biến đổi nhanh, những mẫu sóng nhỏ và đặc trưng tinh vi mà có thể bị bỏ lỡ nếu chỉ dùng đoạn dài. Nhánh này giúp mô hình nắm bắt các tín hiệu đặc trưng ở mức chi tiết cao hơn.

Việc kết hợp song song hai nhánh cho phép RiftNet khai thác thông tin đa tầng, cả từ các mẫu dài hạn và ngắn hạn, giúp mô hình phân biệt các thiết bị phát tín hiệu một cách hiệu quả hơn.


2.2 Dilated Convolutional Cells (DCC)

Mỗi nhánh của RiftNet sử dụng các khối Dilated Convolutional Cells (DCC) – là các lớp convolution 1D với cơ chế giãn cách (dilation) trên kernel.

  • Dilation giúp mở rộng “phạm vi nhìn” (receptive field) của từng neuron mà không cần tăng kích thước kernel hay giảm độ phân giải. Nhờ đó, mô hình có thể học được các đặc trưng tín hiệu ở nhiều quy mô thời gian khác nhau, từ các chi tiết nhỏ đến các mẫu lớn hơn.

  • Trong RiftNet, các khối DCC được xếp chồng với các tỉ lệ dilation tăng dần (1, 2, 4, 8, 16, …) giúp thu nhận thông tin tín hiệu ở các mức độ thời gian khác nhau, tăng khả năng trích xuất đặc trưng phong phú và chính xác.


2.3 Kết nối tắt (Skip Connections) và tổng hợp đặc trưng

Để tránh mất mát thông tin khi dữ liệu đi sâu qua nhiều tầng, RiftNet sử dụng các kết nối tắt (skip connections).

  • Các kết quả trung gian từ các khối DCC được kết nối tắt, giúp giữ lại đặc trưng quan trọng và cải thiện quá trình lan truyền gradient khi huấn luyện.

  • Việc tổng hợp đặc trưng từ nhiều tầng giúp mô hình hội tụ tốt hơn và nắm bắt đa dạng đặc điểm tín hiệu hơn.


2.4 Lớp phân loại cuối cùng

Sau khi trích xuất và tổng hợp đặc trưng từ hai nhánh, các vector đặc trưng được ghép nối và đưa vào lớp phân loại cuối cùng.

  • Lớp này thường là một mạng fully connected với các tầng ẩn, kích hoạt ReLU, và tầng softmax để dự đoán nhãn thiết bị phát tín hiệu.

  • Qua đó, mô hình phân biệt chính xác thiết bị dựa trên đặc trưng tín hiệu RF được học.


3. Luồng hoạt động của mô hình RiftNet

  1. Tiền xử lý: Tách tín hiệu đầu vào thành hai đoạn: dài 16μs và ngắn 4μs.
  2. Xử lý đặc trưng: Hai nhánh trái – phải xử lý song song hai đoạn tín hiệu qua các khối DCC với dilation khác nhau.
  3. Tổng hợp: Kết nối tắt và tổng hợp đặc trưng từ các tầng DCC để giữ thông tin đa cấp.
  4. Phân loại: Ghép nối đặc trưng từ hai nhánh, đưa vào tầng phân loại cuối cùng để dự đoán nhãn thiết bị phát tín hiệu.

4. Ưu điểm và hạn chế

Ưu điểm:

  • Khai thác hiệu quả đặc trưng tín hiệu dài hạn và ngắn hạn.
  • Sử dụng DCC giúp mở rộng phạm vi tiếp nhận thông tin mà không làm mất chi tiết.
  • Kết nối tắt giữ thông tin quan trọng xuyên suốt mạng.

Hạn chế:

  • Cần lượng lớn dữ liệu đa dạng để huấn luyện mô hình tốt.
  • Mô hình có độ phức tạp cao, yêu cầu tài nguyên tính toán.

5. Huấn luyện và đánh giá mô hình

Bộ dữ liệu sử dụng trong nghiên cứu lấy từ tín hiệu Bluetooth, được thu thập với tỉ lệ lấy mẫu 250 Msps. Dữ liệu này do Emre Uzundurukan và cộng sự công bố trên Zenodo (link dataset). Bộ dữ liệu gồm 13 thiết bị Bluetooth từ 5 thương hiệu khác nhau, mỗi thiết bị có khoảng 150 tín hiệu, tổng cộng gần 1950 bản ghi. Dữ liệu được chia thành 80% cho huấn luyện và 20% để kiểm tra.

danh sách thiết bị Bluetooth trong tập dữ liệu 250 Msps danh sách thiết bị Bluetooth trong tập dữ liệu 250 Msps

Download source code

Quá trình huấn luyện sử dụng các kỹ thuật tăng cường dữ liệu và tối ưu hàm mất mát phân loại. Kết quả huấn luyện RiftNet thể hiện mô hình hội tụ nhanh và ổn định, với hàm mất mát giảm mạnh trong các epoch đầu và dần ổn định về sau. Điều này chứng tỏ mô hình học được đặc trưng tín hiệu hiệu quả ngay từ giai đoạn đầu.

Hiệu suất phân loại trên cả tập huấn luyện và tập kiểm tra tăng đều qua các epoch, cho thấy khả năng học sâu tốt và khả năng tổng quát hóa hiệu quả. Kết quả tốt nhất đạt được tại epoch 40 với độ chính xác tập train là 98.5% và tập test là 96.44%.

Tuy nhiên, hiệu suất trên tập kiểm tra có dao động nhẹ giữa các epoch, có thể do kích thước tập test còn nhỏ và chưa đa dạng, dẫn đến hiện tượng mô hình bị ảnh hưởng bởi sự khác biệt phân bố dữ liệu (distribution shift).


6. Ứng dụng và tiềm năng phát triển

RiftNet có thể được áp dụng trong bảo mật mạng IoT, giúp nhận diện thiết bị đáng tin cậy và phát hiện thiết bị lạ xâm nhập. Trong tương lai, mô hình sẽ được cải tiến để nâng cao khả năng tổng quát và phát hiện thiết bị mới chưa xuất hiện trong dữ liệu huấn luyện, góp phần bảo vệ mạng không dây hiệu quả hơn.

7. Tham khảo

[1] Emre Uzundurukan, Yaser Dalveren, and Ali Kara. A database for the radio frequency fingerprinting of bluetooth devices. Data, 5(2):55, 2020. 🔗 https://www.mdpi.com/2306-5729/5/2/55

[2] Josh Robinson and Scott Kuzdeba. Riftnet: Radio frequency classification for large populations. In 2021 IEEE 18th Annual Consumer Communications & Networking Conference (CCNC), pages 1–6, IEEE, 2021. 🔗 https://ieeexplore.ieee.org/document/9369455/

This post is licensed under CC BY 4.0 by the author.