Một nhóm các nhà nghiên cứu từ Đại học Cornell (Ithaca, New York) đã sử dụng AI để dự đoán gần chính xác nội dung được nhập liệu chỉ bằng cách nghe tiếng gõ phím.
Theo đó, nhóm nghiên cứu đã sử dụng cơ sở dữ liệu là âm thanh gõ phím để huấn luyện AI. Bằng cách này, AI có thể dự đoán nội dung được gõ trên bàn phím với độ chính xác lên tới 95%. Độ chính xác này chỉ giảm xuống 93% khi sử dụng Zoom để huấn luyện hệ thống.
Tuy nhiên, cách huấn luyện AI của nhóm nghiên cứu từ Đại học Cornell vẫn còn nhiều nhược điểm. Chẳng hạn, khả năng suy đoán của AI không thể áp dụng ngay lập tức với bất kỳ loại bàn phím ngẫu nhiên nào đó.
Nói cách khác, AI cần mất một khoảng thời gian để 'làm quen' với riêng từng loại bàn phím, khi mỗi tiếng gõ phím sẽ được sử dụng để làm tham chiếu cho AI đoán ký tự trong quá trình huấn luyện. Bản thân việc huấn luyện mô hình AI có thể thực hiện ngay tại chỗ bằng cách dùng micro, hoặc thậm chí thực hiện từ xa bằng ứng dụng như Zoom để ghi lại âm thanh gõ phím.
Bên cạnh đó, người dùng chỉ cần thay đổi kiểu gõ phím cũng đủ để giảm thiểu độ chính xác trong việc suy đoán nội dung được gõ của AI. Với kiểu gõ phím bằng cách chạm thật nhẹ, độ chính xác của AI trong việc nhận dạng nội dung giảm từ 64% xuống 40%. Ngoài ra, nếu có tiếng ồn làm nhiễu đầu vào, độ chính xác của AI sẽ giảm đáng kể.
Nhóm nghiên cứu đã sử dụng MacBook Pro để trình diễn khả năng của AI trong việc dự đoán nội dung. Họ đã nhấn 36 phím khác nhau, với mỗi phím được nhấn 25 lần. Đây là cơ sở để mô hình AI nhận diện ký tự nào đang được gõ tương ứng với âm thanh gõ phím phát ra. Mặc dù phần sóng âm tạo ra cho mỗi tiếng gõ phím có sự khác biệt nhỏ, AI vẫn nhận ra từng phím với độ chính xác đáng kinh ngạc.
Theo nhóm nghiên cứu, kết quả thu được mang tính tương đối và việc phân tích nội dung chỉ hiệu quả với thời gian gõ phím ngắn. Do đó, cách tấn công này chủ yếu được dùng để đánh cắp dữ liệu "nhạy cảm" và có giá trị cao, chẳng hạn tên tài khoản, mật khẩu và thông tin thẻ tín dụng.
Hình thức này cũng có một số điểm yếu. Ví dụ, AI có thể phân tích thành công thao tác nhấn phím Shift, nhưng không thể xác định được các phím nhấn kèm để suy đoán ký tự tiềm năng. Tuy nhiên, trước sự phát triển bùng nổ của AI, nhược điểm này có thể sớm được khắc phục trong tương lai.
"Với sự phát triển gần đây của công nghệ deep learning về cả hiệu suất và khả năng tiếp cận, tính khả thi của một cuộc tấn công âm thanh bằng cách nghe tiếng gõ bàn phím bắt đầu có vẻ khả thi", nhóm cảnh báo.
Phát hiện mới của nhóm nghiên cứu đã khơi dậy lo ngại về việc AI trên có thể được sử dụng cho mục đích xấu như đánh cắp dữ liệu. Tuy nhiên, để áp dụng vào thực tế, AI này còn phải cải thiện rất nhiều.
Cách giảm thiểu nguy cơ tấn công vẫn là sử dụng mật khẩu mạnh, có ký tự đặc biệt, chữ hoa, chữ thường và số. Người dùng có thể tăng mức độ bảo mật bằng cách xác thực đa lớp, dùng phương thức sinh trắc học như quét khuôn mặt, dấu vân tay để hạn chế nguy cơ.