Chúng ta nói nhiều về siêu dữ liệu, đặc biệt là kể từ khi có tiết lộ về số lượng siêu dữ liệu mà NSA đang thu thập. Phần lớn, việc họ có thể nhìn thấy những thứ đó nghe có vẻ không tệ lắm — nếu họ có thể nhìn thấy khi bạn gọi điện, nhưng không thể nghe thấy bạn nói gì, đó có phải là một vấn đề lớn như vậy không?
Siêu dữ liệu là gì?
Trước khi bắt đầu, hãy thiết lập nền tảng và đảm bảo rằng chúng ta biết chính xác siêu dữ liệu là gì. Như bạn có thể thu thập từ tên, đó là dữ liệu về dữ liệu — thông tin về thông tin. Điều này có nghĩa là gì trong thực tế rất đa dạng, nhưng điều quan trọng là nó không chứa nội dung thông điệp của bạn. Những điều bạn nói trong cuộc gọi hoặc tin nhắn đều không phải được ghi lại trong siêu dữ liệu.
Vậy đo la cai gi? Trong cuộc gọi, số điện thoại bạn gọi, số sê-ri duy nhất của điện thoại bạn gọi, thời gian và thời lượng của cuộc gọi và vị trí của từng người gọi được mã hóa trong siêu dữ liệu. Còn siêu dữ liệu từ email thì sao? Tên và địa chỉ email của người gửi và người nhận, thông tin chuyển máy chủ, chi tiết ngày và múi giờ, chủ đề của email, trạng thái biên nhận đã đọc và thông tin về ứng dụng thư đều được mã hóa trong siêu dữ liệu. Ngay cả các tweet của bạn cũng chứa siêu dữ liệu.
Vì vậy, như bạn có thể thấy, mặc dù không có nội dung nào được ghi lại, vẫn có khá nhiều thông tin có thể được nhìn thấy từ những chi tiết này ( The Guardian đã đăng một trang tương tác tuyệt vời trên siêu dữ liệu sẽ cung cấp cho bạn một vài thông tin chi tiết). Vậy chính xác thì một cơ quan tình báo có thể thu thập được điều gì từ loại thông tin này?
Nghiên cứu điển hình
Naked Security, blog của Sophos, đã báo cáo một thử nghiệm hấp dẫn được thực hiện với một số siêu dữ liệu vào cuối năm ngoái. Một người đàn ông Hà Lan đã cho phép một nhà nghiên cứu cài đặt một ứng dụng thu thập dữ liệu trên điện thoại của mình để thu thập nhiều loại siêu dữ liệu khác nhau trong một tuần. Điều này rất quan trọng — đó chỉ là siêu dữ liệu. Không có nội dung. Chỉ là những thứ mà các chính phủ trên thế giới có thể dễ dàng có được.
Các nhà nghiên cứu đã tìm ra điều gì? Tuổi của người đàn ông, thực tế là anh ta mới tốt nghiệp, anh ta đã làm việc nhiều giờ và phải đi xe lửa dài, anh ta tiếp tục làm việc đến tối muộn, anh ta thích thể thao (đặc biệt là đi xe đạp), anh ta đọc những bộ phim kinh dị Scandinavia, rằng anh ta có một người bạn gái, rằng anh ta có lẽ là một Cơ đốc nhân, mà anh ta có thể xác định với đảng Cánh tả Xanh của Hà Lan, rằng anh ta quan tâm đến công nghệ và quyền riêng tư, và rất nhiều chi tiết về công việc của anh ta:rằng anh ta là một luật sư, nơi anh ta làm việc , những loại luật mà anh ấy xử lý, những người mà anh ấy tiếp xúc trong chính phủ và một số lợi ích nghề nghiệp của anh ấy.
Ồ, và họ có thể đoán mật khẩu của các tài khoản Twitter, Google và Amazon của anh ấy bằng cách kết hợp thông tin họ nhận được từ siêu dữ liệu của anh ấy với thông tin được phát hành sau vụ hack Adobe.
Có lẽ đáng kinh ngạc nhất, các nhà nghiên cứu tuyên bố rằng các phương pháp và công cụ mà họ sử dụng kém tinh vi hơn đáng kể so với những phương pháp và công cụ mà cơ quan tình báo có thể sử dụng. Siêu dữ liệu đang bắt đầu có vẻ như là một vấn đề khá lớn, phải không?
Tất nhiên, việc để các nhà nghiên cứu có thể làm điều này trong phòng thí nghiệm và thực sự có một cơ quan chính phủ đưa nó vào thực tế là hoàn toàn khác nhau.
Ví dụ trong thế giới thực với các hệ quả trong thế giới thực
Nghề nghiệp — nếu không phải là cuộc sống — có thể bị siêu dữ liệu hủy hoại. Chỉ cần hỏi David Petraeus. Bạn có thể nhớ Petraeus như một vị tướng bốn sao được trang hoàng và rất được kính trọng, người đã điều hành các hoạt động của lực lượng Hoa Kỳ và NATO ở Afghanistan với tư cách là Tư lệnh Bộ Chỉ huy Trung tâm Hoa Kỳ. Năm 2011, ông được nhất trí xác nhận là Giám đốc CIA, nhưng ông đã từ chức vào năm 2012. Tại sao? Siêu dữ liệu.
Bạn có thể đọc toàn bộ dòng thời gian, nhưng phiên bản ngắn là thế này:Petraeus đang tham gia vào một cuộc tình ngoài hôn nhân với một thành viên khác của Quân đội, Paula Broadwell. Broadwell đã gửi một vài email đe dọa đến một người bạn của gia đình Petraeus — và sự việc có thể đã kết thúc ở đó. Nhưng FBI đã sử dụng siêu dữ liệu để theo dõi thông tin đăng nhập từ các khách sạn và tham chiếu chéo dữ liệu đó với danh sách khách, cuối cùng tiết lộ Broadwell là nguồn của các email và dẫn đến việc tiết lộ sự việc của Petraeus và việc từ chức sau đó của ông.
Phần lớn siêu dữ liệu dẫn đến việc phát hiện ra vụ việc thậm chí không đến từ các email đã gửi — Petraeus và Broadwell đã giao tiếp bằng cách đăng nhập vào cùng một tài khoản email và lưu các bản nháp mà sau đó người kia sẽ đọc. Chỉ siêu dữ liệu đăng nhập là đủ để các nhà điều tra manh mối.
Hãy nghĩ rằng các vị tướng bốn sao đang gặp rủi ro, nhưng những người dân bình thường không tạo ra siêu dữ liệu có giá trị? Hãy nói điều đó với những người biểu tình ở Ukraine, những người đã nhận được tin nhắn văn bản nói rằng "Người đăng ký thân mến, bạn đã đăng ký là người tham gia vào một vụ gây rối hàng loạt." Ở một đất nước đang trải qua tình trạng hỗn loạn về chính trị và quân sự, bạn có muốn điện thoại di động ghi lại thông báo cho chính phủ biết rằng bạn đã đến địa điểm diễn ra cuộc biểu tình không?
Bạn có thể làm gì để bảo vệ bản thân?
Thật không may, bạn không thể tắt điện thoại và chỉ sử dụng nó khi thực sự cần thiết, bạn không thể làm được gì nhiều. Ví dụ:không thể loại bỏ thông tin vị trí — điện thoại của bạn liên tục kết nối với tháp di động để có tín hiệu mạnh và kết nối với tháp đó được ghi lại. Và khi bạn gọi cho ai đó, thông tin định tuyến (điện thoại của bạn và của họ) cần phải được hiển thị tại một số thời điểm, nếu không mạng di động sẽ không biết nơi chỉ đạo cuộc gọi.
Chúng tôi đã cung cấp cho bạn rất nhiều mẹo để bảo vệ nội dung tin nhắn của bạn — bạn có thể sử dụng ứng dụng nhắn tin được mã hóa, thậm chí mã hóa cuộc gọi của mình - nhưng nếu bạn lo lắng về siêu dữ liệu, cách tốt nhất là bạn không nên cung cấp NSA (hoặc tùy chọn nào cơ quan chính phủ mà bạn đang lo lắng về) một lượng lớn dữ liệu để làm việc. Làm thế nào bạn có thể giữ hồ sơ của họ ở mức tối thiểu? Sử dụng điện thoại ghi, sử dụng nhiều điện thoại, thường xuyên thay đổi số điện thoại và sử dụng các địa chỉ email khác nhau sẽ khiến việc liên kết các phần thông tin cụ thể với bạn trở nên khó khăn hơn.
Ngoài ra, cách tốt nhất của bạn là thực hiện các hành động chính trị — tham gia các chiến dịch bảo vệ quyền riêng tư, thúc đẩy các công ty minh bạch về những gì họ đang làm với dữ liệu của bạn và bỏ phiếu bằng ví của bạn. Siêu dữ liệu luôn có ở đó, nhưng việc các công ty sẵn sàng giao nó cho chính phủ là điều mà chúng tôi có thể thay đổi.
Bạn có lo lắng về việc chính phủ nhúng tay vào siêu dữ liệu của bạn không? Bạn đã thực hiện bất kỳ biện pháp phòng ngừa nào để duy trì sự riêng tư của mình chưa? Bạn đã nghe nói đến những chiến lược nào khác để giữ siêu dữ liệu của mình ở chế độ riêng tư? Chia sẻ suy nghĩ của bạn bên dưới!
Tín dụng hình ảnh:Khái niệm hài hước với mặt nạ sân khấu qua Shutterstock, Hải quân Hoa Kỳ qua Wikimedia Commons.