Computer >> Máy Tính >  >> Kết nối mạng >> An ninh mạng

Siêu dữ liệu là gì và nó có thể tiết lộ gì về bạn?

Thuật ngữ siêu dữ liệu đã xuất hiện từ cuối thế kỷ 20. Nhưng nó đã chiếm được phần lớn các tiêu đề công nghệ trong vài năm qua, làm nổi bật tầm quan trọng của việc hiểu khái niệm này có ý nghĩa như thế nào đối với dữ liệu cá nhân, quyền riêng tư và bảo mật của bạn.

Trước khi đưa ra quyết định về việc siêu dữ liệu có xứng đáng với tất cả sự chú ý mà nó đang nhận được hay không, trước tiên bạn cần hiểu ý nghĩa của nó và cách nó có thể ảnh hưởng đến cuộc sống kỹ thuật số của bạn. Vậy đo la cai gi? Siêu dữ liệu có thể tiết lộ điều gì về bạn? Và bạn có thể làm gì với nó?

Siêu dữ liệu là gì?

Bản dịch theo nghĩa đen của từ siêu dữ liệu là "về dữ liệu". Mặc dù siêu dữ liệu hiếm khi được phân loại là dữ liệu hữu ích, nhưng nó thường là bản tóm tắt của một tập dữ liệu lớn hơn nhiều — bất kỳ thứ gì từ tệp âm thanh và thông tin liên lạc đến hình ảnh và video. Nhưng siêu dữ liệu không chỉ là một bổ sung vô ích cho một tập hợp thông tin đã hoàn chỉnh.

Bạn có thể coi siêu dữ liệu là thông tin bên ngoài của một cuốn sách cùng với mục lục. Họ không làm hỏng toàn bộ cuốn sách; chúng cho phép bạn phân loại nó đúng cách mà không cần phải đọc toàn bộ.

Đối với các loại, siêu dữ liệu thường được phân loại tùy thuộc vào loại thông tin mà nó tiết lộ về tệp nguồn. Một tệp duy nhất có thể chứa nhiều loại siêu dữ liệu để cho phép các hệ thống điện tử cũng như người dùng, tổ chức và phân loại tệp tốt hơn.

Siêu dữ liệu mô tả

Như tên cho thấy, siêu dữ liệu mô tả mô tả nội dung của tệp được đề cập. Thông tin trong siêu dữ liệu mô tả thường được sử dụng để lọc và tìm kiếm thông qua một thư viện tệp lớn — thường là cùng một loại.

Đây là loại siêu dữ liệu được sử dụng phổ biến nhất. Siêu dữ liệu mô tả thường bao gồm tên của người tạo tệp, ngày tạo và thông tin quan trọng khác như thể loại, album và thậm chí cả ảnh bìa nếu đó là tệp âm thanh và ISBN cũng như tên tác giả của sách.

Siêu dữ liệu cấu trúc

Siêu dữ liệu là gì và nó có thể tiết lộ gì về bạn?

Siêu dữ liệu cấu trúc cung cấp thông tin về thành phần và bố cục của dữ liệu trong một tệp cụ thể. Mặc dù thông tin này có thể được sử dụng để lọc, nhưng nó thường dành riêng cho việc khám phá sâu hơn và phân loại tệp.

Siêu dữ liệu cấu trúc có nhiều loại như độ dài của tệp âm thanh, số trang trong sách, mục lục và tiêu đề của các chương.

Siêu dữ liệu quản trị

Siêu dữ liệu quản trị có bản chất kỹ thuật. Nó chứa thông tin về cách mở và chạy tệp, bao gồm cả thông tin như định dạng của tệp. Loại siêu dữ liệu này có trong hầu hết các tệp và được đọc bởi thiết bị của bạn cũng như phần mềm hoặc ứng dụng bạn sử dụng để chạy tệp.

Trong một số trường hợp, siêu dữ liệu quản trị cũng được phân loại là siêu dữ liệu quyền, bao gồm thông tin liên quan đến tài sản trí tuệ của tệp và ai có quyền truy cập hợp pháp vào tệp đó.

Siêu dữ liệu pháp lý cung cấp nghiêm ngặt thông tin về tình trạng pháp lý của tệp. Điều này bao gồm ai hoặc những gì bản quyền của tệp thuộc về loại cấp phép công cộng hoặc tư nhân mà tệp có và bất kỳ thỏa thuận bổ sung, ràng buộc pháp lý nào.

Tại sao Siêu dữ liệu lại quan trọng?

Bất kể bạn đang sử dụng định dạng tệp nào và bạn đã tạo tệp, nhận tệp từ bạn bè hay tải xuống, siêu dữ liệu đóng một vai trò trong cuộc sống kỹ thuật số hàng ngày của bạn. Và mặc dù siêu dữ liệu thông tin chứa có thể ngắn gọn và hầu như không đáng kể, nhưng nó có thể bị thao túng và vá lại với nhau để vi phạm quyền riêng tư và bảo mật của bạn.

Nếu siêu dữ liệu của một hoặc nhiều tệp của bạn đã từng bị lộ ra ngoài, thì siêu dữ liệu đó sẽ không tiết lộ nội dung của tệp. Thay vào đó, nó trả lời các câu hỏi cơ bản như:

  • Tệp này thuộc về ai?
  • Nó chứa loại thông tin nào?
  • Nó được tạo và lưu ở đâu?
  • Nó được tạo khi nào và nó đã được chủ sở hữu hiện tại chỉnh sửa chưa?

Nhưng câu trả lời cho tất cả những câu hỏi đó gộp lại vẫn còn rất ít ý nghĩa. Thông tin cấp độ bề mặt này có thể tiết lộ bao nhiêu về một người?

Siêu dữ liệu có thể tiết lộ điều gì về bạn?

Siêu dữ liệu là gì và nó có thể tiết lộ gì về bạn?

Riêng bản thân, thông tin được thu thập từ một số tệp và hành động trên web là rất nhỏ.

Tuy nhiên, vấn đề nảy sinh khi siêu dữ liệu về một người được thu thập từ hàng nghìn nguồn trong một thời gian dài. Điều này bao gồm người mà bạn thường xuyên trò chuyện qua điện thoại và thư từ qua email của bạn, ngay cả khi họ không có quyền truy cập vào nội dung cuộc trò chuyện của bạn.

Với sự ra đời của tính năng theo dõi siêu dữ liệu của các loại thông tin mới, chẳng hạn như hình ảnh, nhiều thông tin hơn về bạn được hiển thị. Những bức ảnh tự chụp thường xuyên và những bức ảnh về bữa tối của bạn được tải lên Twitter và Instagram có thể tiết lộ những vị trí mà bạn thường xuyên lui tới nhất, ngay cả khi bạn không gắn thẻ chúng — đó là lý do tại sao ứng dụng máy ảnh của bạn yêu cầu quyền truy cập vào vị trí của bạn.

Về bản chất, siêu dữ liệu bị lộ là vi phạm quyền riêng tư. Nó cho phép bất kỳ ai có quyền truy cập vào nó để theo dõi các chuyển động và kiểu giao tiếp của bạn. Nhưng với đủ thông tin và hệ thống AI tốt, họ thậm chí có thể bắt đầu dự đoán các chuyển động và hoạt động sắp tới của bạn.

Mặc dù bạn có thể nhận thấy rằng việc theo dõi khi bạn nói chuyện với bạn bè và gia đình của mình, nhưng kết luận mà hệ thống phân tích tiên tiến đạt được có thể mang tính xâm phạm nhiều hơn. Rốt cuộc, các công ty theo dõi bạn giờ đây biết khi nào bạn liên hệ với các nhà cung cấp dịch vụ chăm sóc sức khỏe và bảo hiểm cũng như loại thông tin bạn đang tìm kiếm trực tuyến.

Một cuộc khảo sát của Security.org đã xem xét loại dữ liệu mà các trang web lớn nhất trên internet thu thập, ngay cả khi họ không cần phải làm như vậy. Cuộc khảo sát bao gồm các trang web truyền thông xã hội như Facebook, Twitter, và thậm chí cả Google, và phát hiện ra rằng phần lớn trong số họ lưu giữ thông tin người dùng mà họ không cần.

Dữ liệu bao gồm số nhận dạng duy nhất, thông tin cá nhân, vị trí và hoạt động của người dùng. Thường xuyên hơn không, bạn không thể chọn không tham gia loại thu thập dữ liệu này, ngay cả khi bạn chỉ cho phép theo dõi và cookie thực sự cần thiết.

Bạn tự bảo vệ mình bằng cách nào?

Siêu dữ liệu là gì và nó có thể tiết lộ gì về bạn?

Sử dụng VPN để che giấu bất kỳ số nhận dạng nào bạn có thể để trực tuyến, chấp nhận số lượng cookie và trình theo dõi ít ​​nhất mà bạn có thể có khi truy cập bất kỳ trang web nào và chống theo dõi các tiện ích mở rộng của trình duyệt. Đối với thông tin cá nhân khác, hãy đảm bảo bạn xóa siêu dữ liệu khỏi bất kỳ tệp nào trước khi tải tệp đó lên internet hoặc thậm chí gửi cho bạn bè.

Mặc dù gần như không thể tránh hoàn toàn việc để lại các theo dõi dữ liệu trực tuyến, đặc biệt là trên các trang web mà bạn có tài khoản trên đó, nhưng bạn có thể giảm thiểu thông tin họ có về bạn.