Computer >> Máy Tính >  >> Lập trình >> Lập trình

Các tác động xã hội của việc khai thác dữ liệu là gì?

Khai phá dữ liệu là quá trình tìm kiếm các mối tương quan, các mẫu và xu hướng mới hữu ích bằng cách chuyển qua một lượng lớn dữ liệu được lưu trong các kho lưu trữ, sử dụng các công nghệ nhận dạng mẫu bao gồm các kỹ thuật thống kê và toán học. Đó là việc phân tích các tập dữ liệu thực tế để phát hiện ra các mối quan hệ không đáng nghi ngờ và để tóm tắt các bản ghi theo các phương pháp mới vừa hợp lý vừa hữu ích cho chủ sở hữu dữ liệu.

Hệ thống khai thác dữ liệu được thiết kế để thúc đẩy việc xác định và phân loại các cá nhân thành các nhóm hoặc phân khúc khác nhau. Từ khía cạnh của công ty thương mại và có thể đối với toàn ngành, nó có thể hiểu việc sử dụng khai thác dữ liệu như một công nghệ phân biệt đối xử để tìm kiếm lợi nhuận một cách hợp lý.

Có nhiều tác động xã hội khác nhau của việc khai thác dữ liệu như sau -

Quyền riêng tư - Đó là một vấn đề tải. Trong những năm gần đây, những lo ngại về quyền riêng tư đã đóng một vai trò quan trọng hơn trong xã hội Hoa Kỳ khi các thương gia, công ty bảo hiểm và cơ quan chính phủ tích lũy kho bao gồm cả hồ sơ cá nhân.

Mối quan tâm của mọi người về nhóm dữ liệu này thường sẽ mở rộng đến một số khả năng phân tích được sử dụng cho dữ liệu. Người dùng khai thác dữ liệu nên bắt đầu suy nghĩ về việc họ sử dụng công nghệ này sẽ bị ảnh hưởng như thế nào bởi các vấn đề pháp lý liên quan đến quyền riêng tư.

Hồ sơ - Khai thác dữ liệu và lập hồ sơ là một lĩnh vực đang phát triển nhằm tổ chức, hiểu, phân tích, lập luận và sử dụng sự bùng nổ dữ liệu trong thời đại thông tin này. Quá trình này bao gồm việc sử dụng các thuật toán và kinh nghiệm để trích xuất thiết kế hoặc các điểm bất thường rất phức tạp, khó hoặc tốn thời gian để nhận ra.

Người sáng lập Nhóm thám hiểm của Microsoft đã sử dụng các thuật toán khai thác dữ liệu phức tạp để giải quyết một vấn đề đã ám ảnh các nhà thiên văn học trong một số năm. Vấn đề xem xét, mô tả và phân loại 2 tỷ vật thể trên bầu trời được ghi nhận trong hơn 3 thập kỷ. Thuật toán trích xuất thiết kế có liên quan để phân bổ các đối tượng trên bầu trời như các ngôi sao hoặc thiên hà. Các thuật toán có thể trích xuất tính năng biểu thị các vật thể trên bầu trời dưới dạng sao hoặc thiên hà. Lĩnh vực khai thác và lập hồ sơ dữ liệu đang phát triển này có một số biên giới nơi nó có thể được sử dụng.

Được sử dụng trái phép - Các xu hướng thu được thông qua khai thác dữ liệu được thiết kế để sử dụng cho các mục tiêu tiếp thị hoặc một số mục tiêu đạo đức khác, có thể bị sử dụng sai. Các doanh nghiệp hoặc những người không có đạo đức có thể sử dụng dữ liệu thu được thông qua khai thác dữ liệu để mang lại lợi ích cho những người dễ bị tổn thương hoặc phân biệt đối xử chống lại một nhóm người cụ thể. Hơn nữa, kỹ thuật khai thác dữ liệu không chính xác 100 phần trăm; do đó sai lầm xuất hiện có thể dẫn đến hậu quả nghiêm trọng.