Khai thác dữ liệu trực quan tìm kiếm kiến thức tiềm ẩn và có lợi từ các tập dữ liệu khổng lồ bằng cách sử dụng các phương pháp trực quan hóa dữ liệu và tri thức. Hệ thống thị giác của con người được quản lý bởi mắt và não, hệ thống này có thể được coi là một bộ máy xử lý và suy luận năng động, song song, bao gồm một kho kiến thức khổng lồ.
Khai phá dữ liệu trực quan có thể được coi là sự hợp nhất của hai lĩnh vực như trực quan hóa dữ liệu và khai phá dữ liệu. Nó cũng có thể kết hợp với đồ họa máy tính, hệ thống đa phương tiện, tương tác với máy tính của con người, nhận dạng mẫu và tính toán hiệu suất cao.
Nói chung, trực quan hóa dữ liệu và khai thác dữ liệu có thể được tích hợp theo những cách sau -
Trực quan hóa dữ liệu - Dữ liệu trong cơ sở dữ liệu hoặc kho dữ liệu có thể được xem xét ở nhiều mức độ chi tiết hoặc trừu tượng, hoặc như một số kết hợp của các thuộc tính hoặc thứ nguyên. Dữ liệu có thể được hiển thị ở nhiều dạng trực quan, bao gồm ô hộp, hình khối 3-D, biểu đồ phân phối dữ liệu, đường cong, bề mặt, biểu đồ liên kết, v.v.
Hình ảnh hóa kết quả khai thác dữ liệu - Trực quan hóa kết quả khai phá dữ liệu là việc trình bày kết quả hoặc kiến thức thu được từ khai phá dữ liệu dưới dạng trực quan. Các dạng như vậy có thể liên quan đến các ô phân tán và ô hộp (thu được từ khai thác dữ liệu mô tả) và cây quyết định, quy tắc kết hợp, cụm, ngoại lệ, quy tắc tổng quát, v.v.
Hình ảnh hóa quy trình khai thác dữ liệu - Loại hình trực quan này trình bày nhiều quy trình khai thác dữ liệu dưới dạng trực quan để người dùng có thể xem dữ liệu được lấy ra như thế nào và chúng được trích xuất từ cơ sở dữ liệu hoặc kho dữ liệu nào và cách dữ liệu đã chọn được làm sạch, tích hợp, xử lý trước và khai thác. Hơn nữa, nó cũng có thể cho biết phương pháp tiếp cận nào được chọn để khai thác dữ liệu, nơi lưu kết quả và cách chúng có thể được xem xét.
Khai thác dữ liệu trực quan tương tác - Trong khai thác dữ liệu trực quan tương tác, các công cụ trực quan hóa có thể được sử dụng trong quá trình khai thác dữ liệu để cung cấp cho người dùng các quyết định khai thác dữ liệu thông minh. Ví dụ, phân phối dữ liệu trong một nhóm thuộc tính có thể được hiển thị bằng cách sử dụng các khu vực màu (trong đó toàn bộ không gian được xác định bởi một vòng tròn). Màn hình này hỗ trợ người dùng quyết định khu vực nào trước tiên phải được chọn để phân loại và nơi có thể có điểm phân tách tốt nhất cho khu vực này.
Khai thác dữ liệu âm thanh cần tín hiệu âm thanh để biểu thị các mẫu dữ liệu hoặc các tính năng của kết quả khai thác dữ liệu. Mặc dù khai thác dữ liệu trực quan có thể tiết lộ các mẫu thú vị bằng cách sử dụng màn hình đồ họa, nhưng nó cần người dùng tập trung vào việc xem các mẫu và nhận ra các đặc điểm thú vị hoặc mới lạ bên trong chúng.
Nếu các mẫu có thể được thay đổi thành âm thanh và âm nhạc, thay vì xem hình ảnh, nó có thể lắng nghe cao độ, nhịp điệu, giai điệu và giai điệu để nhận ra bất kỳ điều gì thú vị hoặc bất thường. Điều này có thể giảm bớt gánh nặng khác nhau về sự tập trung thị giác và thoải mái hơn so với khai thác bằng hình ảnh. Do đó, khai thác dữ liệu âm thanh là một đối tác thú vị với khai thác trực quan.