Computer >> Máy Tính >  >> Lập trình >> Lập trình

Làm thế nào để dữ liệu được trực quan hóa để hỗ trợ việc xây dựng cây quyết định tương tác?

Phân loại dựa trên cảm nhận (PBC) là một phương pháp tương tác dựa trên các phương pháp trực quan đa chiều và cho phép người dùng kết hợp kiến ​​thức nền tảng về dữ liệu khi xây dựng cây quyết định.

Bằng cách tương tác về mặt quang học với dữ liệu, người dùng có khả năng hiểu sâu hơn về dữ liệu. Các cây kết quả có thể sẽ nhỏ hơn so với các cấu trúc sử dụng kỹ thuật quy nạp cây quyết định truyền thống và do đó, giải thích đơn giản hơn, đồng thời đạt được độ chính xác tương tự.

PBC cần một phương pháp hướng pixel để xem xét dữ liệu đa chiều với dữ liệu nhãn lớp của nó. Phương pháp phân đoạn vòng tròn được điều chỉnh để ánh xạ các đối tượng thông tin d chiều vào một vòng tròn được chia thành d phân đoạn, mỗi phân đoạn xác định một thuộc tính.

Giá trị thuộc tính của phần tử dữ liệu được ánh xạ tới một pixel có màu, bên trong nhãn lớp của đối tượng. Ánh xạ này được hoàn thành cho mọi cặp thuộc tính-giá trị của mọi đối tượng dữ liệu. Việc sắp xếp được hoàn thành cho mỗi thuộc tính để quyết định chuỗi sắp xếp trong một phân đoạn.

Ví dụ:các giá trị thuộc tính trong một phân đoạn nhất định có thể được tổ chức để hiển thị các vùng đồng nhất (liên quan đến nhãn lớp) trong giá trị thuộc tính tương tự. Lượng thông tin đào tạo có thể được dự đoán tại một thời điểm gần như được quyết định bởi sản phẩm của nhiều thuộc tính và nhiều đối tượng dữ liệu.

Hệ thống PBC hiển thị một màn hình chia nhỏ, bao gồm cửa sổ tương tác dữ liệu và cửa sổ Tương tác tri thức. Cửa sổ tương tác dữ liệu hiển thị các phân đoạn vòng tròn của dữ liệu đang được kiểm tra, trong khi cửa sổ Tương tác tri thức hiển thị cây quyết định được xây dựng cho đến nay. Toàn bộ tập huấn luyện được hiển thị trực quan trong cửa sổ tương tác dữ liệu, trong khi cửa sổ Tương tác tri thức hiển thị cây quyết định rỗng.

Các thuật toán cây quyết định truyền thống chỉ cho phép phân tách nhị phân cho các thuộc tính thống kê. PBC cho phép người dùng xác định nhiều điểm phân tách, dẫn đến một số nhánh được phát triển từ một nút cây riêng lẻ.

Một cây được xây dựng tương tác như sau. Người dùng dự đoán dữ liệu nhiều chiều trong cửa sổ Tương tác dữ liệu và chọn một thuộc tính phân tách và nhiều điểm phân tách. Cây quyết định hiện đại trong cửa sổ Tương tác tri thức được mở rộng.

Người dùng chọn một nút của cây quyết định. Người dùng có thể tạo nhãn lớp cho nút (tạo cho nút một lá) hoặc yêu cầu hiển thị thông tin huấn luyện tương đương với nút. Điều này dẫn đến một hình dung mới về từng thuộc tính ngoại trừ những thuộc tính được sử dụng để tách phần tử trên đường dẫn tương tự từ gốc. Quy trình tương tác tiếp tục cho đến khi một lớp được tạo cho mọi lá của cây quyết định.