Computer >> Máy Tính >  >> Lập trình >> Lập trình

Các phương pháp thể hiện điều kiện kiểm tra thuộc tính là gì?

Quy nạp cây quyết định là việc học các cây quyết định từ các bộ đào tạo có nhãn lớp. Cây quyết định là một cấu trúc cây giống như sơ đồ tuần tự, trong đó mỗi nút bên trong (nút không phải nút) chỉ ra một thử nghiệm trên một thuộc tính, mỗi nhánh xác định một kết quả của thử nghiệm và mỗi nút lá (hoặc nút đầu cuối) ảnh hưởng đến một lớp nhãn. Nút lớn nhất trong cây là nút gốc.

Quy nạp cây quyết định tạo ra một cấu trúc giống như lưu đồ trong đó mỗi nút bên trong (không phải lá) chỉ ra một bài kiểm tra trên một thuộc tính, mỗi nhánh tương ứng với một kết quả của bài kiểm tra và mỗi nút bên ngoài (lá) biểu thị một dự đoán lớp.

Tại mỗi nút, thuật toán chọn thuộc tính “tốt nhất” để chia dữ liệu thành các lớp đơn. Khi quy nạp cây quyết định được sử dụng để lựa chọn tập hợp con thuộc tính, cây sẽ được tạo từ dữ liệu đã cho.

Một số thuộc tính không xuất hiện trong cây được coi là không liên quan. Tập hợp các thuộc tính xuất hiện trong cây tạo thành tập hợp con giảm dần của các thuộc tính. Các thuật toán quy nạp cây quyết định hỗ trợ một cách tiếp cận để xác định một điều kiện kiểm tra thuộc tính và các kết quả tương quan của nó cho nhiều loại thuộc tính.

Thuộc tính nhị phân - Thuộc tính nhị phân là thuộc tính danh nghĩa chỉ có hai phần tử hoặc trạng thái bao gồm 0 hoặc 1, trong đó 0 thường biểu thị rằng thuộc tính vắng mặt và 1 biểu thị rằng nó có mặt. Thuộc tính nhị phân được định nghĩa là Boolean nếu hai trạng thái tương đương với true và false.

Thuộc tính nhị phân là đối xứng nếu cả hai trạng thái của nó đều có giá trị như nhau và có trọng số bằng nhau. Không có tùy chọn nào về việc kết quả phải được mã hóa là 0 hoặc 1. Một ví dụ có thể là thuộc tính giới tính có trạng thái nam và nữ.

Thuộc tính nhị phân là không đối xứng nếu kết quả của các trạng thái không thiết yếu như nhau, chẳng hạn như kết quả tích cực và tiêu cực của kiểm tra y tế đối với HIV. Theo quy ước, nó có thể mã hóa kết quả quan trọng nhất, thường là kết quả gần nhất, bằng 1 (ví dụ:HIV dương tính) và khác nhau bằng 0 (ví dụ:HIV âm tính).

Thuộc tính danh nghĩa - Nominal xác định liên kết với tên. Các giá trị của thuộc tính danh nghĩa là ký hiệu hoặc tên của sự vật. Mỗi giá trị xác định một số loại danh mục, mã hoặc trạng thái, v.v. Các thuộc tính danh nghĩa được định nghĩa là phân loại. Các giá trị không có bất kỳ thứ tự quan trọng nào. Trong khoa học máy tính, các giá trị còn được gọi là liệt kê.

Thuộc tính thông thường - Thuộc tính thứ tự là một thuộc tính có các giá trị áp dụng có một chuỗi hoặc xếp hạng thiết yếu trong số chúng, nhưng độ lớn giữa các giá trị liên tiếp là không xác định.

Các thuộc tính thứ tự có thể tạo ra các phân tách nhị phân hoặc đa đường. Các giá trị thuộc tính thứ tự có thể được kết hợp với nhau nếu việc nhóm không vi phạm bản chất thứ tự của các giá trị thuộc tính.

Thuộc tính số - Thuộc tính số là định lượng. Nó là một đại lượng có thể tính toán được, được biểu diễn bằng số hoặc giá trị thực. Nó có thể được chia tỷ lệ theo khoảng hoặc theo tỷ lệ.