Computer >> Máy Tính >  >> Lập trình >> Lập trình

Mạng lưới tín ngưỡng Bayes học như thế nào?

Bộ phân loại Bayes là bộ phân loại thống kê. Họ có thể dự đoán xác suất thành viên của lớp, bao gồm xác suất mà một mẫu nhất định thuộc về một lớp cụ thể. Các bộ phân loại Bayesian cũng hiển thị hiệu quả và tốc độ lớn khi nó có thể nâng cao cơ sở dữ liệu.

Khi các lớp được xác định, hệ thống sẽ suy ra các quy tắc chi phối việc phân loại, do đó hệ thống sẽ có thể tìm thấy mô tả của mỗi lớp. Các mô tả chỉ nên tham chiếu đến các thuộc tính dự đoán của tập huấn luyện để chỉ các ví dụ tích cực mới thỏa mãn mô tả chứ không phải các ví dụ tiêu cực. Một quy tắc được cho là đúng nếu mô tả của nó bao gồm tất cả các ví dụ tích cực và không có ví dụ tiêu cực nào về một lớp được đề cập.

Giả sử rằng các đóng góp của tất cả các thuộc tính là độc lập và mỗi thuộc tính đều đóng góp như nhau vào vấn đề phân loại, một sơ đồ phân loại đơn giản được gọi là phân loại Naïve Bayes. Bằng cách phân tích sự đóng góp của từng thuộc tính "độc lập", xác suất có điều kiện được xác định. Việc phân loại được thực hiện bằng cách kết hợp tác động của một số thuộc tính đối với dự đoán sẽ được tạo.

Phân loại Naïve Bayes được gọi là Naïve vì nó giả định tính độc lập có điều kiện của lớp. Ảnh hưởng của một giá trị thuộc tính trên một lớp nhất định là độc lập với các giá trị của các thuộc tính khác. Giả định này được thực hiện để giảm chi phí tính toán và do đó được coi là Ngại ngùng.

Trong việc học hoặc đào tạo mạng lưới niềm tin, có thể có nhiều tình huống. Cấu trúc liên kết mạng có thể được đưa ra trước hoặc được suy ra từ thông tin. Các biến mạng có thể quan sát được hoặc riêng tư trong một số bộ dữ liệu huấn luyện. Phương thức của dữ liệu ẩn được xác định là các giá trị bị thiếu hoặc thông tin không đầy đủ.

Có nhiều thuật toán tồn tại để hiểu cấu trúc liên kết mạng từ các bản ghi huấn luyện đưa ra các biến có thể quan sát được. Vấn đề là tối ưu hóa rời rạc. Các chuyên gia con người thường nắm rõ các yếu tố phụ thuộc có điều kiện trực tiếp ảnh hưởng đến miền được phân tích, hỗ trợ trong thiết kế mạng. Các chuyên gia nên xác định xác suất có điều kiện cho các nút hoạt động phụ thuộc trực tiếp.

Các xác suất này có thể được sử dụng để đánh giá các giá trị xác suất còn lại. Nếu cấu trúc liên kết mạng được thừa nhận và các biến có thể quan sát được, thì việc huấn luyện mạng sẽ đơn giản. Nó bao gồm việc tính toán các mục nhập CPT, như được thực hiện tương tự khi tính toán các xác suất liên quan đến phân loại Bayes đơn thuần.

Khi cấu trúc liên kết mạng được đưa ra và một số biến bị ẩn, có một số phương pháp để chọn từ việc đào tạo mạng niềm tin. Nó có thể xác định một phương pháp giảm độ dốc đầy hứa hẹn. Đối với những người không có nền tảng số nâng cao, định nghĩa có thể khá đáng sợ với các công thức tính toán đóng gói của nó.