Mạng chức năng cơ sở hướng tâm là gì?

Loại mạng chuyển tiếp phổ biến là mạng chức năng cơ sở xuyên tâm (RBF). Nó có hai lớp, không tính lớp đầu vào và tương phản với perceptron nhiều lớp trong phương thức mà các đơn vị ẩn thực hiện tính toán.

Mỗi đơn vị ẩn xác định đáng kể một điểm cụ thể trong không gian đầu vào và đầu ra hoặc kích hoạt của nó đối với một cá thể nhất định dựa trên khoảng cách giữa điểm của nó và cá thể, chỉ là một điểm khác nhau. Hai điểm này càng gần nhau, kích hoạt càng tốt.

Điều này được thực hiện bằng cách sử dụng một hàm biến đổi phi tuyến để sửa đổi khoảng cách thành một số đo tương tự. Một dịch vụ kích hoạt Gaussian hình chuông có chiều rộng có thể khác nhau cho mỗi đơn vị ẩn thường được sử dụng cho mục tiêu này. Các đơn vị ẩn được gọi là RBF vì các điểm trong khu vực cá thể mà một đơn vị ẩn nhất định tạo ra một kích hoạt tương tự tạo thành một hypersphere hoặc hyperellipsoid.

Lớp đầu ra của cấu trúc RBF tương tự như lớp của perceptron nhiều lớp - Nó nhận một tập hợp tuyến tính các kết quả đầu ra của các đơn vị ẩn và trong các vấn đề phân loại chuyển nó qua hàm sigmoid.

Các tham số mà một mạng như vậy hiểu là trung tâm và chiều rộng của RBF và trọng số được sử dụng để thiết kế tập hợp tuyến tính của các đầu ra thu được từ lớp ẩn. Một lợi ích thiết yếu đối với các perceptron nhiều lớp là nhóm tham số đầu tiên có thể được quyết định độc lập với nhóm thứ hai và tạo ra các bộ phân loại chính xác.

Một phương pháp để quyết định nhóm tham số đầu tiên là sử dụng phân cụm. Thuật toán phân cụm k-mean đơn giản có thể được áp dụng, phân nhóm từng lớp một cách độc lập để thu được các hàm cơ sở k cho mỗi lớp.

Nhóm tham số thứ hai được hiểu bằng cách giữ cho các tham số đầu tiên không đổi. Điều này bao gồm việc học một bộ phân loại tuyến tính đơn giản bằng cách sử dụng một trong các cách tiếp cận như hồi quy tuyến tính hoặc logistic. Nếu có ít đơn vị ẩn hơn các phiên bản huấn luyện, thì việc này có thể được thực hiện nhanh chóng.

Hạn chế của mạng RBF là chúng cung cấp cho mỗi thuộc tính có trọng số tương tự nhau vì tất cả đều được coi là như nhau trong tính toán khoảng cách trừ khi các tham số trọng số thuộc tính được chứa trong quá trình tối ưu hóa hoàn chỉnh.

Do đó, chúng không thể đối phó hiệu quả với các thuộc tính không phù hợp, chống lại các perceptron nhiều lớp. Máy vectơ hỗ trợ chia sẻ các vấn đề tương tự. Máy vectơ hỗ trợ với hạt nhân Gaussian (tức là “hạt nhân RBF”) là một phương pháp xác định của mạng RBF, trong đó một hàm được tập trung vào mỗi phiên bản huấn luyện, tất cả các hàm cơ sở có độ rộng tương tự và kết quả đầu ra được hợp nhất tuyến tính bằng cách tính siêu phẳng có lợi nhuận tối đa. Điều này dẫn đến kết quả là một số RBF có trọng số khác với trọng số xác định các vectơ hỗ trợ.