Computer >> Máy Tính >  >> Lập trình >> Lập trình

SOM là gì?

SOM đại diện cho Bản đồ Tính năng Tự tổ chức. Nó là một phương pháp phân cụm và các phương pháp trực quan hóa dữ liệu phụ thuộc vào quan điểm mạng nơ-ron. Mục tiêu của SOM là khám phá một tập hợp các trọng tâm (vectơ tham chiếu trong thuật ngữ SOM) và tạo từng đối tượng trong tập dữ liệu thành trung tâm hỗ trợ độ gần tốt nhất của đối tượng đó. Trong các phương thức mạng nơ-ron, có một nơ-ron liên quan đến mỗi trung tâm.

Giống như với K-mean tăng dần, các đối tượng dữ liệu được phân chia theo từng giai đoạn và tâm điểm gần nhất được làm mới. Không giống như K-mean, SOM áp đặt trình tự địa hình trên các trung tâm và các trung tâm gần đó cũng được nâng cấp. Hơn nữa, SOM không lưu lại dấu hiệu về thành viên cụm gần đây của một đối tượng và, không giống như K-mean, nếu một đối tượng chuyển cụm, sẽ không có sự làm mới cụ thể của trung tâm cụm cũ.

Cụm cũ có thể nằm trong vùng lân cận của cụm mới và do đó taxi được cập nhật vì lý do đó. Quá trình xử lý điểm tiếp tục cho đến khi đạt đến một số giới hạn được quyết định trước hoặc các trung tâm không biến đổi nhiều. Đầu ra cuối cùng của các phương pháp SOM là một tập hợp các trọng tâm đại diện ngầm cho các cụm. Mỗi cụm bao gồm các điểm gần nhất với một trung tâm cụ thể.

Mỗi centroid được tạo ra một cặp tọa độ (i, j). Đôi khi, một mạng như vậy được vẽ bằng kết nối giữa các nút liền kề, nhưng điều đó có thể gây hiểu lầm vì sức mạnh của một tâm này trên một tâm khác là một vùng lân cận được biểu diễn bằng phương pháp tọa độ, không phải liên kết. Có một số loại mạng nơ-ron SOM, nhưng nó có thể giới hạn cuộc thảo luận này trong các SOM hai chiều với tổ chức hình chữ nhật hoặc hình lục giác của các tâm.

Các trung tâm được sử dụng trong SOM có mối quan hệ trình tự địa hình được quyết định trước. Trong quá trình đào tạo, SOM cần mỗi điểm dữ liệu để làm mới centroid và centroid gần nhất trong trình tự địa hình. Trong phương pháp này, SOM tạo ra một tập hợp các trọng tâm có thứ tự cho bất kỳ tập dữ liệu nhất định nào.

Nói cách khác, các trung tâm gần nhau trong lưới SOM liên kết chặt chẽ với nhau hơn là các trung tâm ở xa hơn. Do hạn chế này, các trọng tâm của SOM hai chiều có thể được coi là nằm trên một bề mặt hai chiều cố gắng khớp với dữ liệu n chiều hơn nữa có thể.