Học không giám sát là khi nó có thể cung cấp một tập hợp dữ liệu không có nhãn, bắt buộc phải phân tích và tìm ra các mẫu bên trong. Các ví dụ là giảm thứ nguyên và phân nhóm. Việc đào tạo được hỗ trợ cho máy với nhóm dữ liệu chưa được gắn nhãn, phân loại hoặc phân loại và thuật toán cần thiết để tạo điều kiện cho dữ liệu đó mà không cần một số giám sát. Mục tiêu của việc học không giám sát là tái cấu trúc bản ghi đầu vào thành các tính năng mới hoặc một tập hợp các đối tượng có cùng mẫu.
Phân tích cụm được sử dụng để tạo thành các nhóm hoặc cụm của các bản ghi giống nhau tùy thuộc vào các biện pháp khác nhau được thực hiện trên các bản ghi này. Thiết kế quan trọng là xác định các cụm theo những cách có thể hữu ích cho mục tiêu của phân tích. Dữ liệu này đã được sử dụng trong một số lĩnh vực, chẳng hạn như thiên văn học, khảo cổ học, y học, hóa học, giáo dục, tâm lý học, ngôn ngữ học và xã hội học.
Google là một trường hợp phân nhóm cần học tập không giám sát để nhóm các mục tin tức phụ thuộc vào nội dung của chúng. Google có một tập hợp hàng triệu tin bài được viết theo nhiều chủ đề và thuật toán phân nhóm của họ nhất thiết phải nhóm các tin tức này thành một số nhỏ giống nhau hoặc liên kết với nhau bằng cách sử dụng nhiều thuộc tính, bao gồm tần suất từ, độ dài câu, số trang, v.v.
Có nhiều ví dụ khác nhau về Học không giám sát như sau -
Tổ chức các cụm máy tính - Khu vực địa lý của các máy chủ được xác định trên cơ sở phân cụm các yêu cầu web nhận được từ một khu vực cụ thể trên thế giới. Máy chủ cục bộ sẽ chỉ bao gồm dữ liệu được tạo thường xuyên bởi những người ở khu vực đó.
Phân tích mạng xã hội - Phân tích mạng xã hội được tiến hành để tạo ra các cụm bạn bè phụ thuộc vào tần suất kết nối giữa họ. Phân tích như vậy cho thấy các liên kết giữa những người dùng của một số trang web mạng xã hội.
Phân khúc thị trường - Các tổ chức bán hàng có thể phân cụm hoặc nhóm người dùng của họ thành nhiều phân đoạn trên cơ sở các mặt hàng được lập hóa đơn trước của họ. Ví dụ:một siêu thị lớn có thể yêu cầu gửi SMS về các yếu tố tạp hóa cụ thể cho người dùng của họ thay vì gửi SMS đó cho tất cả người dùng của họ.
Nó không chỉ rẻ hơn mà còn cao cấp hơn; Xét cho cùng, nó có thể là một chất kích thích không đáng có đối với những người chỉ mua quần áo từ cửa hàng. Việc kết hợp người dùng thành nhiều phân khúc dựa trên lịch sử mua hàng của họ sẽ giúp cửa hàng tập trung đúng người dùng để tăng doanh số bán hàng và nâng cao lợi nhuận.
Phân tích dữ liệu thiên văn - Các nhà thiên văn cần kính thiên văn cao để nghiên cứu các thiên hà và các ngôi sao. Thiết kế theo ánh sáng hoặc sự kết hợp của các ánh sáng nhận được từ nhiều phần của bầu trời giúp nhận ra nhiều thiên hà, hành tinh và vệ tinh.