Computer >> Máy Tính >  >> Lập trình >> Lập trình

Các khía cạnh khác nhau của phương pháp khai thác là gì?

Có nhiều khía cạnh khác nhau của phương pháp khai thác như sau -

Khai thác nhiều loại kiến ​​thức mới và khác nhau - Khai thác dữ liệu bao gồm một loạt các dịch vụ phân tích dữ liệu và khám phá kiến ​​thức, từ đặc điểm và phân biệt dữ liệu đến phân tích mối quan hệ và tương quan, phân loại, hồi quy, phân cụm, phương pháp ngoại lai, phương pháp trình tự cũng như phân tích xu hướng và tính toán.

Các dịch vụ này có thể sử dụng cùng một cơ sở dữ liệu theo nhiều cách và cần sự phát triển của một số kỹ thuật khai thác dữ liệu. Do sự đa dạng của phần mềm, các dịch vụ khai thác mới tiếp tục xuất hiện, phát triển khai thác dữ liệu trở thành một lĩnh vực mạnh mẽ và tăng nhanh.

Ví dụ:để khám phá tri thức hiệu quả trong mạng dữ liệu, phân nhóm và xếp hạng tích hợp có thể dẫn đến việc tìm ra các cụm chất lượng cao và xếp hạng đối tượng trong mạng cao.

Khai thác kiến ​​thức trong không gian đa chiều - Khi khảo sát kiến ​​thức trong tập dữ liệu cao, nó có thể phân tích thông tin trong không gian đa chiều. Nó có thể tìm kiếm các mẫu thú vị giữa các tập hợp kích thước (thuộc tính) ở một số cấp độ trừu tượng. Khai thác như vậy được gọi là khai thác dữ liệu đa chiều (khám phá).

Trong một số trường hợp, dữ liệu có thể được thu thập hoặc được coi như một khối dữ liệu đa chiều. Kiến thức khai thác trong khu vực khối lập phương có thể tăng sức mạnh và khả năng thích ứng của việc khai thác dữ liệu.

Khai thác dữ liệu — một nỗ lực liên ngành - Sức mạnh của khai thác dữ liệu có thể được cải thiện bằng cách tích hợp các kỹ thuật mới từ một số lĩnh vực. Ví dụ:nó có thể khai thác các bản ghi bằng văn bản ngôn ngữ tự nhiên, nó tạo cảm giác kết hợp các phương pháp khai thác dữ liệu với các phương pháp truy xuất dữ liệu và xử lý ngôn ngữ tự nhiên.

Tăng cường sức mạnh khám phá trong môi trường có mạng - Một số đối tượng dữ liệu nằm trong môi trường được kết nối hoặc liên kết với nhau, cho dù đó là Web, liên kết cơ sở dữ liệu, tệp hoặc bản ghi. Kết nối ngữ nghĩa giữa một số đối tượng dữ liệu có thể được sử dụng để mang lại lợi ích trong việc khai thác dữ liệu. Kiến thức được thay đổi trong một nhóm đối tượng có thể được sử dụng để tăng khả năng khám phá kiến ​​thức trong nhóm đối tượng “được liên kết” hoặc kết nối về mặt ngữ nghĩa.

Xử lý sự không chắc chắn, nhiễu hoặc không đầy đủ của dữ liệu - Dữ liệu bao gồm nhiễu, lỗi, ngoại lệ hoặc không rõ ràng hoặc không đầy đủ. Lỗi và nhiễu có thể làm rối loạn giai đoạn khai thác dữ liệu, dẫn đến việc tạo ra các thiết kế sai lầm. Làm sạch dữ liệu, xử lý trước dữ liệu, phát hiện và loại bỏ ngoại lệ cũng như suy luận về sự không rõ ràng là một ví dụ của các phương pháp cần được thống nhất với quy trình khai thác dữ liệu.

Đánh giá mẫu và khai thác có hướng dẫn theo mẫu hoặc hạn chế - Nó không phải là một số mẫu được tạo ra bởi các quá trình khai thác dữ liệu là thú vị. Nó có thể tạo ra một mẫu thú vị có thể khác nhau tùy theo từng người dùng. Do đó, các kỹ thuật được yêu cầu để đánh giá mức độ thú vị của các mẫu được khám phá phụ thuộc vào các biện pháp chủ quan.

Chúng tính toán giá trị của các mẫu liên quan đến một lớp người dùng nhất định, phụ thuộc vào niềm tin hoặc kỳ vọng của người dùng. Hơn nữa, bằng cách sử dụng các thước đo mức độ thú vị hoặc các ràng buộc do người dùng xác định để hiểu quá trình khám phá, nó có thể tạo ra các mẫu thú vị hơn và giảm không gian tìm kiếm.