Có nhiều tính năng khác nhau của khai thác dữ liệu như sau -
Loại dữ liệu - Hầu hết các hệ thống khai thác dữ liệu có thể truy cập được trong ngành xử lý dữ liệu được định dạng, dựa trên bản ghi, dữ liệu quan hệ với các thuộc tính thống kê, phân loại và biểu tượng. Dữ liệu có thể ở dạng văn bản ASCII, dữ liệu cơ sở dữ liệu quan hệ hoặc dữ liệu kho dữ liệu. Điều cần thiết là phải kiểm tra (các) định dạng chính xác mà mỗi hệ thống mà nó đang xử lý có thể xử lý.
Một số loại dữ liệu hoặc ứng dụng có thể yêu cầu các thuật toán chuyên biệt để tìm kiếm vật liệu và do đó, các yêu cầu của chúng không thể được quản lý bởi các hệ thống khai thác dữ liệu chung, có sẵn. Thay vào đó, các hệ thống khai thác dữ liệu chuyên biệt có thể được sử dụng, khai thác báo cáo văn bản, dữ liệu không gian địa lý, dữ liệu đa phương tiện, dữ liệu luồng, dữ liệu chuỗi thời gian, dữ liệu sinh học hoặc dữ liệu web hoặc dành riêng cho các ứng dụng cụ thể (bao gồm tài chính, ngành bán lẻ hoặc viễn thông).
Sự cố hệ thống - Một hệ thống khai thác dữ liệu nhất định chỉ có thể chạy trên một hoặc một số khung điều hành. Các hệ điều hành nổi tiếng lưu trữ phần mềm khai thác dữ liệu là UNIX / Linux và Microsoft Windows. Ngoài ra còn có các hệ thống khai thác dữ liệu chạy trên Macintosh, OS / 2, v.v. Dữ liệu định hướng thị trường lớn
Các hệ thống khai thác dữ liệu định hướng thị trường lớn thường áp dụng kiến trúc máy khách / máy chủ, trong đó máy khách có thể là một máy tính cá nhân và máy chủ có thể là một tập hợp các máy tính song song mạnh mẽ. Xu hướng hiện tại có các hệ thống khai thác dữ liệu hỗ trợ giao diện dựa trên Web và cho phép dữ liệu XML làm đầu vào và / hoặc đầu ra.
Nguồn dữ liệu - Điều này xác định các định dạng dữ liệu cụ thể mà hệ thống khai thác dữ liệu sẽ hoạt động. Một số hệ thống chỉ chạy trên tệp văn bản ASCII, trong khi một số hệ thống hoạt động trên dữ liệu quan hệ hoặc dữ liệu kho dữ liệu, truy cập một số nguồn dữ liệu quan hệ.
Hệ thống khai thác dữ liệu phải cung cấp kết nối ODBC hoặc OLE DB cho kết nối ODBC. Các kết nối này cung cấp các kết nối cơ sở dữ liệu mở, đặc biệt, khả năng truy cập vào bất kỳ dữ liệu quan hệ nào (liên quan đến những dữ liệu trong IBM / DB2, Microsoft SQL Server, Microsoft Access, Oracle, Sybase, v.v.) và dữ liệu văn bản ASCII được định dạng.
Các chức năng và phương pháp khai thác dữ liệu - Các chức năng khai thác dữ liệu tạo thành trái tim của một hệ thống khai thác dữ liệu. Một số hệ thống khai thác dữ liệu chỉ hỗ trợ một chức năng khai thác dữ liệu, chẳng hạn như phân loại. Những người khác có thể trợ giúp nhiều chức năng khai thác dữ liệu, bao gồm mô tả khái niệm, phân tích OLAP theo hướng khám phá, khai thác liên kết, phân tích liên kết, phân tích thống kê, phân loại, dự đoán, phân cụm, phân tích ngoại lệ, tìm kiếm sự tương tự, phân tích mẫu tuần tự và khai thác dữ liệu trực quan.
Đối với một chức năng khai thác dữ liệu nhất định (bao gồm cả phân loại), một số hệ thống chỉ có thể cung cấp một phương pháp, trong khi những hệ thống khác có thể cung cấp nhiều phương pháp (bao gồm phân tích cây phân tích, mạng Bayes, mạng nơ-ron, máy vectơ hỗ trợ, phân loại dựa trên quy tắc, phương pháp k-láng giềng gần nhất, thuật toán di truyền và suy luận dựa trên trường hợp).
Hệ thống khai thác dữ liệu cung cấp nhiều chức năng khai thác dữ liệu và nhiều phương pháp cho mỗi chức năng hỗ trợ người dùng có tính linh hoạt và sức mạnh phân tích cao hơn. Một số vấn đề có thể yêu cầu người dùng thử một vài chức năng khai thác khác nhau hoặc kết hợp nhiều chức năng với nhau và các phương pháp khác nhau có thể hiệu quả hơn các phương pháp khác đối với các loại dữ liệu khác nhau.