Khai phá dữ liệu không gian xác định quá trình tìm kiếm các mẫu và kiến thức từ dữ liệu không gian. Một số trường hợp khai thác dữ liệu công nghệ không gian bao gồm việc tìm kiếm lịch sử phát triển của các thành phố và vùng đất, khám phá các thiết kế thời tiết, dự báo động đất và bão và quyết định xu hướng ấm lên toàn cầu.
Khai thác dữ liệu không gian đã trở nên quan trọng và có ý nghĩa sâu rộng, nhờ sự công nhận của điện thoại di động, thiết bị GPS, dịch vụ bản đồ dựa trên Internet, dịch vụ thời tiết và Trái đất kỹ thuật số, và công nghệ vệ tinh, RFID, cảm biến, không dây và video.
Có một số loại dữ liệu không gian, dữ liệu đối tượng chuyển động là quan trọng. Ví dụ:các nhà khoa học động vật kết nối máy móc đo từ xa trên động vật hoang dã để khám phá hành vi sinh thái, các nhà quản lý di động nhúng GPS vào ô tô để theo dõi và hướng dẫn phương tiện vượt trội, và các nhà khí tượng học cần vệ tinh thời tiết và radar để tìm bão.
Các trường hợp khai thác dữ liệu đối tượng chuyển động, chẳng hạn như khai thác thiết kế chuyển động của nhiều đối tượng chuyển động (tức là, việc tìm kiếm mối quan hệ giữa nhiều đối tượng chuyển động bao gồm cụm chuyển động, người lãnh đạo và người theo dõi, hợp nhất, đoàn xe, bầy đàn và gọng kìm và các kiểu chuyển động tập thể khác nhau ).
Hệ thống vật lý mạng (CPS) thường bao gồm một số lượng lớn các thành phần vật lý và dữ liệu tương tác. Các hệ thống CPS có thể được kết nối với nhau để tạo thành các mạng vật lý mạng không đồng nhất khổng lồ.
Một ví dụ của mạng vật lý mạng chứa hệ thống chăm sóc bệnh nhân kết nối hệ thống theo dõi bệnh nhân với web dữ liệu bệnh nhân và hệ thống quản lý khẩn cấp.
Hệ thống giao thông kết nối web giám sát giao thông, bao gồm nhiều cảm biến và máy quay video, với hệ thống kiểm soát và dữ liệu giao thông; và hệ thống chỉ huy chiến trường kết nối mạng cảm biến với hệ thống phân tích dữ liệu chiến trường.
Dữ liệu được tạo ra trong các hệ thống vật lý mạng rất mạnh mẽ, bùng nổ, ồn ào, không nhất quán và phụ thuộc lẫn nhau, bao gồm cả dữ liệu không gian phong phú và chúng rất cần thiết cho việc ra quyết định theo thời gian thực.
Khai thác dữ liệu đa phương tiện là việc tìm kiếm các thiết kế thú vị từ cơ sở dữ liệu đa phương tiện để lưu và quản lý một tập hợp lớn các đối tượng đa phương tiện, chẳng hạn như dữ liệu hình ảnh, dữ liệu video, dữ liệu âm thanh, dữ liệu chuỗi và dữ liệu siêu văn bản bao gồm văn bản, đánh dấu văn bản và liên kết.
Khai thác dữ liệu đa phương tiện là một lĩnh vực liên ngành kết hợp xử lý hình ảnh và nhận thức, thị giác máy tính, khai thác dữ liệu và nhận dạng mẫu. Có một số vấn đề trong khai thác dữ liệu đa phương tiện liên quan đến việc truy xuất dựa trên nội dung và tìm kiếm độ tương tự, cũng như phân tích tổng quát và đa chiều. Các khối dữ liệu đa phương tiện bao gồm nhiều kích thước và thước đo hơn cho dữ liệu đa phương tiện.
Khai phá văn bản là một ứng dụng liên ngành dựa trên truy xuất dữ liệu, khai thác dữ liệu, học máy, thống kê và ngôn ngữ học tính toán. Một phần lớn dữ liệu được lưu dưới dạng văn bản bao gồm các bài báo, bài báo công nghệ cao, sách, thư viện kỹ thuật số, email, blog và các trang web.