Cơ sở dữ liệu không gian lưu một lượng lớn dữ liệu liên quan đến không gian, bao gồm bản đồ, hồ sơ hình ảnh y tế hoặc viễn thám được xử lý trước và dữ liệu thiết kế chip VLSI. Cơ sở dữ liệu không gian có một số tính năng phân biệt chúng với cơ sở dữ liệu quan hệ. Chúng mang thông tin tôpô và / hoặc khoảng cách, thường được tổ chức bởi các cấu trúc lập chỉ mục không gian đa chiều, phức tạp được truy cập bằng các phương pháp truy cập dữ liệu không gian và thường yêu cầu lý luận không gian, tính toán hình học và kỹ thuật biểu diễn tri thức không gian.
Khai thác dữ liệu không gian đề cập đến việc trích xuất kiến thức, mối quan hệ không gian hoặc các mẫu thú vị khác không được lưu trữ rõ ràng trong cơ sở dữ liệu không gian. Việc khai thác như vậy đòi hỏi sự hợp nhất của việc khai thác dữ liệu với các công nghệ cơ sở dữ liệu không gian. Nó có thể được sử dụng để học các bản ghi không gian, khám phá các mối quan hệ và mối quan hệ không gian giữa các bản ghi không gian và không gian, xây dựng cơ sở tri thức không gian, tổ chức lại cơ sở dữ liệu không gian và tối ưu hóa các truy vấn không gian.
Nó dự kiến sẽ có các ứng dụng rộng rãi trong các hệ thống dữ liệu địa lý, tiếp thị, viễn thám, khám phá cơ sở dữ liệu hình ảnh, hình ảnh y tế, điều hướng, điều khiển giao thông, nghiên cứu môi trường và nhiều lĩnh vực khác sử dụng dữ liệu không gian.
Thách thức chính đối với khai thác dữ liệu không gian là việc khám phá các kỹ thuật khai thác dữ liệu không gian hiệu quả vì lượng lớn dữ liệu không gian và độ khó của các kiểu dữ liệu không gian và phương pháp truy cập không gian. Phân tích dữ liệu không gian thống kê là một cách tiếp cận phổ biến để phân tích dữ liệu không gian và khám phá thông tin địa lý.
Thuật ngữ thống kê địa lý thường được liên kết với không gian địa lý liên tục, trong khi thuật ngữ thống kê không gian thường gắn với không gian rời rạc. Trong mô hình thống kê quản lý các bản ghi phi không gian, người ta thường xem xét sự phụ thuộc thống kê giữa các vùng dữ liệu khác nhau.
Không có sự tách biệt như vậy giữa các bản ghi được phân phối theo không gian bởi vì trên thực tế, các đối tượng không gian có liên quan với nhau, hay chính xác hơn là cùng vị trí trong không gian, nghĩa là hai đối tượng càng được đặt gần nhau, thì khả năng chúng gửi các thuộc tính giống nhau. Ví dụ, tài nguyên thiên nhiên, khí hậu, nhiệt độ và tình hình kinh tế có thể giống nhau ở các vùng có vị trí địa lý gần nhau.
Tính chất phụ thuộc lẫn nhau chặt chẽ trong không gian lân cận dẫn đến khái niệm tự tương quan không gian. Dựa trên quan điểm này, các phương pháp mô hình thống kê không gian đã được phát triển thành công. Khai thác dữ liệu không gian sẽ tạo ra các phương pháp phân tích thống kê không gian và mở rộng chúng cho một lượng lớn dữ liệu không gian, chú trọng hơn đến tính hiệu quả, khả năng mở rộng, hợp tác với cơ sở dữ liệu và hệ thống kho dữ liệu, tăng cường tương tác với người dùng và khám phá các loại kiến thức mới.