Thuộc tính là một trường dữ liệu, xác định một đặc tính của một đối tượng dữ liệu. Thuộc tính danh từ, thứ nguyên, đặc điểm và biến được sử dụng tương ứng trong tài liệu. Thứ nguyên thường được sử dụng trong kho dữ liệu. Tài liệu học máy ảnh hưởng đến việc sử dụng tính năng thuật ngữ, trong khi các nhà thống kê thích phương pháp thay đổi.
Các chuyên gia khai thác dữ liệu và cơ sở dữ liệu thường sử dụng thuộc tính thuật ngữ. Các thuộc tính xác định đối tượng người dùng có thể bao gồm, ví dụ:ID khách hàng, tên và địa chỉ. Các giá trị quan sát được cho một thuộc tính nhất định được gọi là quan sát.
Một tập hợp các thuộc tính có thể xác định một đối tượng nhất định được gọi là vectơ thuộc tính (hoặc vectơ đặc trưng). Phân phối dữ liệu có chứa một thuộc tính (hoặc biến) được gọi là đơn biến. Phân phối hai biến chứa hai thuộc tính, v.v.
Loại thuộc tính được quyết định bởi tập hợp các giá trị có thể có bao gồm thuộc tính danh nghĩa, nhị phân, thứ tự hoặc thống kê có thể có.
Thuộc tính danh nghĩa - Nominal xác định liên kết với tên. Các giá trị của thuộc tính danh nghĩa là ký hiệu hoặc tên của sự vật. Mỗi giá trị xác định một số loại danh mục, mã hoặc trạng thái, v.v. Các thuộc tính danh nghĩa được định nghĩa là phân loại. Các giá trị không có bất kỳ thứ tự quan trọng nào. Trong khoa học máy tính, các giá trị còn được gọi là một kiểu liệt kê.
Thuộc tính nhị phân - Thuộc tính nhị phân là thuộc tính danh nghĩa chỉ có hai phần tử hoặc trạng thái như 0 hoặc 1, trong đó 0 thường xác định rằng thuộc tính không có và 1 xác định rằng nó có mặt. Thuộc tính nhị phân được định nghĩa là Boolean nếu hai trạng thái tương đương với true và false.
Thuộc tính nhị phân là đối xứng nếu cả hai trạng thái của nó đều có giá trị như nhau và tạo ra cùng trọng lượng. Không có tùy chọn nào về việc kết quả phải được mã hóa là 0 hoặc 1. Một ví dụ có thể là thuộc tính giới tính có trạng thái nam và nữ.
Thuộc tính nhị phân là không đối xứng nếu kết quả của các trạng thái không quan trọng như nhau, bao gồm cả kết quả dương tính và âm tính của xét nghiệm y tế đối với HIV. Theo quy ước, nó có thể mã hóa kết quả quan trọng nhất, thường là kết quả gần nhất, bằng 1 (ví dụ:HIV dương tính) và khác nhau bằng 0 (ví dụ:HIV âm tính).
Thuộc tính thông thường - Thuộc tính thứ tự là thuộc tính có các giá trị có thể có thứ tự hoặc thứ hạng quan trọng giữa chúng, nhưng độ lớn giữa các giá trị liên tiếp không được biết.
Thuộc tính số - Thuộc tính số là định lượng. Nó là một đại lượng có thể đo lường được, được xác định bằng giá trị số nguyên hoặc giá trị thực. Nó có thể được chia tỷ lệ theo khoảng hoặc theo tỷ lệ.