Computer >> Máy Tính >  >> Lập trình >> Python

Viết chương trình bằng Python để tìm cột nào có số lượng giá trị bị thiếu tối thiểu trong khung dữ liệu nhất định

Giả sử, bạn có một khung dữ liệu và số cột giá trị bị thiếu tối thiểu là,

 DataFrame là:Id Lương Tuổi0 1.0 20000.0 22.01 2.0 NaN 23.02 3.0 50000.0 NaN3 NaN 40000.0 25.04 5.0 80000.0 NaN5 6.0 NaN 25.06 7.0 350000.0 26.07 8.0 55000.0 27.08 9.0 60000.0 NaN9 10.0 70000.0 24.0 Cột giá trị thấp nhất còn thiếu là:Id 
 

Để giải quyết vấn đề này, chúng tôi sẽ làm theo các bước được đưa ra bên dưới -

Giải pháp

  • Xác định khung dữ liệu với ba cột Id, Lương và Tuổi

  • Đặt df.apply () bên trong hàm lambda để kiểm tra tổng các giá trị null từ tất cả các hàng

 df =df.apply (lambda x:x.isnull (). sum (), axis =0) 
  • Cuối cùng, in giá trị thấp nhất từ ​​df bằng cách sử dụng df.idxmin ()

 df.idxmin () 

Ví dụ

Hãy xem đoạn mã dưới đây để hiểu rõ hơn -

 nhập gấu trúc dưới dạng pdimport numpy as npdf =pd.DataFrame ({'Id':[1,2,3, np.nan, 5,6,7,8,9,10], 'Salary':[20000 , np.nan, 50000,40000,80000, np.nan, 350000,55000,60000,70000], 'Age':[22,23, np.nan, 25, np.nan, 25,26,27, np .nan, 24]}) print ("DataFrame is:\ n", df) df =df.apply (lambda x:x.isnull (). sum (), axis =0) print ("cột giá trị bị thiếu thấp nhất là :", df.idxmin ()) 

Đầu ra

 DataFrame là:Id Lương Tuổi0 1.0 20000.0 22.01 2.0 NaN 23.02 3.0 50000.0 NaN3 NaN 40000.0 25.04 5.0 80000.0 NaN5 6.0 NaN 25.06 7.0 350000.0 26.07 8.0 55000.0 27.08 9.0 60000.0 NaN9 10.0 70000.0 24.0 Cột giá trị thấp nhất còn thiếu là:Id