Giả sử, bạn có một khung dữ liệu và số cột giá trị bị thiếu tối thiểu là,
DataFrame là:Id Lương Tuổi0 1.0 20000.0 22.01 2.0 NaN 23.02 3.0 50000.0 NaN3 NaN 40000.0 25.04 5.0 80000.0 NaN5 6.0 NaN 25.06 7.0 350000.0 26.07 8.0 55000.0 27.08 9.0 60000.0 NaN9 10.0 70000.0 24.0 Cột giá trị thấp nhất còn thiếu là:IdĐể giải quyết vấn đề này, chúng tôi sẽ làm theo các bước được đưa ra bên dưới -
Giải pháp
-
Xác định khung dữ liệu với ba cột Id, Lương và Tuổi
-
Đặt df.apply () bên trong hàm lambda để kiểm tra tổng các giá trị null từ tất cả các hàng
df =df.apply (lambda x:x.isnull (). sum (), axis =0)
-
Cuối cùng, in giá trị thấp nhất từ df bằng cách sử dụng df.idxmin ()
df.idxmin ()
Ví dụ
Hãy xem đoạn mã dưới đây để hiểu rõ hơn -
nhập gấu trúc dưới dạng pdimport numpy as npdf =pd.DataFrame ({'Id':[1,2,3, np.nan, 5,6,7,8,9,10], 'Salary':[20000 , np.nan, 50000,40000,80000, np.nan, 350000,55000,60000,70000], 'Age':[22,23, np.nan, 25, np.nan, 25,26,27, np .nan, 24]}) print ("DataFrame is:\ n", df) df =df.apply (lambda x:x.isnull (). sum (), axis =0) print ("cột giá trị bị thiếu thấp nhất là :", df.idxmin ())
Đầu ra
DataFrame là:Id Lương Tuổi0 1.0 20000.0 22.01 2.0 NaN 23.02 3.0 50000.0 NaN3 NaN 40000.0 25.04 5.0 80000.0 NaN5 6.0 NaN 25.06 7.0 350000.0 26.07 8.0 55000.0 27.08 9.0 60000.0 NaN9 10.0 70000.0 24.0 Cột giá trị thấp nhất còn thiếu là:Id