Computer >> Máy Tính >  >> Lập trình >> Python

Python - Loại bỏ các giá trị (NaN) bị thiếu trong DataFrame

Để xóa các giá trị bị thiếu, tức là các giá trị NaN, hãy sử dụng dropna () phương pháp. Đầu tiên, hãy để chúng tôi nhập thư viện được yêu cầu -

import pandas as pd

Đọc CSV và tạo DataFrame -

dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv")

Sử dụng dropna () để xóa các giá trị bị thiếu. NaN sẽ được hiển thị cho các giá trị bị thiếu sau khi dropna () được sử dụng -

dataFrame.dropna()

Ví dụ

Sau đây là mã hoàn chỉnh

import pandas as pd

# reading csv file
dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv")
print("DataFrame with some NaN (missing) values...\n",dataFrame)

# count the rows and columns in a DataFrame
print("\nNumber of rows and column in our DataFrame = ",dataFrame.shape)

# drop the missing values
print("\nDataFrame after removing NaN values...\n",dataFrame.dropna())

Đầu ra

Điều này sẽ tạo ra kết quả sau -

DataFrame with some NaN (missing) values...
          Car        Place   UnitsSold
0        Audi    Bangalore        80.0
1     Porsche       Mumbai         NaN
2  RollsRoyce         Pune       100.0
3         BMW        Delhi         NaN
4     Mercedes   Hyderabad        80.0
5  Lamborghini  Chandigarh        80.0
6         Audi      Mumbai         NaN
7     Mercedes        Pune       120.0
8  Lamborghini       Delhi       100.0

Number of rows and colums in our DataFrame = (9, 3)

DataFrame after removing NaN values ...
           Car       Place   UnitsSold
0         Audi   Bangalore        80.0
2   RollsRoyce        Pune       100.0
4     Mercedes   Hyderabad        80.0
5  Lamborghini  Chandigarh        80.0
7     Mercedes        Pune       120.0
8  Lamborghini       Delhi       100.0