Computer >> Máy Tính >  >> Lập trình >> Python

Python - Định hình lại dữ liệu trong Pandas DataFrame

Chúng tôi có thể dễ dàng định hình lại dữ liệu bằng cách phân loại một cột cụ thể. Ở đây, chúng tôi sẽ phân loại cột "Kết quả", tức là các giá trị Đạt và Không đạt ở dạng số.

Nhập thư viện bắt buộc -

import pandas as pd

Tạo DataFrame có 2 cột -

dataFrame = pd.DataFrame(
   {
      "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']

   }
)

Định hình lại dữ liệu bằng cách sử dụng hàm map () và chỉ cần đặt ‘Đạt’ thành 1 và ‘Không đạt’ thành 0 -

dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })

Ví dụ

Sau đây là mã -

import pandas as pd

# Create DataFrame
dataFrame = pd.DataFrame(
   {
      "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']
   }
)

print"DataFrame ...\n",dataFrame

# reshaping into numbers
dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })

print"\nReshaped DataFrame ...\n",dataFrame

Đầu ra

Điều này sẽ tạo ra kết quả sau

DataFrame ...
   Result   Student
0    Pass      Jack
1    Fail     Robin
2    Fail       Ted
3    Pass  Scarlett
4    Pass       Kat

Reshaped DataFrame ...
   Result   Student
0       1      Jack
1       0     Robin
2       0       Ted
3       1  Scarlett
4       1       Kat