Chúng tôi có thể dễ dàng định hình lại dữ liệu bằng cách phân loại một cột cụ thể. Ở đây, chúng tôi sẽ phân loại cột "Kết quả", tức là các giá trị Đạt và Không đạt ở dạng số.
Nhập thư viện bắt buộc -
import pandas as pd
Tạo DataFrame có 2 cột -
dataFrame = pd.DataFrame(
{
"Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']
}
) Định hình lại dữ liệu bằng cách sử dụng hàm map () và chỉ cần đặt ‘Đạt’ thành 1 và ‘Không đạt’ thành 0 -
dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })
Ví dụ
Sau đây là mã -
import pandas as pd
# Create DataFrame
dataFrame = pd.DataFrame(
{
"Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']
}
)
print"DataFrame ...\n",dataFrame
# reshaping into numbers
dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })
print"\nReshaped DataFrame ...\n",dataFrame Đầu ra
Điều này sẽ tạo ra kết quả sau
DataFrame ... Result Student 0 Pass Jack 1 Fail Robin 2 Fail Ted 3 Pass Scarlett 4 Pass Kat Reshaped DataFrame ... Result Student 0 1 Jack 1 0 Robin 2 0 Ted 3 1 Scarlett 4 1 Kat