Chúng tôi có thể dễ dàng định hình lại dữ liệu bằng cách phân loại một cột cụ thể. Ở đây, chúng tôi sẽ phân loại cột "Kết quả", tức là các giá trị Đạt và Không đạt ở dạng số.
Nhập thư viện bắt buộc -
import pandas as pd
Tạo DataFrame có 2 cột -
dataFrame = pd.DataFrame( { "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass'] } )
Định hình lại dữ liệu bằng cách sử dụng hàm map () và chỉ cần đặt ‘Đạt’ thành 1 và ‘Không đạt’ thành 0 -
dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })
Ví dụ
Sau đây là mã -
import pandas as pd # Create DataFrame dataFrame = pd.DataFrame( { "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass'] } ) print"DataFrame ...\n",dataFrame # reshaping into numbers dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, }) print"\nReshaped DataFrame ...\n",dataFrame
Đầu ra
Điều này sẽ tạo ra kết quả sau
DataFrame ... Result Student 0 Pass Jack 1 Fail Robin 2 Fail Ted 3 Pass Scarlett 4 Pass Kat Reshaped DataFrame ... Result Student 0 1 Jack 1 0 Robin 2 0 Ted 3 1 Scarlett 4 1 Kat