Để xóa số khỏi chuỗi, chúng ta có thể sử dụng phương thức Replace () và chỉ cần thay thế. Trước tiên, hãy để chúng tôi nhập thư viện yêu cầu -
import pandas as pd
Tạo DataFrame với hồ sơ học sinh. Cột Id đang có chuỗi với các số -
dataFrame = pd.DataFrame(
{
"Id": ['S01','S02','S03','S04','S05','S06','S07'],"Name": ['Jack', 'Robin', 'Ted', 'Robin', 'Scarlett', 'Kat', 'Ted'],"Result": ['Pass', 'Fail', 'Pass', 'Fail', 'Pass', 'Pass', 'Pass']
}
) Xóa số khỏi các chuỗi của một cột cụ thể, tức là “Id” tại đây -
dataFrame['Id'] = dataFrame['Id'].str.replace('\d+', '')
Ví dụ
Sau đây là mã -
import pandas as pd
# Create DataFrame with student records
dataFrame = pd.DataFrame(
{
"Id": ['S01','S02','S03','S04','S05','S06','S07'],"Name": ['Jack', 'Robin', 'Ted', 'Robin', 'Scarlett', 'Kat', 'Ted'],"Result": ['Pass', 'Fail', 'Pass', 'Fail', 'Pass', 'Pass', 'Pass']
}
)
print"DataFrame ...\n",dataFrame
# removing number from strings of a specific column
dataFrame['Id'] = dataFrame['Id'].str.replace('\d+', '')
print"\nUpdated DataFrame...\n", dataFrame Đầu ra
Điều này sẽ tạo ra kết quả sau -
DataFrame ... Id Name Result 0 S01 Jack Pass 1 S02 Robin Fail 2 S03 Ted Pass 3 S04 Robin Fail 4 S05 Scarlett Pass 5 S06 Kat Pass 6 S07 Ted Pass Updated DataFrame... Id Name Result 0 S Jack Pass 1 S Robin Fail 2 S Ted Pass 3 S Robin Fail 4 S Scarlett Pass 5 S Kat Pass 6 S Ted Pass