Để xóa số khỏi chuỗi, chúng ta có thể sử dụng phương thức Replace () và chỉ cần thay thế. Trước tiên, hãy để chúng tôi nhập thư viện yêu cầu -
import pandas as pd
Tạo DataFrame với hồ sơ học sinh. Cột Id đang có chuỗi với các số -
dataFrame = pd.DataFrame( { "Id": ['S01','S02','S03','S04','S05','S06','S07'],"Name": ['Jack', 'Robin', 'Ted', 'Robin', 'Scarlett', 'Kat', 'Ted'],"Result": ['Pass', 'Fail', 'Pass', 'Fail', 'Pass', 'Pass', 'Pass'] } )
Xóa số khỏi các chuỗi của một cột cụ thể, tức là “Id” tại đây -
dataFrame['Id'] = dataFrame['Id'].str.replace('\d+', '')
Ví dụ
Sau đây là mã -
import pandas as pd # Create DataFrame with student records dataFrame = pd.DataFrame( { "Id": ['S01','S02','S03','S04','S05','S06','S07'],"Name": ['Jack', 'Robin', 'Ted', 'Robin', 'Scarlett', 'Kat', 'Ted'],"Result": ['Pass', 'Fail', 'Pass', 'Fail', 'Pass', 'Pass', 'Pass'] } ) print"DataFrame ...\n",dataFrame # removing number from strings of a specific column dataFrame['Id'] = dataFrame['Id'].str.replace('\d+', '') print"\nUpdated DataFrame...\n", dataFrame
Đầu ra
Điều này sẽ tạo ra kết quả sau -
DataFrame ... Id Name Result 0 S01 Jack Pass 1 S02 Robin Fail 2 S03 Ted Pass 3 S04 Robin Fail 4 S05 Scarlett Pass 5 S06 Kat Pass 6 S07 Ted Pass Updated DataFrame... Id Name Result 0 S Jack Pass 1 S Robin Fail 2 S Ted Pass 3 S Robin Fail 4 S Scarlett Pass 5 S Kat Pass 6 S Ted Pass