Computer >> Máy Tính >  >> Lập trình >> Python

Python Pandas - Xóa số khỏi chuỗi trong cột DataFrame

Để xóa số khỏi chuỗi, chúng ta có thể sử dụng phương thức Replace () và chỉ cần thay thế. Trước tiên, hãy để chúng tôi nhập thư viện yêu cầu -

import pandas as pd

Tạo DataFrame với hồ sơ học sinh. Cột Id đang có chuỗi với các số -

dataFrame = pd.DataFrame(
   {
      "Id": ['S01','S02','S03','S04','S05','S06','S07'],"Name": ['Jack', 'Robin', 'Ted', 'Robin', 'Scarlett', 'Kat', 'Ted'],"Result": ['Pass', 'Fail', 'Pass', 'Fail', 'Pass', 'Pass', 'Pass']
   }
)

Xóa số khỏi các chuỗi của một cột cụ thể, tức là “Id” tại đây -

dataFrame['Id'] = dataFrame['Id'].str.replace('\d+', '')

Ví dụ

Sau đây là mã -

import pandas as pd

# Create DataFrame with student records
dataFrame = pd.DataFrame(
   {
      "Id": ['S01','S02','S03','S04','S05','S06','S07'],"Name": ['Jack', 'Robin', 'Ted', 'Robin', 'Scarlett', 'Kat', 'Ted'],"Result": ['Pass', 'Fail', 'Pass', 'Fail', 'Pass', 'Pass', 'Pass']
   }
)

print"DataFrame ...\n",dataFrame

# removing number from strings of a specific column
dataFrame['Id'] = dataFrame['Id'].str.replace('\d+', '')

print"\nUpdated DataFrame...\n", dataFrame

Đầu ra

Điều này sẽ tạo ra kết quả sau -

DataFrame ...
     Id      Name   Result
0   S01      Jack     Pass
1   S02     Robin     Fail
2   S03       Ted     Pass
3   S04     Robin     Fail
4   S05  Scarlett     Pass
5   S06       Kat     Pass
6   S07       Ted     Pass

Updated DataFrame...
   Id      Name   Result
0   S      Jack     Pass
1   S     Robin     Fail
2   S       Ted     Pass
3   S     Robin     Fail
4   S  Scarlett     Pass
5   S       Kat     Pass
6   S       Ted     Pass