Để thêm một cột chứa xếp hạng của mỗi hàng trong khung dữ liệu được cung cấp sẽ giúp chúng tôi sắp xếp khung dữ liệu và xác định thứ hạng của một phần tử cụ thể, chẳng hạn như -
Khung dữ liệu của chúng tôi
Tên Thời gian chơi (tính theo giờ) | Tỷ lệ | |||
---|---|---|---|---|
0 | Call Of Duty | 45 | Tốt hơn Trung bình | |
1 | Tổng quá liều | 46 | Tốt | |
2 | GTA3 | 52 | Tốt nhất | |
3 | Bully | 22 | Trung bình |
Đầu ra
Tên Thời gian chơi (tính theo giờ) | Xếp hạng tỷ lệ | |||
---|---|---|---|---|
0 | Call Of Duty | 45 | Tốt hơn Trung bình | 3.0 |
1 | Tổng quá liều | 46 | Tốt | 2.0 |
2 | GTA3 | 52 | Tốt nhất | 1.0 |
3 | Bully | 22 | Trung bình | 4.0 |
Bây giờ, như bạn có thể thấy trong ví dụ trên, thứ hạng của chúng tôi là các số nguyên nhưng có một số thập phân bên cạnh, điều đó có nghĩa là chúng tôi cũng có thể có xếp hạng theo số thực và điều đó xảy ra khi nhiều hơn và một phần tử có cùng thứ hạng trong khung dữ liệu hơn là trong những trường hợp như vậy xếp hạng của chúng tôi được phân chia giữa các yếu tố. Do đó, chúng có một số thực là thứ hạng của chúng.
Bây giờ chúng ta làm cách nào để gán thứ hạng cho khung dữ liệu của mình
Để chỉ định thứ hạng cho các phần tử của khung dữ liệu, chúng tôi sử dụng một hàm tích hợp sẵn của thư viện gấu trúc là .rank () hàm số. Chúng tôi chuyển các tiêu chí dựa trên tiêu chí mà chúng tôi đang xếp hạng các phần tử cho nó và hàm này trả về một cột mới trong mỗi hàng nơi xếp hạng được lưu trữ.
Ví dụ
Mã để sử dụng hàm .rank () là
import pandas as pd games = {'Name' : ['Call Of Duty', 'Total Overdose', 'GTA 3', 'Bully'], 'Play Time(in hours)' : ['45', '46', '52', '22'], 'Rate' : ['Better than Average', 'Good', 'Best', 'Average']} df = pd.DataFrame(games) df['ranking'] = df['Play Time(in hours)'].rank(ascending = 0) print(df)# Hello World program in Python print ("Hello World!");
Đầu ra
Name Play Time(in hours) Rate ranking 0 Call Of Duty 45 Better than Average 3.0 1 TotalOverdose 46 Good 2.0 2 GTA 3 52 Best 1.0 3 Bully 22 Average 4.0
Giải thích về Quy tắc trên
Trong mã này, chúng tôi chỉ đơn giản là sử dụng chức năng tích hợp sẵn của thư viện gấu trúc để xếp hạng từng phần tử có trong khung dữ liệu nhất định. Chúng tôi có thể sử dụng các tiêu chí tốt nhất để xếp hạng các phần tử với cột ‘Thời gian chơi (tính theo giờ).’
Bây giờ, chúng tôi thêm một cột có tên là 'xếp hạng' trong khung dữ liệu và sử dụng .rank () của chúng tôi chức năng trong đó và chuyển tên cột mà chúng ta cần để xếp hạng các phần tử của mình (trong trường hợp này là cột Thời gian chơi (tính theo giờ)) ngay bây giờ khi cột mới của chúng ta được tạo, chúng ta in khung dữ liệu của mình.
Kết luận
Trong hướng dẫn này, chúng tôi xếp hạng các hàng trong khung dữ liệu của chúng tôi và sau đó in dữ liệu của chúng tôi bằng cách sử dụng thư viện gấu trúc và các hàm tích hợp của nó. Xếp hạng các hàng trong khung dữ liệu gấu trúc là một quá trình dễ dàng, nhưng bạn cần thực hiện theo đúng phương pháp trên.