Computer >> Máy Tính >  >> Lập trình >> Python

Tần số tuyệt đối và tương đối ở gấu trúc

Trong thống kê, thuật ngữ "tần suất" cho biết số lần xuất hiện của một giá trị trong một mẫu dữ liệu nhất định. Là một phần mềm dùng để phân tích toán học và khoa học, Pandas có nhiều phương pháp tích hợp để tính toán tần suất từ ​​một mẫu nhất định.

Tần suất tuyệt đối Nó cũng giống như tần suất mà số lần xuất hiện của một phần tử dữ liệu được tính toán. Trong ví dụ dưới đây, chúng tôi chỉ cần đếm số lần tên của một thành phố xuất hiện trong một DataFrame nhất định và báo cáo nó dưới dạng tần suất.

Cách tiếp cận 1 - Chúng tôi sử dụng phương thức pandas có tên .value_counts.

Ví dụ

import pandas as pd
# Create Data Frame
data = ["Chandigarh","Hyderabad","Pune","Pune","Chandigarh","Pune"]
# use the method .value_counts()
df = pd.Series(data).value_counts()
print(df)

Đầu ra

Chạy đoạn mã trên cho chúng ta kết quả sau -

Pune          3
Chandigarh    2
Hyderabad     1
dtype: int64

Cách tiếp cận 2 - Chúng tôi sử dụng phương thức gấu trúc có tên .crosstab

Ví dụ

import pandas as pd
data = ["Chandigarh","Hyderabad","Pune","Pune","Chandigarh","Pune"]
df = pd.DataFrame(data,columns=["City"])
tab_result = pd.crosstab(index=df["City"],columns=["count"])
print(tab_result)

Đầu ra

Chạy đoạn mã trên cho chúng ta kết quả sau -

col_0        count
City
Chandigarh   2
Hyderabad    1
Pune         3

Tần suất tương đối - Đây là một phân số giữa một tần số nhất định và tổng số quan sát trong một mẫu dữ liệu. Vì vậy, giá trị có thể là một giá trị dấu phẩy động cũng có thể được biểu thị dưới dạng phần trăm. Để tìm ra nó, trước tiên, chúng tôi tính toán tần suất như được hiển thị trong cách tiếp cận đầu tiên và sau đó chia nó với tổng số quan sát được tìm thấy bằng cách sử dụng hàm len ().

Ví dụ

import pandas as pd
# Create Data Frame
data = ["Chandigarh","Hyderabad","Pune","Pune","Chandigarh","Pune"]
# use the method .value_counts()
df = pd.Series(data).value_counts()
print(df/len(data))

Đầu ra

Chạy đoạn mã trên cho chúng ta kết quả sau -

Pune 0.500000
Chandigarh 0.333333
Hyderabad 0.166667
dtype: float64