Trung bình, Trung vị và Chế độ là các chức năng thống kê được sử dụng rất thường xuyên trong phân tích dữ liệu. Mặc dù có một số thư viện python.
Tìm ý nghĩa
Giá trị trung bình của một danh sách các số còn được gọi là giá trị trung bình của các số. Nó được tìm thấy bằng cách lấy tổng của tất cả các số và chia nó với số đếm. Trong ví dụ dưới đây, chúng tôi áp dụng hàm sum () để tính tổng các số và hàm elen () thứ để tính số lượng.
Ví dụ
num_list = [21, 11, 19, 3,11,5] # FInd sum of the numbers num_sum = sum(num_list) #divide the sum with length of the list mean = num_sum / len(num_list) print(num_list) print("Mean of the above list of numbers is: " + str(round(mean,2)))
Đầu ra
Chạy đoạn mã trên cho chúng ta kết quả sau -
[21, 11, 19, 3, 11, 5] Mean of the above list of numbers is: 11.67
Tìm giá trị trung bình
Trung vị là giá trị lớn nhất ở giữa trong danh sách các số. Trong trường hợp có số lẻ trong danh sách thì chúng ta sắp xếp được mất và chọn giá trị lớn nhất ở giữa. Nếu số đếm là số chẵn thì chúng tôi chọn hai giá trị lớn nhất ở giữa và lấy giá trị trung bình của chúng làm giá trị trung bình.
Ví dụ
num_list = [21, 13, 19, 3,11,5] # Sort the list num_list.sort() # Finding the position of the median if len(num_list) % 2 == 0: first_median = num_list[len(num_list) // 2] second_median = num_list[len(num_list) // 2 - 1] median = (first_median + second_median) / 2 else: median = num_list[len(num_list) // 2] print(num_list) print("Median of above list is: " + str(median))
Đầu ra
Chạy đoạn mã trên cho chúng ta kết quả sau -
[3, 5, 11, 13, 19, 21] Median of above list is: 12.0
Chế độ tìm kiếm
Chế độ là số trong danh sách xảy ra thường xuyên nhất. Chúng tôi tính toán nó bằng cách tìm tần suất của mỗi số có trong danh sách và sau đó chọn một số có tần suất cao nhất.
Ví dụ
import collections # list of elements to calculate mode num_list = [21, 13, 19, 13,19,13] # Print the list print(num_list) # calculate the frequency of each item data = collections.Counter(num_list) data_list = dict(data) # Print the items with frequency print(data_list) # Find the highest frequency max_value = max(list(data.values())) mode_val = [num for num, freq in data_list.items() if freq == max_value] if len(mode_val) == len(num_list): print("No mode in the list") else: print("The Mode of the list is : " + ', '.join(map(str, mode_val)))
Đầu ra
Chạy đoạn mã trên cho chúng ta kết quả sau -
[21, 13, 19, 13, 19, 13] {21: 1, 13: 3, 19: 2} The Mode of the list is : 13