Để đếm số khác biệt, hãy sử dụng nunique trong Pandas. Chúng tôi sẽ nhóm theo một cột và tìm mặt trời cũng bằng cách sử dụng Numpy sum ().
Đầu tiên, hãy nhập các thư viện được yêu cầu -
nhập gấu trúc dưới dạng pdimport numpy dưới dạng np
Tạo một DataFrame có 3 cột. Các cột có giá trị trùng lặp -
dataFrame =pd.DataFrame ({"Xe":['BMW', 'Audi', 'BMW', 'Lexus', 'Lexus'], "Place":['Delhi', 'Bangalore', ' Delhi ',' Chandigarh ',' Chandigarh '], "Đơn vị":[100, 150, 50, 110, 90]})
Đếm khác biệt trong tổng hợp tập hợp () với nunique. Tính tổng để đếm, chúng tôi đang sử dụng numpy sum () -
dataFrame =dataFrame.groupby ("Xe hơi"). agg ({"Đơn vị":np.sum, "Địa điểm":pd.Series.nunique})
Ví dụ
Sau đây là mã -
nhập gấu trúc dưới dạng pdimport numpy as npdataFrame =pd.DataFrame ({"Xe":['BMW', 'Audi', 'BMW', 'Lexus', 'Lexus'], "Place":['Delhi' , 'Bangalore', 'Delhi', 'Chandigarh', 'Chandigarh'], "Units":[100, 150, 50, 110, 90]}) print "DataFrame ... \ n", dataFrame # count phân biệt trong tổng hợp với nuniquedataFrame =dataFrame.groupby ("Xe"). agg ({"Đơn vị":np.sum, "Địa điểm":pd.Series.nunique}) print "\ nUpdated DataFrame ... \ n", dataFrameĐầu ra
Điều này sẽ tạo ra kết quả sau -
DataFrame ... Car Place Unit 0 BMW Delhi 1001 Audi Bangalore 1502 BMW Delhi 503 Lexus Chandigarh 1104 Lexus Chandigarh 90Up cập nhật Dữ liệu ...