Computer >> Máy Tính >  >> Lập trình >> Python

Làm thế nào để tìm tóm tắt thống kê của một khung dữ liệu R với tất cả các thống kê mô tả?

Khi chúng tôi tìm tóm tắt thống kê của khung dữ liệu R, chúng tôi chỉ nhận được giá trị nhỏ nhất, phần tư thứ nhất, giá trị trung bình, giá trị trung bình, phần tư thứ ba và giá trị tối đa nhưng trong mô tả có nhiều thước đo hữu ích khác như phương sai, độ lệch chuẩn, độ lệch, kurtosis , v.v. Do đó, chúng ta có thể sử dụng hàm basicStats của gói fBasics cho mục đích này.

Đang tải gói fBasics -

 thư viện (fBasics) 

Xem xét dữ liệu mtcars trong cơ sở R -

Ví dụ

 data (mtcars) head (mtcars, 20) 

Đầu ra

 mpg cyl disp hp drat wt qsec vs am gear carbMazda RX4 21,0 6 160,0 110 3,90 2,620 16,46 0 1 4 4Mazda RX4 Wag 21,0 6 160,0 110 3,90 2,875 17,02 0 1 4 4Datsun 710 22,8 4 108,0 93 3,85 2.320 18,61 1 1 4 1Hornet 4 Drive 21.4 6 258.0 110 3.08 3.215 19.44 1 0 3 1Hornet Sportabout 18.7 8 360.0 175 3.15 3.440 17.02 0 0 3 2Valiant 18.1 6 225.0 105 2.76 3.460 20.22 1 0 3 1Duster 360 14.3 8 360.0 245 3,21 3.570 15.84 0 0 3 4Merc 240D 24,4 4 146,7 62 3,69 3,190 20,00 1 0 4 2 Phần 230 22,8 4 140,8 95 3,92 3,150 22,90 1 0 4 2 Phần trăm 280 19,2 6 167,6 123 3,92 3,440 18,30 1 0 4 4 Phần 280C 17,8 6 167,6 123 3,92 3,440 18,90 1 0 4 4 Phần trăm 450SE 16,4 8 275,8 180 3,07 4,070 17,40 0 0 3 3Merc 450SL 17,3 8 275,8 180 3,07 3,730 17,60 0 0 3 3Merc 450SLC 15,2 8 275,8 180 3,07 3,780 18,00 0 0 3 3 Cadillac Fleetwood 10,4 8 472,0 205 2,93 5.250 17,98 0 0 3 4Lincoln Continental 10,4 8 460,0 215 3,00 5,424 17,82 0 0 3 4Chrysler Imperial 14,7 8 440,0 230 3,23 5,345 17,42 0 0 3 4Fiat 128 32,4 4 78,7 66 4,08 2,200 19,47 1 1 4 1Honda Civic 30,4 4 75,7 52 4,93 1,615 18,52 1 1 4 2 Toyota Corolla 33,9 4 71,1 65 4,22 1,835 19,90 1 1 4 1 

Tìm bản tóm tắt thống kê của tập dữ liệu mtcars -

> basicStats (mtcars) 
 mpg cyl disp hp dratnobs 32.000000 32.000000 32.000000 32.000000 32.000000NAs 0,000000 0,000000 0,000000 0,000000 0.000000Minimum 10,400000 4,000000 71,100000 52,000000 2.760000Maximum 33,900000 8,000000 472,000000 335,000000 4,930000 1.Quartile 15,425000 4,000000 120,825000 96,500000 3,080000 3.Quartile 22,800000 8,000000 326,000000 180,000000 3.920000Mean 20,090625 6,187500 230.721875 146.687500 3.596563Median 19,200000 6,000000 196,300000 123,000000 3.695000Sum 642,900000 198,000000 7383,100000 4694,000000 115.090000SE Mean 1,065424 0,315709 21,909473 12,120317 0,094519 LCLMean 17,917679 5,543607 186,037211 121,967950 3,403790 UCLMean 22,263571 6,831393 275,406539 171,407050 3.789335Variance 36,324103 3,189516 15360,799829 4700,866935 0.285881Stdev 6,026948 1,785922 123,938694 68,562868 0,610655 -0,174612 0.534679Skewness 0,381657 0,726024 0,265904 Bệnh tật -0,372766 -1,762120 -1,207212 -0,135551 -0,714701 


 wt qsec so với am gea r carbnobs 32.000000 32.000000 32.000000 32.000000 32.000000 32.000000NAs 0,000000 0,0000000000000000000000000000000000000000000000 18.900000 1.000000 1.000000 4.000000 4.000000Mean 3,217250 17,848750 0,437500 0,406250 3,687500 2.812500Median 3,325000 17,710000 0,000000 0,000000 4,000000 2.000000Sum 102,952000 571,160000 14,000000 13,000000 118,000000 90.000000SE Mean 0,172968 0,315890 0,089098 0,088210 0,130427 0.285530LCL Mean 2,864478 17,204488 0,255783 0,226345 3,421493 2.230158UCL Mean 3,570022 18,493012 0,619217 0,586155 3,953507 3,394842 Phương sai 0,957379 3,193166 0,254032 0,248992 0,544355 2,608871Stdev 0,978457 1,786943 0,504016 0,498991 0,737804 1,615200 Độ bền 0,423146 0,369045 0,240258 0,364016 0,528854 1,050874 Bệnh tật -0,022711 0,335114 -2,001938 -1,924741 -1,069751 1,257043 

Hãy xem thêm hai ví dụ sử dụng dữ liệu cây và dữ liệu áp suất trong cơ sở R.

Ví dụ về dữ liệu cây -

Ví dụ

 data (cây) head (cây, 20) 

Đầu ra

Khối lượng chiều cao dầm1 8,3 70 10,32 8,6 65 10,33 8,8 63 10,24 10,5 72 16,45 10,7 81 18,86 10,8 83 19,77 11,0 66 15,68 11,0 75 18,29 11,1 80 22,610 11,2 75 19,911 11,3 79 24,212 11,4 76 21,013 11,4 76 21,414 11,7 69 21,315 12,0 75 19.116 12.9 74 22.217 12.9 85 33.818 13.3 86 27.419 13.7 71 25.720 13.8 64 24.9


> basicStats (cây) Chiều cao bản lề 31.000000 31.000000 31.000000 NA 0,000000 0,000000 0,000000 Tối thiểu 8.300000 63.000000 10.200000 Tối đa 20.600000 87.000000 77.000000 1. Phần tư 11.050000 72.000000 19.40000 3.Quảng cáo 15.250000387.70000000 2400000000 Trung bình 12.900000000 370000 370000 370000000 SE Trung bình 0,563626 1,144411 2,952324LCL Trung bình 12,097309 73,662800 24,141517 UCL Trung bình 14,399466 78,337200 36,200418 Phương sai 9,847914 40,600000 270.202796 Stdev 3,138139 6,371813 16,437846 UCL Trung bình 14,399466 78.337200 36.200418 Phương sai 9,847914 40,600000 270.202796 Stdev 3,138139 6,371813 16,437846 

Ví dụ về dữ liệu áp suất -

Ví dụ

 dữ liệu (áp suất) đầu (áp suất, 20) 

Đầu ra

 áp suất nhiệt độ1 0 0,00022 20 0,00123 40 0,00604 60 0,03005 80 0,09006 100 0,27007 120 0,75008 140 1.85009 160 4.200010 180 8.800011 200 17.300012 220 32.100013 240 57.000014 260 96.000015 280 157.000016 300 247.000017 320 376.000018 340 558.000019 360 806.000018 340 


 basicStats (áp suất) áp suất nhiệt độ 19.000000 19.000000NAs 0,000000 0,000000 Tối thiểu 0,000000 0,000200 Tối đa 360.000000 806.0000001. Phần tư 90.000000 0.1800003. Phần tư 270.000000 126.500000 Nam 180.000000 124.336705 Ý 180.000000 8.800000Sum 3420.000000 2362.397400SE Trung bình 25.819889 51.531945LCL Nghĩa là 125.754426 16.072107UCL Nghĩa là 234.245574 232.601304 Phương sai 12666.690.347004428 224