Oracle® OSWatcher là một tiện ích thu thập dữ liệu từ các lệnh như vmstat
, iostat
, top
, ps
, netstat
, HP-UX® sar
và Linux® meminfo
. OSWatcher lưu trữ các tệp dữ liệu, tự động tìm kiếm sự cố và trợ giúp để xác định nguyên nhân gốc rễ của sự cố, nếu có thể.
Giới thiệu
Hàng giờ, OSWatcher thu thập số liệu thống kê về hệ điều hành (OS) trong nền bằng cách sử dụng các lệnh OS sau:
- CPU
- Bộ nhớ
- I / O đĩa
OSWatcher ghi các tệp vào $ TFA_HOME / repository / suptools / walhall / oswbb / oracle / archive / .
Bởi vì không tồn tại công việc dọn phòng tự động, bạn nên tạo một công việc cron để tự động xóa các tệp cũ hơn một số ngày để dọn dẹp thống kê hệ điều hành. Ví dụ:công việc cron dọn dẹp của bạn có thể chạy lệnh sau để xóa các tệp cũ hơn 10 ngày:
find $TFA_HOME/repository/suptools/walhall/oswbb/oracle/archive -name "*.*" -mtime +10 -exec rm -f {} \;
Đọc đầu ra nhật ký oswiostat
Nếu iostat
được cài đặt và người dùng OSWatcher có đặc quyền chạy tiện ích, nhật ký OSWatcher thu thập và lưu trữ kết quả đầu ra hàng giờ, theo mặc định, từ iostat
lệnh.
iostat
, được sử dụng để giám sát tải thiết bị đầu vào và đầu ra của hệ thống, thu thập thông tin sau:
- Thời gian
- Các đĩa vật lý và tốc độ truyền dữ liệu trung bình của chúng
Ví dụ về đầu ra
oswiostat
tệp nhật ký bao gồm các dữ liệu sau:
-
device
:Tên thiết bị -
r/s
:Số lần đọc mỗi giây -
w/s
:Viết mỗi giây -
rsec/s
:Kilobyte đọc mỗi giây -
wsec/s
:Kilobyte được ghi trên giây -
avgrq-sz
:Số lượng giao dịch trung bình đang chờ dịch vụ -
avgqu-sz
:Số lượng giao dịch trung bình đang được phục vụ -
%util
:Phần trăm thời gian đĩa bận
Sau đây là hai ví dụ về oswiostat
nhật ký, được thực hiện cách nhau bảy giờ:
Vào lúc chậm:
Time: 00:01:09
avg-cpu: %user %nice %system %iowait %steal %idle
5.22 0.01 1.77 0.10 0.00 92.90
Device: rrqm/s wrqm/s r/s w/s rsec/s wsec/s avgrq-sz avgqu-sz await svctm %util
sda 10.24 101.92 10.28 29.60 569.53 1057.09 40.79 0.21 5.30 0.53 2.11
sda1 0.00 0.00 0.00 0.00 0.17 0.00 138.66 0.00 12.37 3.45 0.00
sda2 10.24 101.92 10.28 29.57 569.36 1057.09 40.81 0.21 5.30 0.53 2.11
dm-0 0.00 0.00 1.72 77.98 75.95 623.85 8.78 1.20 14.99 0.08 0.67
dm-1 0.00 0.00 0.46 2.37 3.80 18.94 8.04 0.01 2.71 0.29 0.08
dm-2 0.00 0.00 7.44 50.74 278.30 410.79 11.84 0.72 12.30 0.23 1.33
dm-3 0.00 0.00 0.00 0.00 0.15 0.00 509.61 0.00 46.78 7.53 0.00
dm-4 0.00 0.00 0.49 0.00 117.41 0.02 238.95 0.00 1.94 1.05 0.05
dm-5 0.00 0.00 0.05 0.00 10.84 0.00 230.78 0.00 2.58 1.34 0.01
dm-6 0.00 0.00 0.00 0.00 0.10 0.00 479.96 0.00 54.94 8.70 0.00
Vào thời điểm bận rộn:
Time: 07:32:57
avg-cpu: %user %nice %system %iowait %steal %idle
8.16 0.00 70.29 21.55 0.00 0.00
Device: rrqm/s wrqm/s r/s w/s rsec/s wsec/s avgrq-sz avgqu-sz await svctm %util
sda 163.40 7.73 2074.74 53.95 73642.61 493.47 34.83 107.13 50.07 0.47 100.07
sda1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
sda2 163.40 7.73 2074.74 53.95 73642.61 493.47 34.83 107.13 50.07 0.47 100.07
dm-0 0.00 0.00 201.03 0.86 8412.37 6.87 41.70 58.68 281.80 4.96 100.07
dm-1 0.00 0.00 180.76 26.46 1446.05 211.68 8.00 25.24 119.01 4.83 100.07
dm-2 0.00 0.00 1868.90 34.54 63913.40 276.29 33.72 332.23 172.22 0.53 100.09
dm-3 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
dm-4 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
dm-5 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
dm-6 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
Nguồn hình ảnh :https://www.dbas-oracle.com/2013/05/How-to-Analyze-or-Read-OS-Watcher-Output-in-three-easy-steps-With-Example.html
Ảnh chụp nhanh từ nửa đêm cho thấy hiệu suất tốt và ảnh chụp từ 7:32 sáng hiệu suất trong nhà. Lưu ý các dấu hiệu sau về hiệu suất kém trong ảnh chụp nhanh giây:
- Một số đĩa đang bận 100%, như được thấy trong
%util
cột. -
r/s
cột hiển thị số lần đọc rất cao mỗi giây. -
avg-cpu %idle
thống kê cho thấy hệ thống không hoạt động 0% so với 92% không tải trong ảnh chụp nhanh trước đó.
Đọc đầu ra nhật ký mpstat
Nếu mpstat
được cài đặt và người dùng OSWatcher có đặc quyền chạy tiện ích, nhật ký OSWatcher thu thập và lưu trữ kết quả đầu ra hàng giờ, theo mặc định, từ mpstat
yêu cầu. Quản trị viên cơ sở dữ liệu sử dụng lệnh này để giám sát việc sử dụng đơn vị xử lý trung tâm (CPU).
Ví dụ đầu ra
mpstat
tệp nhật ký bao gồm các dữ liệu sau:
-
CPU
:Những CPU nào.all
bao gồm số liệu thống kê từ tất cả các CPU có sẵn trong hệ thống. -
%user
:Phần trăm CPU được sử dụng bởi các chương trình của USER -
%sys
:Phần trăm CPU được sử dụng bởi các chương trình hệ thống -
%iowait
:Phần trăm CPU được sử dụng bởi IO đang đợi -
%idle
:Phần trăm tài nguyên hệ thống nhàn rỗi
Sau đây là hai ví dụ về mpstat
các bản ghi cách nhau một giờ:
Vào lúc chậm:
zzz ***Tue Apr 23 06:13:44 EDT 2013 Sample interval: 5 seconds
Linux 2.6.32-400.21.1.el5uek (remote.database.com) 04/23/13
06:13:44 CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
06:13:49 all 6.26 0.00 1.32 0.00 0.01 0.02 0.00 92.39 36448.70
06:13:54 all 8.17 0.00 1.92 0.01 0.00 0.05 0.00 89.86 38918.09
06:13:59 all 8.11 0.00 1.18 0.01 0.00 0.05 0.00 90.65 40989.86
06:14:04 all 8.04 0.00 1.25 0.06 0.00 0.05 0.00 90.61 40242.86
06:14:09 all 6.62 0.00 1.27 0.02 0.00 0.05 0.00 92.04 37460.32
06:14:14 all 7.56 0.00 1.47 0.02 0.00 0.02 0.00 90.94 37288.67
06:14:19 all 7.19 0.00 1.21 0.14 0.00 0.02 0.00 91.44 36947.91
06:14:24 all 6.50 0.00 1.02 0.01 0.00 0.02 0.00 92.45 35792.86
06:14:29 all 7.28 0.00 1.82 0.01 0.00 0.02 0.00 90.87 36795.42
06:14:34 all 7.37 0.02 1.20 0.02 0.00 0.01 0.00 91.37 36818.80
06:14:39 all 7.41 0.00 1.05 0.02 0.00 0.02 0.00 91.49 36874.90
06:14:44 all 7.15 0.01 1.62 0.04 0.00 0.02 0.00 91.16 35904.77
06:14:49 all 7.21 0.00 1.22 0.14 0.00 0.02 0.00 91.41 38867.73
06:14:54 all 7.31 0.00 1.00 0.00 0.00 0.03 0.00 91.65 39378.74
Vào thời điểm bận rộn:
zzz ***Tue Apr 23 07:23:02 EDT 2013 Sample interval: 5 seconds
Linux 2.6.32-400.21.1.el5uek (remote.database.com) 04/23/13
07:24:20 CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
07:24:25 all 2.74 0.00 97.16 0.00 0.00 0.10 0.00 0.00 39066.67
07:24:30 all 3.06 0.00 96.87 0.00 0.00 0.07 0.00 0.00 37637.52
07:24:37 all 3.13 0.00 96.79 0.01 0.00 0.07 0.00 0.00 36788.64
07:24:42 all 2.69 0.00 97.17 0.05 0.00 0.09 0.00 0.00 38270.04
07:24:48 all 3.86 0.01 94.92 1.02 0.00 0.20 0.00 0.00 43247.39
07:24:53 all 3.51 0.00 96.19 0.20 0.00 0.11 0.00 0.00 39887.45
07:24:59 all 4.22 0.00 93.51 2.12 0.00 0.15 0.00 0.00 40638.08
07:25:04 all 6.26 0.00 85.04 8.56 0.00 0.13 0.00 0.00 41915.79
07:25:09 all 8.69 0.00 67.31 23.85 0.00 0.11 0.00 0.03 44586.56
07:25:15 all 8.09 0.00 80.62 11.17 0.00 0.12 0.00 0.00 44321.66
07:25:21 all 7.18 0.00 71.95 20.80 0.00 0.07 0.00 0.00 35399.65
07:25:26 all 6.69 0.00 68.20 24.97 0.01 0.12 0.00 0.00 38734.99
07:25:31 all 7.11 0.01 74.71 18.09 0.00 0.08 0.00 0.00 36695.68
07:25:36 all 7.46 0.00 14.17 78.20 0.00 0.05 0.00 0.13 32934.53
07:25:50 all 9.71 0.00 23.99 66.24 0.00 0.05 0.00 0.00 33617.64
07:25:56 all 7.80 0.00 85.97 6.13 0.00 0.10 0.00 0.00 41234.83
Ảnh chụp nhanh từ 06:13 cho thấy hiệu suất tốt và ảnh chụp từ 7:32 sáng trong nhà. Lưu ý các dấu hiệu sau về hiệu suất kém trong ảnh chụp nhanh giây:
-
%sys
cột hiển thị mức sử dụng cao nhất là 97,17. -
%iowait
cột hiển thị mức sử dụng cao nhất là 78,20.
Đọc đầu ra hàng đầu
top
lệnh cung cấp ảnh chụp nhanh hàng giờ về hoạt động của bộ xử lý. Nhật ký hiển thị các quá trình được liệt kê theo thứ tự giảm dần của việc sử dụng CPU, do đó quá trình sử dụng nhiều CPU nhất được liệt kê đầu tiên.
Trong trường hợp mức sử dụng CPU trên hệ thống tăng đột ngột và số lượng xử lý không thay đổi, top
có thể giúp xác định vấn đề.
Ví dụ đầu ra
Hãy xem xét tình huống sau, trong đó CPU tăng đột biến mặc dù tải không giảm:
zzz ***Tue Apr 23 03:13:44 EDT 2013 Sample interval: 5 seconds. All measurements in KB (1024 bytes)
top - 04:13:44 up 22 days, 21:12, 10 users, load average: 65.80, 169.78, 117.65
Tasks: 2297 total, 4 running, 2229 sleeping, 0 stopped, 64 zombie
Cpu0 : 12.7%us, 2.6%sy, 0.0%ni, 84.2%id, 0.5%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu1 : 6.7%us, 2.0%sy, 0.0%ni, 91.1%id, 0.1%wa, 0.0%hi, 0.1%si, 0.0%st
Cpu2 : 6.4%us, 1.7%sy, 0.0%ni, 91.8%id, 0.1%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu3 : 5.5%us, 1.3%sy, 0.0%ni, 93.1%id, 0.1%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu4 : 7.6%us, 1.6%sy, 0.0%ni, 90.7%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu5 : 5.3%us, 1.1%sy, 0.0%ni, 93.5%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu6 : 11.8%us, 2.7%sy, 0.0%ni, 85.3%id, 0.1%wa, 0.0%hi, 0.1%si, 0.0%st
Cpu7 : 7.0%us, 2.2%sy, 0.0%ni, 90.6%id, 0.1%wa, 0.0%hi, 0.1%si, 0.0%st
Cpu8 : 5.8%us, 1.5%sy, 0.0%ni, 91.8%id, 0.8%wa, 0.0%hi, 0.1%si, 0.0%st
Cpu9 : 8.0%us, 1.7%sy, 0.0%ni, 90.0%id, 0.1%wa, 0.0%hi, 0.2%si, 0.0%st
Cpu10 : 3.8%us, 1.2%sy, 0.0%ni, 94.9%id, 0.1%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu11 : 3.6%us, 1.0%sy, 0.0%ni, 95.3%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Mem: 99060540k total, 91969324k used, 7091216k free, 84044k buffers
Swap: 25165816k total, 17797404k used, 7368412k free, 609612k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
20343 oracle 20 0 13.4g 10g 5864 R 98.4 10.7 18:56.54 oraclevntrd2 (LOCAL=NO)
30180 root 20 0 11872 2312 656 R 98.4 0.0 0:00.68 /bin/netstat -n -p -l
6568 root 39 19 0 0 0 R 89.9 0.0 263:39.04 [kipmi0]
30262 root 20 0 23704 3116 1048 R 11.9 0.0 0:00.15 /usr/bin/top -b -d 5 -n 720
4921 root RT 0 247m 86m 55m S 6.8 0.1 328:08.44 /u01/app/11.2.0.3/grid/bin/osysmond.bin
28116 oracle 20 0 2623m 71m 14m S 6.8 0.1 51:51.62 /u01/app/11.2.0.3/grid/bin/oraagent.bin
4970 grid RT 0 359m 176m 54m S 5.1 0.2 157:05.89 /u01/app/11.2.0.3/grid/bin/ocssd.bin
64 root 20 0 0 0 0 S 1.7 0.0 4:39.22 [ksoftirqd/20]
4903 root 20 0 367m 20m 13m S 1.7 0.0 26:09.97 /u01/app/11.2.0.3/grid/bin/orarootagent.bin
6496 root 20 0 1274m 15m 11m S 1.7 0.0 28:27.53 /u01/app/11.2.0.3/grid/bin/orarootagent.bin
6535 oracle 20 0 1830m 263m 4620 S 1.7 0.3 88:05.31 /u01/app/oracle/product/agent12c/core/12.1.0.2.0/jdk/bin/java -Xmx128M -server -Djava.secu
7803 oracle -2 0 1266m 11m 4068 S 1.7 0.0 9:15.42 ora_lms0_oradb2
7874 oracle -2 0 1266m 15m 4188 S 1.7 0.0 9:16.20 ora_lms0_oradb2
7999 oracle 20 0 1284m 10m 3292 S 1.7 0.0 2:49.08 ora_lmd0_oradb2
8297 oracle 20 0 1230m 3368 2864 S 1.7 0.0 0:39.95 ora_pmon_oradb2
8333 oracle -2 0 1252m 2380 2108 S 1.7 0.0 13:19.99 ora_vktm_bid2
8443 oracle -2 0 1252m 2340 2096 S 1.7 0.0 13:21.86 ora_vktm_oradb2
8535 oracle 20 0 1253m 2712 2412 S 1.7 0.0 0:14.28 ora_dskm_oradb2
8727 oracle -2 0 1266m 11m 3656 S 1.7 0.0 9:01.37 ora_lms0_im1d2
8905 oracle 20 0 1267m 13m 3468 S 1.7 0.0 9:52.75 ora_dia0_pstd2
Phân tích nhật ký:
Dòng zzz ***Tue Apr 23 03:13:44 EDT 2013 Sample interval: 5 seconds. All measurements in KB (1024 bytes)
xác định thời gian nhật ký ghi lại thống kê.
Dòng top - 04:13:44 up 22 days, 21:12, 10 users
cho biết rằng hệ thống đã chạy trong 22 ngày kể từ lần khởi động lại gần đây nhất.
Dòng load average: 65.80, 169.78, 117.65
hiển thị số lượng quy trình trung bình trong hàng đợi chạy trong một, năm và mười lăm phút cuối cùng. Tải trung bình càng cao, hệ thống càng bận. Mức trung bình tải tăng đáng kể cho thấy có vấn đề. Ví dụ:nhật ký trước cho biết thời gian bận so với nhật ký từ bảy phút sau, dựa trên số trung bình tải:top - 04:20:53 up 22 days, 21:19, 10 users, load average: 2.93, 43.22, 75.56
Dòng Tasks: 2297 total, 4 running, 2229 sleeping, 0 stopped, 64 zombie
:Tại thời điểm chụp nhanh này, có 2297 quy trình, 2229 đang ở chế độ ngủ, bị chặn bởi I / O hoặc cuộc gọi hệ thống và 4 đang chạy hoặc được gán cho một CPU. Số lượng tiến trình đang chạy không bao giờ được vượt quá số lượng CPU. Thêm 64 quy trình là thây ma, tức là chúng đã chết, nhưng hệ thống vẫn chưa làm sạch chúng hoàn toàn. Số lượng quy trình thay đổi, nhưng nếu số lượng đột ngột tăng hoặc giảm, điều đó có thể cho thấy sự cố.
Dòng Mem: 99060540k total, 91969324k used, 7091216k free, 84044k buffers
hiển thị lượng bộ nhớ truy cập ngẫu nhiên (RAM) tính bằng kilobyte đang được sử dụng và còn trống. Hãy chú ý đến cách điều này thay đổi theo thời gian để bạn có thể xác định sự cố.
Dòng Swap: 25165816k total, 17797404k used, 7368412k free, 609612k cached
:Nếu RAM hết, hệ thống sẽ chuyển sang hoán đổi bộ nhớ. Khi sử dụng bộ nhớ hoán đổi thường xuyên hơn khoảng 40% RAM, bạn nên cân nhắc việc tăng RAM. Việc sử dụng bộ nhớ hoán đổi cao ảnh hưởng tiêu cực đến hiệu suất. Nếu đạt 100%, hệ thống có thể khởi động lại.
Các dòng CPU sau đây cho biết số lượng và việc sử dụng 12 CPU trong hệ thống này:
Cpu0 : 12.7%us, 2.6%sy, 0.0%ni, 84.2%id, 0.5%wa, 0.0%hi, 0.0%si, 0.0%st
...
Cpu11 : 3.6%us, 1.0%sy, 0.0%ni, 95.3%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Các dòng quy trình sau hiển thị chi tiết về các quy trình đang chạy tại thời điểm chụp nhanh:
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
20343 oracle 20 0 13.4g 10g 5864 R 98.4 10.7 18:56.54 oraclevntrd2 (LOCAL=NO)
30180 root 20 0 11872 2312 656 R 98.4 0.0 0:00.68 /bin/netstat -n -p -l
6568 root 39 19 0 0 0 R 89.9 0.0 263:39.04 [kipmi0]
30262 root 20 0 23704 3116 1048 R 11.9 0.0 0:00.15 /usr/bin/top -b -d 5 -n 720
...
8727 oracle -2 0 1266m 11m 3656 S 1.7 0.0 9:01.37 ora_lms0_im1d2
8905 oracle 20 0 1267m 13m 3468 S 1.7 0.0 9:52.75 ora_dia0_pstd2
Phần quy trình chứa các thông tin sau:
-
PID
:ID quy trình hệ điều hành của quy trình -
USER
:Chủ sở hữu của quá trình -
%CPU
:Phần trăm CPU được sử dụng bởi quá trình -
%MEM
:Phần trăm tiêu thụ bộ nhớ -
COMMAND
:Lệnh đang thực thi
Kết luận
Bằng cách sử dụng OSWatcher, bạn có thể theo dõi hiệu suất hệ thống và các vấn đề có thể xác định được. Ví dụ:kiểm tra xem liệu một quy trình có sử dụng nhiều aCPU trong một khoảng thời gian nhất quán hay không. Nếu một lệnh SQL có tải cao, thì đây có thể là một ứng cử viên để điều chỉnh. Nếu một quy trình sử dụng nhiều bộ nhớ, thì bạn có thể điều tra xem điều này có bình thường không.
Có các số liệu thống kê khác có sẵn trong OSWatcher để xem xét, sau khi xem xét CPU, bộ nhớ và I / O đĩa (chẳng hạn như tải hệ thống). Nếu bạn xác định được mức tăng tải trên hệ thống bằng cách sử dụng phân tích OSWatcher, một nửa trận chiến sẽ thắng.
Sử dụng tab Phản hồi để đưa ra bất kỳ nhận xét hoặc đặt câu hỏi nào.
Nguồn tham khảo:
Cách phân tích hoặc đọc kết quả OSWatcher trong ba bước dễ dàng với ví dụ
Tối ưu hóa môi trường của bạn với quản trị, quản lý và cấu hình của chuyên gia
Dịch vụ ứng dụng của Rackspace (RAS) các chuyên gia cung cấp các dịch vụ chuyên nghiệp và được quản lý sau trên nhiều danh mục ứng dụng:
- nền tảng Thương mại điện tử và Trải nghiệm Kỹ thuật số
- Hoạch định Nguồn lực Doanh nghiệp (ERP)
- Kinh doanh Thông minh
- Quản lý quan hệ khách hàng của Salesforce (CRM)
- Cơ sở dữ liệu
- Lưu trữ Email và Năng suất
Chúng tôi cung cấp:
- Chuyên môn không thiên vị :Chúng tôi đơn giản hóa và hướng dẫn hành trình hiện đại hóa của bạn, tập trung vào các khả năng mang lại giá trị tức thì.
- Trải nghiệm cuồng tín ™:Chúng tôi kết hợp một Quy trình trước. Công nghệ thứ hai. Tiếp cận với hỗ trợ kỹ thuật chuyên dụng để cung cấp các giải pháp toàn diện.
- Danh mục đầu tư vô song :Chúng tôi áp dụng nhiều kinh nghiệm về đám mây để giúp bạn lựa chọn và triển khai công nghệ phù hợp trên đám mây phù hợp.
- Phân phối nhanh :Chúng tôi đáp ứng bạn ở nơi bạn đang ở trong hành trình và thành công vượt bậc với bạn.
Trò chuyện ngay bây giờ để bắt đầu.