Computer >> Máy Tính >  >> Lập trình >> Cơ sở dữ liệu

Giới thiệu về Oracle OSWatcher và đọc nhật ký

Oracle® OSWatcher là một tiện ích thu thập dữ liệu từ các lệnh như vmstat , iostat , top , ps , netstat , HP-UX® sar và Linux® meminfo . OSWatcher lưu trữ các tệp dữ liệu, tự động tìm kiếm sự cố và trợ giúp để xác định nguyên nhân gốc rễ của sự cố, nếu có thể.

Giới thiệu

Hàng giờ, OSWatcher thu thập số liệu thống kê về hệ điều hành (OS) trong nền bằng cách sử dụng các lệnh OS sau:

  • CPU
  • Bộ nhớ
  • I / O đĩa

OSWatcher ghi các tệp vào $ TFA_HOME / repository / suptools / walhall / oswbb / oracle / archive / .

Bởi vì không tồn tại công việc dọn phòng tự động, bạn nên tạo một công việc cron để tự động xóa các tệp cũ hơn một số ngày để dọn dẹp thống kê hệ điều hành. Ví dụ:công việc cron dọn dẹp của bạn có thể chạy lệnh sau để xóa các tệp cũ hơn 10 ngày:

find $TFA_HOME/repository/suptools/walhall/oswbb/oracle/archive -name "*.*" -mtime +10 -exec rm -f {} \;

Đọc đầu ra nhật ký oswiostat

Nếu iostat được cài đặt và người dùng OSWatcher có đặc quyền chạy tiện ích, nhật ký OSWatcher thu thập và lưu trữ kết quả đầu ra hàng giờ, theo mặc định, từ iostat lệnh.

iostat , được sử dụng để giám sát tải thiết bị đầu vào và đầu ra của hệ thống, thu thập thông tin sau:

  • Thời gian
  • Các đĩa vật lý và tốc độ truyền dữ liệu trung bình của chúng

Ví dụ về đầu ra

oswiostat tệp nhật ký bao gồm các dữ liệu sau:

  • device :Tên thiết bị
  • r/s :Số lần đọc mỗi giây
  • w/s :Viết mỗi giây
  • rsec/s :Kilobyte đọc mỗi giây
  • wsec/s :Kilobyte được ghi trên giây
  • avgrq-sz :Số lượng giao dịch trung bình đang chờ dịch vụ
  • avgqu-sz :Số lượng giao dịch trung bình đang được phục vụ
  • %util :Phần trăm thời gian đĩa bận

Sau đây là hai ví dụ về oswiostat nhật ký, được thực hiện cách nhau bảy giờ:

Vào lúc chậm:

Time: 00:01:09

avg-cpu:  %user   %nice %system %iowait  %steal   %idle

           5.22    0.01    1.77    0.10    0.00   92.90

Device:         rrqm/s   wrqm/s   r/s   w/s   rsec/s   wsec/s avgrq-sz avgqu-sz   await  svctm  %util

sda              10.24   101.92 10.28 29.60   569.53  1057.09    40.79     0.21    5.30   0.53   2.11
sda1              0.00     0.00  0.00  0.00     0.17     0.00   138.66     0.00   12.37   3.45   0.00
sda2             10.24   101.92 10.28 29.57   569.36  1057.09    40.81     0.21    5.30   0.53   2.11
dm-0              0.00     0.00  1.72 77.98    75.95   623.85     8.78     1.20   14.99   0.08   0.67
dm-1              0.00     0.00  0.46  2.37     3.80    18.94     8.04     0.01    2.71   0.29   0.08
dm-2              0.00     0.00  7.44 50.74   278.30   410.79    11.84     0.72   12.30   0.23   1.33
dm-3              0.00     0.00  0.00  0.00     0.15     0.00   509.61     0.00   46.78   7.53   0.00
dm-4              0.00     0.00  0.49  0.00   117.41     0.02   238.95     0.00    1.94   1.05   0.05
dm-5              0.00     0.00  0.05  0.00    10.84     0.00   230.78     0.00    2.58   1.34   0.01
dm-6              0.00     0.00  0.00  0.00     0.10     0.00   479.96     0.00   54.94   8.70   0.00

Vào thời điểm bận rộn:

Time: 07:32:57

avg-cpu:  %user   %nice %system %iowait  %steal   %idle

           8.16    0.00   70.29   21.55    0.00    0.00

Device:         rrqm/s   wrqm/s   r/s   w/s   rsec/s   wsec/s avgrq-sz avgqu-sz   await  svctm  %util

sda             163.40     7.73 2074.74 53.95 73642.61   493.47    34.83   107.13   50.07   0.47 100.07
sda1              0.00     0.00  0.00  0.00     0.00     0.00     0.00     0.00    0.00   0.00   0.00
sda2            163.40     7.73 2074.74 53.95 73642.61   493.47    34.83   107.13   50.07   0.47 100.07
dm-0              0.00     0.00 201.03  0.86  8412.37     6.87    41.70    58.68  281.80   4.96 100.07
dm-1              0.00     0.00 180.76 26.46  1446.05   211.68     8.00    25.24  119.01   4.83 100.07
dm-2              0.00     0.00 1868.90 34.54 63913.40   276.29    33.72   332.23  172.22   0.53 100.09
dm-3              0.00     0.00  0.00  0.00     0.00     0.00     0.00     0.00    0.00   0.00   0.00
dm-4              0.00     0.00  0.00  0.00     0.00     0.00     0.00     0.00    0.00   0.00   0.00
dm-5              0.00     0.00  0.00  0.00     0.00     0.00     0.00     0.00    0.00   0.00   0.00
dm-6              0.00     0.00  0.00  0.00     0.00     0.00     0.00     0.00    0.00   0.00   0.00

Nguồn hình ảnh :https://www.dbas-oracle.com/2013/05/How-to-Analyze-or-Read-OS-Watcher-Output-in-three-easy-steps-With-Example.html

Ảnh chụp nhanh từ nửa đêm cho thấy hiệu suất tốt và ảnh chụp từ 7:32 sáng hiệu suất trong nhà. Lưu ý các dấu hiệu sau về hiệu suất kém trong ảnh chụp nhanh giây:

  • Một số đĩa đang bận 100%, như được thấy trong %util cột.
  • r/s cột hiển thị số lần đọc rất cao mỗi giây.
  • avg-cpu %idle thống kê cho thấy hệ thống không hoạt động 0% so với 92% không tải trong ảnh chụp nhanh trước đó.

Đọc đầu ra nhật ký mpstat

Nếu mpstat được cài đặt và người dùng OSWatcher có đặc quyền chạy tiện ích, nhật ký OSWatcher thu thập và lưu trữ kết quả đầu ra hàng giờ, theo mặc định, từ mpstat yêu cầu. Quản trị viên cơ sở dữ liệu sử dụng lệnh này để giám sát việc sử dụng đơn vị xử lý trung tâm (CPU).

Ví dụ đầu ra

mpstat tệp nhật ký bao gồm các dữ liệu sau:

  • CPU :Những CPU nào. all bao gồm số liệu thống kê từ tất cả các CPU có sẵn trong hệ thống.
  • %user :Phần trăm CPU được sử dụng bởi các chương trình của USER
  • %sys :Phần trăm CPU được sử dụng bởi các chương trình hệ thống
  • %iowait :Phần trăm CPU được sử dụng bởi IO đang đợi
  • %idle :Phần trăm tài nguyên hệ thống nhàn rỗi

Sau đây là hai ví dụ về mpstat các bản ghi cách nhau một giờ:

Vào lúc chậm:

zzz ***Tue Apr 23 06:13:44 EDT 2013 Sample interval: 5 seconds

Linux 2.6.32-400.21.1.el5uek (remote.database.com)     04/23/13

06:13:44     CPU   %user   %nice    %sys %iowait    %irq   %soft  %steal   %idle    intr/s

06:13:49     all    6.26    0.00    1.32    0.00    0.01    0.02    0.00   92.39  36448.70
06:13:54     all    8.17    0.00    1.92    0.01    0.00    0.05    0.00   89.86  38918.09
06:13:59     all    8.11    0.00    1.18    0.01    0.00    0.05    0.00   90.65  40989.86
06:14:04     all    8.04    0.00    1.25    0.06    0.00    0.05    0.00   90.61  40242.86
06:14:09     all    6.62    0.00    1.27    0.02    0.00    0.05    0.00   92.04  37460.32
06:14:14     all    7.56    0.00    1.47    0.02    0.00    0.02    0.00   90.94  37288.67
06:14:19     all    7.19    0.00    1.21    0.14    0.00    0.02    0.00   91.44  36947.91
06:14:24     all    6.50    0.00    1.02    0.01    0.00    0.02    0.00   92.45  35792.86
06:14:29     all    7.28    0.00    1.82    0.01    0.00    0.02    0.00   90.87  36795.42
06:14:34     all    7.37    0.02    1.20    0.02    0.00    0.01    0.00   91.37  36818.80
06:14:39     all    7.41    0.00    1.05    0.02    0.00    0.02    0.00   91.49  36874.90
06:14:44     all    7.15    0.01    1.62    0.04    0.00    0.02    0.00   91.16  35904.77
06:14:49     all    7.21    0.00    1.22    0.14    0.00    0.02    0.00   91.41  38867.73
06:14:54     all    7.31    0.00    1.00    0.00    0.00    0.03    0.00   91.65  39378.74

Vào thời điểm bận rộn:

zzz ***Tue Apr 23 07:23:02 EDT 2013 Sample interval: 5 seconds

Linux 2.6.32-400.21.1.el5uek (remote.database.com)     04/23/13

07:24:20     CPU   %user   %nice    %sys %iowait    %irq   %soft  %steal   %idle    intr/s

07:24:25     all    2.74    0.00   97.16    0.00    0.00    0.10    0.00    0.00  39066.67
07:24:30     all    3.06    0.00   96.87    0.00    0.00    0.07    0.00    0.00  37637.52
07:24:37     all    3.13    0.00   96.79    0.01    0.00    0.07    0.00    0.00  36788.64
07:24:42     all    2.69    0.00   97.17    0.05    0.00    0.09    0.00    0.00  38270.04
07:24:48     all    3.86    0.01   94.92    1.02    0.00    0.20    0.00    0.00  43247.39
07:24:53     all    3.51    0.00   96.19    0.20    0.00    0.11    0.00    0.00  39887.45
07:24:59     all    4.22    0.00   93.51    2.12    0.00    0.15    0.00    0.00  40638.08
07:25:04     all    6.26    0.00   85.04    8.56    0.00    0.13    0.00    0.00  41915.79
07:25:09     all    8.69    0.00   67.31   23.85    0.00    0.11    0.00    0.03  44586.56
07:25:15     all    8.09    0.00   80.62   11.17    0.00    0.12    0.00    0.00  44321.66
07:25:21     all    7.18    0.00   71.95   20.80    0.00    0.07    0.00    0.00  35399.65
07:25:26     all    6.69    0.00   68.20   24.97    0.01    0.12    0.00    0.00  38734.99
07:25:31     all    7.11    0.01   74.71   18.09    0.00    0.08    0.00    0.00  36695.68
07:25:36     all    7.46    0.00   14.17   78.20    0.00    0.05    0.00    0.13  32934.53
07:25:50     all    9.71    0.00   23.99   66.24    0.00    0.05    0.00    0.00  33617.64
07:25:56     all    7.80    0.00   85.97    6.13    0.00    0.10    0.00    0.00  41234.83

Ảnh chụp nhanh từ 06:13 cho thấy hiệu suất tốt và ảnh chụp từ 7:32 sáng trong nhà. Lưu ý các dấu hiệu sau về hiệu suất kém trong ảnh chụp nhanh giây:

  • %sys cột hiển thị mức sử dụng cao nhất là 97,17.
  • %iowait cột hiển thị mức sử dụng cao nhất là 78,20.

Đọc đầu ra hàng đầu

top lệnh cung cấp ảnh chụp nhanh hàng giờ về hoạt động của bộ xử lý. Nhật ký hiển thị các quá trình được liệt kê theo thứ tự giảm dần của việc sử dụng CPU, do đó quá trình sử dụng nhiều CPU nhất được liệt kê đầu tiên.

Trong trường hợp mức sử dụng CPU trên hệ thống tăng đột ngột và số lượng xử lý không thay đổi, top có thể giúp xác định vấn đề.

Ví dụ đầu ra

Hãy xem xét tình huống sau, trong đó CPU tăng đột biến mặc dù tải không giảm:

zzz ***Tue Apr 23 03:13:44 EDT 2013 Sample interval: 5 seconds. All measurements in KB (1024 bytes)

top - 04:13:44 up 22 days, 21:12, 10 users,  load average: 65.80, 169.78, 117.65

Tasks: 2297 total,   4 running, 2229 sleeping,   0 stopped,  64 zombie

Cpu0  : 12.7%us,  2.6%sy,  0.0%ni, 84.2%id,  0.5%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu1  :  6.7%us,  2.0%sy,  0.0%ni, 91.1%id,  0.1%wa,  0.0%hi,  0.1%si,  0.0%st
Cpu2  :  6.4%us,  1.7%sy,  0.0%ni, 91.8%id,  0.1%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu3  :  5.5%us,  1.3%sy,  0.0%ni, 93.1%id,  0.1%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu4  :  7.6%us,  1.6%sy,  0.0%ni, 90.7%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu5  :  5.3%us,  1.1%sy,  0.0%ni, 93.5%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu6  : 11.8%us,  2.7%sy,  0.0%ni, 85.3%id,  0.1%wa,  0.0%hi,  0.1%si,  0.0%st
Cpu7  :  7.0%us,  2.2%sy,  0.0%ni, 90.6%id,  0.1%wa,  0.0%hi,  0.1%si,  0.0%st
Cpu8  :  5.8%us,  1.5%sy,  0.0%ni, 91.8%id,  0.8%wa,  0.0%hi,  0.1%si,  0.0%st
Cpu9  :  8.0%us,  1.7%sy,  0.0%ni, 90.0%id,  0.1%wa,  0.0%hi,  0.2%si,  0.0%st
Cpu10 :  3.8%us,  1.2%sy,  0.0%ni, 94.9%id,  0.1%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu11 :  3.6%us,  1.0%sy,  0.0%ni, 95.3%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st

Mem:  99060540k total, 91969324k used,  7091216k free,    84044k buffers
Swap: 25165816k total, 17797404k used,  7368412k free,   609612k cached

 PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND

20343 oracle    20   0 13.4g  10g 5864 R 98.4 10.7  18:56.54 oraclevntrd2 (LOCAL=NO)
30180 root      20   0 11872 2312  656 R 98.4  0.0   0:00.68 /bin/netstat -n -p -l
 6568 root      39  19     0    0    0 R 89.9  0.0 263:39.04 [kipmi0]
30262 root      20   0 23704 3116 1048 R 11.9  0.0   0:00.15 /usr/bin/top -b -d 5 -n 720
 4921 root      RT   0  247m  86m  55m S  6.8  0.1 328:08.44 /u01/app/11.2.0.3/grid/bin/osysmond.bin
28116 oracle    20   0 2623m  71m  14m S  6.8  0.1  51:51.62 /u01/app/11.2.0.3/grid/bin/oraagent.bin
 4970 grid      RT   0  359m 176m  54m S  5.1  0.2 157:05.89 /u01/app/11.2.0.3/grid/bin/ocssd.bin
   64 root      20   0     0    0    0 S  1.7  0.0   4:39.22 [ksoftirqd/20]
 4903 root      20   0  367m  20m  13m S  1.7  0.0  26:09.97 /u01/app/11.2.0.3/grid/bin/orarootagent.bin
 6496 root      20   0 1274m  15m  11m S  1.7  0.0  28:27.53 /u01/app/11.2.0.3/grid/bin/orarootagent.bin
 6535 oracle    20   0 1830m 263m 4620 S  1.7  0.3  88:05.31 /u01/app/oracle/product/agent12c/core/12.1.0.2.0/jdk/bin/java -Xmx128M -server -Djava.secu
 7803 oracle    -2   0 1266m  11m 4068 S  1.7  0.0   9:15.42 ora_lms0_oradb2
 7874 oracle    -2   0 1266m  15m 4188 S  1.7  0.0   9:16.20 ora_lms0_oradb2
 7999 oracle    20   0 1284m  10m 3292 S  1.7  0.0   2:49.08 ora_lmd0_oradb2
 8297 oracle    20   0 1230m 3368 2864 S  1.7  0.0   0:39.95 ora_pmon_oradb2
 8333 oracle    -2   0 1252m 2380 2108 S  1.7  0.0  13:19.99 ora_vktm_bid2
 8443 oracle    -2   0 1252m 2340 2096 S  1.7  0.0  13:21.86 ora_vktm_oradb2
 8535 oracle    20   0 1253m 2712 2412 S  1.7  0.0   0:14.28 ora_dskm_oradb2
 8727 oracle    -2   0 1266m  11m 3656 S  1.7  0.0   9:01.37 ora_lms0_im1d2
 8905 oracle    20   0 1267m  13m 3468 S  1.7  0.0   9:52.75 ora_dia0_pstd2

Phân tích nhật ký:

Dòng zzz ***Tue Apr 23 03:13:44 EDT 2013 Sample interval: 5 seconds. All measurements in KB (1024 bytes) xác định thời gian nhật ký ghi lại thống kê.

Dòng top - 04:13:44 up 22 days, 21:12, 10 users cho biết rằng hệ thống đã chạy trong 22 ngày kể từ lần khởi động lại gần đây nhất.

Dòng load average: 65.80, 169.78, 117.65 hiển thị số lượng quy trình trung bình trong hàng đợi chạy trong một, năm và mười lăm phút cuối cùng. Tải trung bình càng cao, hệ thống càng bận. Mức trung bình tải tăng đáng kể cho thấy có vấn đề. Ví dụ:nhật ký trước cho biết thời gian bận so với nhật ký từ bảy phút sau, dựa trên số trung bình tải:top - 04:20:53 up 22 days, 21:19, 10 users, load average: 2.93, 43.22, 75.56

Dòng Tasks: 2297 total, 4 running, 2229 sleeping, 0 stopped, 64 zombie :Tại thời điểm chụp nhanh này, có 2297 quy trình, 2229 đang ở chế độ ngủ, bị chặn bởi I / O hoặc cuộc gọi hệ thống và 4 đang chạy hoặc được gán cho một CPU. Số lượng tiến trình đang chạy không bao giờ được vượt quá số lượng CPU. Thêm 64 quy trình là thây ma, tức là chúng đã chết, nhưng hệ thống vẫn chưa làm sạch chúng hoàn toàn. Số lượng quy trình thay đổi, nhưng nếu số lượng đột ngột tăng hoặc giảm, điều đó có thể cho thấy sự cố.

Dòng Mem: 99060540k total, 91969324k used, 7091216k free, 84044k buffers hiển thị lượng bộ nhớ truy cập ngẫu nhiên (RAM) tính bằng kilobyte đang được sử dụng và còn trống. Hãy chú ý đến cách điều này thay đổi theo thời gian để bạn có thể xác định sự cố.

Dòng Swap: 25165816k total, 17797404k used, 7368412k free, 609612k cached :Nếu RAM hết, hệ thống sẽ chuyển sang hoán đổi bộ nhớ. Khi sử dụng bộ nhớ hoán đổi thường xuyên hơn khoảng 40% RAM, bạn nên cân nhắc việc tăng RAM. Việc sử dụng bộ nhớ hoán đổi cao ảnh hưởng tiêu cực đến hiệu suất. Nếu đạt 100%, hệ thống có thể khởi động lại.

Các dòng CPU sau đây cho biết số lượng và việc sử dụng 12 CPU trong hệ thống này:

Cpu0  : 12.7%us,  2.6%sy,  0.0%ni, 84.2%id,  0.5%wa,  0.0%hi,  0.0%si,  0.0%st
...
Cpu11 :  3.6%us,  1.0%sy,  0.0%ni, 95.3%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st

Các dòng quy trình sau hiển thị chi tiết về các quy trình đang chạy tại thời điểm chụp nhanh:

 PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND

20343 oracle    20   0 13.4g  10g 5864 R 98.4 10.7  18:56.54 oraclevntrd2 (LOCAL=NO)
30180 root      20   0 11872 2312  656 R 98.4  0.0   0:00.68 /bin/netstat -n -p -l
 6568 root      39  19     0    0    0 R 89.9  0.0 263:39.04 [kipmi0]
30262 root      20   0 23704 3116 1048 R 11.9  0.0   0:00.15 /usr/bin/top -b -d 5 -n 720
...
 8727 oracle    -2   0 1266m  11m 3656 S  1.7  0.0   9:01.37 ora_lms0_im1d2
 8905 oracle    20   0 1267m  13m 3468 S  1.7  0.0   9:52.75 ora_dia0_pstd2

Phần quy trình chứa các thông tin sau:

  • PID :ID quy trình hệ điều hành của quy trình
  • USER :Chủ sở hữu của quá trình
  • %CPU :Phần trăm CPU được sử dụng bởi quá trình
  • %MEM :Phần trăm tiêu thụ bộ nhớ
  • COMMAND :Lệnh đang thực thi

Kết luận

Bằng cách sử dụng OSWatcher, bạn có thể theo dõi hiệu suất hệ thống và các vấn đề có thể xác định được. Ví dụ:kiểm tra xem liệu một quy trình có sử dụng nhiều aCPU trong một khoảng thời gian nhất quán hay không. Nếu một lệnh SQL có tải cao, thì đây có thể là một ứng cử viên để điều chỉnh. Nếu một quy trình sử dụng nhiều bộ nhớ, thì bạn có thể điều tra xem điều này có bình thường không.

Có các số liệu thống kê khác có sẵn trong OSWatcher để xem xét, sau khi xem xét CPU, bộ nhớ và I / O đĩa (chẳng hạn như tải hệ thống). Nếu bạn xác định được mức tăng tải trên hệ thống bằng cách sử dụng phân tích OSWatcher, một nửa trận chiến sẽ thắng.

Sử dụng tab Phản hồi để đưa ra bất kỳ nhận xét hoặc đặt câu hỏi nào.

Nguồn tham khảo:

Cách phân tích hoặc đọc kết quả OSWatcher trong ba bước dễ dàng với ví dụ

Tối ưu hóa môi trường của bạn với quản trị, quản lý và cấu hình của chuyên gia

Dịch vụ ứng dụng của Rackspace (RAS) các chuyên gia cung cấp các dịch vụ chuyên nghiệp và được quản lý sau trên nhiều danh mục ứng dụng:

  • nền tảng Thương mại điện tử và Trải nghiệm Kỹ thuật số
  • Hoạch định Nguồn lực Doanh nghiệp (ERP)
  • Kinh doanh Thông minh
  • Quản lý quan hệ khách hàng của Salesforce (CRM)
  • Cơ sở dữ liệu
  • Lưu trữ Email và Năng suất

Chúng tôi cung cấp:

  • Chuyên môn không thiên vị :Chúng tôi đơn giản hóa và hướng dẫn hành trình hiện đại hóa của bạn, tập trung vào các khả năng mang lại giá trị tức thì.
  • Trải nghiệm cuồng tín ™:Chúng tôi kết hợp một Quy trình trước. Công nghệ thứ hai. Tiếp cận với hỗ trợ kỹ thuật chuyên dụng để cung cấp các giải pháp toàn diện.
  • Danh mục đầu tư vô song :Chúng tôi áp dụng nhiều kinh nghiệm về đám mây để giúp bạn lựa chọn và triển khai công nghệ phù hợp trên đám mây phù hợp.
  • Phân phối nhanh :Chúng tôi đáp ứng bạn ở nơi bạn đang ở trong hành trình và thành công vượt bậc với bạn.

Trò chuyện ngay bây giờ để bắt đầu.