このドキュメントでは、Cisco Policy Suite(CPS)でCPU使用率が高くなる根本原因を特定するためにJava Stack(Jstack)を使用する方法について説明します。
Jstackは、実行中のJavaプロセスのメモリダンプを取得します(CPSでは、QNSはJavaプロセスです)。 Jstackには、スレッド/アプリケーションや各スレッドの機能など、そのJavaプロセスの詳細がすべて含まれています。
Jstackは、エンジニアや開発者が各スレッドの状態を知ることができるようにJstackトレースを提供します。
JavaプロセスのJstackトレースを取得するために使用されるLinuxコマンドは次のとおりです。
# jstack <process id of Java process>
各CPS(以前のQuantum Policy Suite(QPS)バージョン)でのJstackプロセスの場所は、「/usr/java/jdk1.7.0_10/bin/」です。「jdk1.7.0_10」はJavaのバージョンで、Javaのバージョンはシステムごとに異なります。
Linuxコマンドを入力して、Jstackプロセスの正確なパスを見つけることもできます。
# find / -iname jstack
Javaプロセスが原因でCPU使用率が高くなる問題をトラブルシューティングする手順を理解するために、ここで説明します。CPU使用率が高い場合、一般的に、Javaプロセスがシステムから高いCPUを使用していることを学習します。
ステップ 1:仮想マシン(VM)からどのプロセスが高いCPUを消費しているかを判断するには、top Linuxコマンドを入力します。
この出力から、%CPUを消費するプロセスを取り出します。この場合、Javaは5.9 %を要しますが、40 %、100 %、200 %、300 %、400 %などのCPUを多く消費する可能性があります。
ステップ 2:Javaプロセスが高いCPUを消費する場合は、次のコマンドのいずれかを入力して、どのスレッドがどの程度のCPUを消費しているかを調べます。
# ps -C java -L -o pcpu,cpu,nice,state,cputime,pid,tid | sort
または
# ps -C-L -o pcpu,cpu,nice,state,cputime,pid,tid | sort
例として、この表示は、Javaプロセスが高いCPU使用率(+40%)と、高い使用率を担当するJavaプロセスのスレッドを消費していることを示しています。
<snip>
0.2 - 0 S 00:17:56 28066 28692
0.2 - 0 S 00:18:12 28111 28622
0.4 - 0 S 00:25:02 28174 28641
0.4 - 0 S 00:25:23 28111 28621
0.4 - 0 S 00:25:55 28066 28691
43.9 - 0 R 1-20:24:41 28026 30930
44.2 - 0 R 1-20:41:12 28026 30927
44.4 - 0 R 1-20:57:44 28026 30916
44.7 - 0 R 1-21:14:08 28026 30915
%CPU CPU NI S TIME PID TID
システム内にアプリケーション(つまり、単一の実行プロセス)があるとします。ただし、多くのタスクを実行するには、多くのプロセスを作成する必要があり、各プロセスは多数のスレッドを作成します。一部のスレッドは、リーダー、ライター、およびコール詳細レコード(CDR)の作成などのさまざまな目的である可能性があります。
前の例では、JavaプロセスID(28026など)に30915、30916、30927などの複数のスレッドがあります。
ステップ 3:高CPUを消費するJavaスレッドの機能をチェックします。
完全なJstackトレースを取得するには、次のLinuxコマンドを入力します。プロセスIDはJava PIDです。たとえば、前の出力に示すように28026です。
# cd /usr/java/jdk1.7.0_10/bin/
# jstack <process ID>
前のコマンドの出力は次のようになります。
2015-02-04 21:12:21
Full thread dump Java HotSpot(TM) 64-Bit Server VM (23.7-b01 mixed mode):
"Attach Listener" daemon prio=10 tid=0x000000000fb42000 nid=0xc8f waiting on
condition [0x0000000000000000]
java.lang.Thread.State: RUNNABLE
"ActiveMQ BrokerService[localhost] Task-4669" daemon prio=10 tid=0x00002aaab41fb800
nid=0xb24 waiting on condition [0x000000004c9ac000]
java.lang.Thread.State: TIMED_WAITING (parking)
at sun.misc.Unsafe.park(Native Method)
- parking to wait for <0x00000000c2c07298>
(a java.util.concurrent.SynchronousQueue$TransferStack)
at java.util.concurrent.locks.LockSupport.parkNanos(LockSupport.java:226)
at java.util.concurrent.SynchronousQueue$TransferStack.awaitFulfill
(SynchronousQueue.java:460)
at java.util.concurrent.SynchronousQueue$TransferStack.transfer
(SynchronousQueue.java:359)
at java.util.concurrent.SynchronousQueue.poll(SynchronousQueue.java:942)
at java.util.concurrent.ThreadPoolExecutor.getTask(ThreadPoolExecutor.java:1068)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1130)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:615)
at java.lang.Thread.run(Thread.java:722)
"ActiveMQ BrokerService[localhost] Task-4668" daemon prio=10 tid=0x00002aaab4b55800
nid=0xa0f waiting on condition [0x0000000043a1d000]
java.lang.Thread.State: TIMED_WAITING (parking)
at sun.misc.Unsafe.park(Native Method)
- parking to wait for <0x00000000c2c07298>
(a java.util.concurrent.SynchronousQueue$TransferStack)
at java.util.concurrent.locks.LockSupport.parkNanos(LockSupport.java:226)
at java.util.concurrent.SynchronousQueue$TransferStack.awaitFulfill
(SynchronousQueue.java:460)
at java.util.concurrent.SynchronousQueue$TransferStack.transfer
(SynchronousQueue.java:359)
at java.util.concurrent.SynchronousQueue.poll(SynchronousQueue.java:942)
at java.util.concurrent.ThreadPoolExecutor.getTask(ThreadPoolExecutor.java:1068)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1130)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:615)
at java.lang.Thread.run(Thread.java:722)
<snip>
"pool-84-thread-1" prio=10 tid=0x00002aaac45d8000 nid=0x78c3 runnable
[0x000000004c1a4000]
java.lang.Thread.State: RUNNABLE
at sun.nio.ch.IOUtil.drain(Native Method)
at sun.nio.ch.EPollSelectorImpl.doSelect(EPollSelectorImpl.java:92)
- locked <0x00000000c53717d0> (a java.lang.Object)
at sun.nio.ch.SelectorImpl.lockAndDoSelect(SelectorImpl.java:87)
- locked <0x00000000c53717c0> (a sun.nio.ch.Util$2)
- locked <0x00000000c53717b0> (a java.util.Collections$UnmodifiableSet)
- locked <0x00000000c5371590> (a sun.nio.ch.EPollSelectorImpl)
at sun.nio.ch.SelectorImpl.select(SelectorImpl.java:98)
at zmq.Signaler.wait_event(Signaler.java:135)
at zmq.Mailbox.recv(Mailbox.java:104)
at zmq.SocketBase.process_commands(SocketBase.java:793)
at zmq.SocketBase.send(SocketBase.java:635)
at org.zeromq.ZMQ$Socket.send(ZMQ.java:1205)
at org.zeromq.ZMQ$Socket.send(ZMQ.java:1196)
at com.broadhop.utilities.zmq.concurrent.MessageSender.run(MessageSender.java:146)
at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:471)
at java.util.concurrent.FutureTask$Sync.innerRun(FutureTask.java:334)
at java.util.concurrent.FutureTask.run(FutureTask.java:166)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1145)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:615)
at java.lang.Thread.run(Thread.java:722)
次に、Javaプロセスのどのスレッドが高いCPU使用率を引き起こしているかを判断する必要があります。
例として、ステップ2で説明したTID 30915を見てください。Jstackトレースでは16進数形式しか見つからないため、10進数形式のTIDを16進数形式に変換する必要があります。10進形式を16進形式に変換するには、このコンバータを使用します。
ステップ3で確認できるように、Jstackトレースの後半は、高いCPU使用率の背後にある責任のあるスレッドの1つであるスレッドです。Jstackトレースで78C3(16進形式)が見つかると、このスレッドは「nid=0x78c3」としてのみ見つかります。 したがって、高いCPU消費を引き起こすJavaプロセスのすべてのスレッドを見つけることができます。
上記のすべての情報は、CPSおよびその他のテクノロジー開発者が、システム/VMの高いCPU使用率の問題の根本原因を特定するのに役立ちます。問題が表示された時点で、前述の情報をキャプチャします。CPU使用率が正常に戻ると、CPU高使用率の問題の原因となったスレッドを特定できません。
CPSログもキャプチャする必要があります。パス'/var/log/broadhop'の「PCRFclient01」VMからのCPSログのリストを次に示します。
また、PCRFclient01 VMから次のスクリプトとコマンドの出力を取得します。