운영 WAS 서버 모니터링 방법 / WhaTap 설치형 SaaS 사용 방법

WhaTap 모니터링

웹 was 내 프로젝트 환경 정보를 엑셀에 작성하여 메일로 전달하면,
WhaTap에서 웹 was 트래픽을 수집하는 모니터링 서버 구축 후 웹 was에 에이전트를 설치해 주십니다.
허용된 공인 IP에서 WhaTap URL으로 접속하면 사용자 트래픽 정보를 볼 수 있습니다.

WhaTap 모니터링 기능

  • 애플리케이션 대시보드 : 전체 또는 일부 was에 대한 실시간 트래픽 지연 확인
  • 히트맵 : 최근 응답 완료 된 트래픽 및 경과 시간 확인
  • 트레이스 분석 : 히트맵 영역 드래그 시 확인 가능
  • 어떤 URL으로 들어온 트래픽이 얼마나 오래 걸렸는지 기록
  • 지연 쿼리 및 액티브 스택 (에러 메세지) 확인
  • 대시보드 > 트랜잭션 맵 : 요청이 많은 트랜잭션 Top 30 요청 건수 확인
  • 분석 > 일자별 애플리케이션 현황 : 금일 사용자 수, 시간당 사용자 수 등 확인 가능
  • 분석 > 성능 추이 : 동시접속 사용자 수, CPU 사용량, 힙 메모리 사용량 확인 가능
  • 분석 > 트랜잭션 검색 : 트랜잭션 URL 및 경과시간으로 트랜잭션 검색, 트레이스 분석 확인

WhaTap 단점

  • 쿼리 복호화에 실패하여 select $ 형태로 나오는 경우도 간혹 있습니다.

운영 에러 원인 파악 및 해결 방법 (트러블 슈팅)

트랜잭션 지연 원인 파악 방법

  1. 지연되어 빨갛거나 노란 히트맵을 드래그해서 트레이스 분석 팝업을 엽니다.
  2. 트랜잭션 테이블 뷰에서 ‘경과’ 시간이 오래걸린 항목의 에러 메세지를 확인합니다.
  3. API URL이면 API 제공처에 문제가 발생했을 수 있고, 쿼리면 인덱스 튜닝이 필요할 수 있습니다.

DB 연결이 안되는 경우

Communications link failure The last packet successfully received from the server was 6,827,031 milliseconds ago. The last packet sent successfully to the server was 6,827,157 milliseconds ago.

트랜잭션의 트레이스 분석에서 DB 연결 부분에 경과시간이 오래 걸리고, 아래 select $이 나오는 경우
커넥션 풀이 부족하여 DB 연결을 하지 못하고 대기한 것일 수 있습니다.
운영 DB 설정에서 커넥션 풀 개수를 400개로 상향 조정하여 해결하였습니다.

톰캣 서버 다운 여부 파악

와탭 좌측 대시보드 : 애플리케이션 대시보드 메뉴 > LIVE 활성화 중 > 상단 was1, was2 등에서 확인할 서버만 선택 > 히트맵에 요청이 계속 들어오고 있으면 서버 작동중 상태
서버가 다운된 시간이 몇 분인지도 히트맵을 요청이 비어있는 구간으로 파악 가능합니다.

히트맵 분석으로 요청 지연 원인 파악

와탭 좌측 대시보드 : 애플리케이션 대시보드 메뉴 > 히트맵 우측 ‘>’ 클릭 > 시간 설정 (최근 5분, 금일 가능) > 문제 히트맵 드래그 > 문제 트랜잭션 URL 검색 (예시 : /user/evlTrgt/resetStdTest.do) > 하단 TX트레이스 표에서 트랜잭션 선택하여 레코드 요약 에러메세지 및 테이블 뷰에서 원인 확인

트랜잭션 검색으로 에러 원인 파악

운영 에러 발생시키고 > 와탭 좌측 분석 : 트랜잭션 검색 메뉴 > 시간 설정 (최근 5분 가능) > 필터 : 트랜잭션 인풋에 URL 입력 > 파란색 돋보기 버튼 클릭 > 검색된 트랜잭션 선택하여 레코드 요약 에러메세지 및 테이블 뷰에서 원인 확인

Leave a comment