최근에 관리하고 있는 시스템 중 부하 분산이 불가한 소프트웨어를 Windows 서버에서 서비스하는 케이스가 있습니다. 부하 분산이 가능하도록 재설계하거나 수정하는 작업이 필요하지만 여러 이유에 의해 불가한 경우입니다. 이처럼 부하 분산을 할 수 없는 서버를 위해 사양이 추가로 필요한지 지속적으로 모니터링하고 사양을 조정하는 작업이 필요하다고 판단했습니다.

이때 WhaTap과 같은 모니터링 서비스를 사용해도 됩니다. 하지만 단순한 성능 그래프만 필요한 상황에서는 Windows 서버의 성능 모니터를 사용하는 것이 비용 절감에 탁월합니다. 다중 서버의 경우라면 Active Directory를 활용하면 됩니다.


문제 상황 설명

(HIDPI)문제가 있는 성능 수집기 구성 사진

각 코어별 성능과 CPU 평균 성능을 5초마다 기록하기 위해서 위 사진과 같이 Windows 서버 성능 모니터의 카운터에 Processor 아래에 평균 성능(_Total)User Time으로 각 코어별 성능을 추가하였습니다. 세팅을 완료하고 성능 지표가 잘 수집되는지 확인하기 위해 집계를 수 십초만 진행해 보았습니다. 아래 사진과 같이 Windows 성능 모니터에는 각 코어별 성능은 온데간데 없이 _Total만 수집되고 있었습니다.

(HIDPI)코어별 성능이 기록되지 않는 그래프 사진


해결 방법

단순한 Windows의 오류인 것인지, 각 평균 성능과 코어별 성능을 하나의 데이터 수집기에 넣으면 안되는 것인지 판단해내기 어려웠지만 해결 방법은 간단했습니다.

(HIDPI)CPU 평균 성능과 코어별 성능 데이터 수집기를 분리한 사진

위 사진처럼 CPU 평균 성능을 수집하는 데이터 수집기 집합, 각 코어별 성능을 수집하는 데이터 수집기 집합을 각각 생성하여 총 2개의 데이터 수집기 집합을 운용하면 됩니다. 이때 하나의 수집기 집합에 넣으면 문제 상황이 반복됩니다.

(HIDPI)CPU 평균 성능 그래프

(HIDPI)코어별 성능 그래프

위 사진은 _Total 데이터 수집기 집합과 각 코어별 데이터 수집기 집합이 각각 잘 작동 중인 사진입니다.


마치며

이전에도 동일한 문제를 겪고 한없이 데이터 수집기만 재생성했던 기억이 있습니다. 어떻게 해결했었는지 잊어버렸는데 오늘 다시 이 일을 겪으니 블로그에 올려야겠다는 생각이 앞섭니다. 앞으로 이런 자잘한 문제 해결 사례는 블로그에 꾸준히 올려두고 참고해야겠습니다.