본문 바로가기
공부/서버운영관리

[서버운영관리] 인프라 엔지니어의 업무

by kyoung-ho 2024. 4. 17.
반응형

인프라 설계

사용 목적의 따라 필요한 기능이나 성능 등 조건이 달라진다.

목적을 이해하고 기준을 정리한다.

 

정리되면 그 기준에 맞는 적절한 기획서와 설계서를 작성해야한다.

어떤 인프라를 어느 정도의 비용으로, 어느 정도의 기간 내에 만들 수 있는지 예상하는 작업이다.

 

이 작업은 인프라 엔지니어가 직접하기도 하고 업체나 컨설턴트에 의뢰해서 제안을 받기도 한다.

기획서와 설계서가 완성되면 합당한 책임자에게 결재를 올린다.

 

인프라 구축

인프라 구축 작업은 기기의 운반과 조립, 장착, 설치, 설정, 동작 테스트, 부하 테스트 등으로 분류할 수 있다.

SI(System Integration) - 시스템 통합 운영

CE(Customer Engineer) - 기기를 들여와서 설치하는 하드웨어 관련작업을 함.

SE(System Engineer) - 서버나 스토리지 설정, 서버 트블슈팅

NE(Network Engineer) - 보안장비, 네트워크 장비 설정 등


각 인프라 구축에 있어서 역할이 있지만 요새 SI업계에선 모두 할 수 있는 인프라 엔지니어를 원하는 추세인 것 같다.

인프라 운영

인프라는 24시간, 365일 내내 가동되어야 하기 때문에 직접 인프라를 운영하는 회사는 몇 개의 팀을 만들어 24시간, 365일 교대로 운영 하는 것이 일반적이다.(요새는 하청(MSP)을 맡기거나, 기기가 망가지거나 천재지변이 일어 나지 않는한 집에서 재택으로 문제생기면 봐주는 정도?) 교대근무는 지양해야한다!!!

클라우드 전환으로 PaaS 업체에서 365 가상서버를 돌리는게 좋다. (비용이 비쌈)
PaaS업체 ex) AWS, NCP, NHN Toast, GCP, Azure

인프라 운영은 다음처럼 주로 '장애 대응' 과 '수용량 관리' , '인프라가 원인이 아닌 문제의 파악' 으로 나눌 수 있다.

장애대응

장애 대응에는 하드웨어 고장이나 급격한 부하증가에 대한 대책부터 부적절한 권한 설정에 의해 액세스가 불가능한 상황의 해소 등이 있다.

 

수용량 관리

구축한 인프라는 시간이 지나면서 액세스 수나 데이터 양 등이 늘기도 하고 줄기도 한다.

적당한 시기에 인프라의 수용력을 재검토해야 한다. 구체적으로는 인프라 전체의 수용량이 부족하면 인프라를 늘려야 하고, 반대로 너무 여유롭다면 인프라를 축소해서 규모를 적절하게 조정한다.

 

인프라가 원인이 아닌 문제의 파악

시스템에 문제가 발생하면 콜센터나 다른 부서에서 인프라 엔지니어에게 장애 원인에 관한 문의가 들어온다.

ex) 웹 접근이 안돼요, 포트 접근이 안돼요, DB에 안붙어요 등등

 

이런 경우, 인프라가 원인일 때도 있지만 프로그램의 버그나 애플리케이션 설정 실수 등 인프라가 원인이 아닐 때도 있다.

장애 원인이 인프라인지 아닌지를 파악한 뒤 인프라가 원인이면 직접 대응하고, 인프라가 원인이 아니면 대응 가능한 부서에 대응 요청을 한다.

반응형

댓글