5G 기지국 가용성 99.97% 유지, AI DC 액침 냉각·DLC 운용 이해, GPUaaS 수익화 관점 — 인프라를 비용 센터에서 수익 센터로 전환한 합격자 K.M.의 전략
K.M.(ANON, 26세, 전기전자공학)은 대학 연구실과 인턴 경험에서 쌓은 네트워크 장애 대응·서버 운용 역량을 SKT의 AI 피라미드 전략과 정교하게 연결해 합격했습니다. 핵심은 세 가지였습니다. 첫째, 5G 기지국 장애 자동 탐지 스크립트를 구축해 MTTR(평균 복구 시간)을 기존 38분에서 11분으로 72% 단축한 정량 성과. 둘째, 데이터센터 냉각 최적화 프로젝트에서 PUE를 1.6에서 1.3으로 개선해 연 전력 비용 18% 절감을 달성한 경험. 셋째, "GPUaaS 서비스 가동률이 곧 SKT의 신규 수익"이라는 인프라 수익화 관점으로 단순 운용직이 아닌 비즈니스 기여자로 자신을 포지셔닝한 전략입니다. SKT가 SK엔무브·기가컴퓨팅 협력을 통해 액침 냉각(Immersion Cooling)·DLC(Direct Liquid Cooling)를 본격 도입하는 시점에, PUE 수치를 직접 개선한 경험은 면접관의 즉각적인 관심을 끌었고, 이것이 최종 합격의 핵심 차별화 포인트가 됐습니다.
대부분의 ICT 인프라 지원자가 기술 스택 나열에 머문다면, 합격본은 구체적인 수치와 SKT 전략과의 연결이 핵심입니다. 아래 두 쌍의 Before/After에서 차이를 확인하세요.
| 운용 지표 | 기준값 (Before) | 달성값 (After) | 방법 및 도구 |
|---|---|---|---|
| MTTR (평균 복구 시간) | 38분 | 11분 | 72% 단축 · Python+SNMP 자동화 |
| AI DC PUE (전력효율지수) | 1.6 | 1.3 | DLC 도입 · 전력 비용 18% 절감 |
| 5G 기지국 가용성 | 99.82% (목표) | 99.97% | 예방 정비 자동화 · Ansible Playbook |
| 핸드오버 실패율 (5G NR Xn) | 0.25% | 0.08% | Xn 인터페이스 최적화 · 파라미터 튜닝 |
| 장애 탐지 시간 (MTTD) | 수동 모니터링 15분 | 자동 탐지 45초 | Prometheus + Alertmanager 연동 |
| GPU 서버 가동률 | 96.3% | 99.1% | 예방 점검 주기 최적화 · 열 관리 개선 |
SKT의 가산 AI DC는 국내에서 가장 높은 전력 밀도(랙당 44kW)를 목표로 설계된 고밀도 AI 전용 데이터센터입니다. 일반적인 엔터프라이즈 데이터센터의 랙당 평균 전력이 4~5kW임을 감안하면 약 9배에 달하는 수치입니다. 이처럼 높은 전력 밀도는 NVIDIA H100 GPU와 같은 고성능 AI 가속기를 밀집 배치하기 위한 것으로, 기존 공냉 시스템으로는 물리적으로 감당이 불가능합니다. ICT 인프라 직무는 이 고밀도 환경에서 안정적 운용을 책임집니다.
| 구분 | 일반 데이터센터 | SKT 가산 AI DC (목표) | 차이 |
|---|---|---|---|
| 랙당 전력 밀도 | 4~5kW | 44kW | 약 9배 |
| 냉각 방식 | 공냉(CRAC/CRAH) | 액침 냉각 + DLC | 차세대 방식 전환 |
| PUE (목표) | 1.4~1.6 | 1.05 이하 | 에너지 효율 3배+ |
| 주요 서버 | 범용 CPU 서버 | NVIDIA H100·리벨리온 NPU | AI 전용 가속기 |
| 주요 서비스 | 웹호스팅·ERP | GPUaaS·AI 모델 학습·추론 | 수익 직결 서비스 |
| 냉각 파트너 | 범용 HVAC 업체 | SK엔무브(유전체 용액)·기가컴퓨팅 | SK 그룹사 협력 생태계 |
액침 냉각(Immersion Cooling)은 전기적으로 비전도성인 특수 유전체 용액에 서버 전체를 담가 열을 제거하는 방식입니다. SK엔무브가 공급하는 유전체 용액은 기존 변압기 절연유 기술에서 파생된 소재로, 서버 구성품에 화학적 영향을 미치지 않으면서도 물의 약 4배에 달하는 열용량을 가집니다. DLC(Direct Liquid Cooling)는 액침의 전 단계 방식으로, 서버 내 특정 발열 부위(CPU·GPU)에만 냉각수 플레이트를 밀착시켜 냉각합니다. 두 방식 모두 공냉 대비 PUE를 획기적으로 낮출 수 있으며, SKT는 단계적으로 DLC → 완전 액침 냉각으로 전환 중입니다.
ICT 인프라 면접은 단순 지식 확인을 넘어, 실제 장애 상황에서의 판단력과 비즈니스 관점을 함께 검증합니다. K.M.이 경험한 면접 질문과 효과적인 답변 방향을 정리했습니다.
| 면접 질문 | 핵심 답변 방향 | 연결 포인트 |
|---|---|---|
| "PUE 1.3을 달성했는데, 더 낮추려면 무엇이 필요한가요?" | DLC에서 완전 액침 냉각으로 전환 + 히트 리커버리 시스템(폐열 재활용) 도입 + 외기 냉각(Free Cooling) 병행이면 PUE 1.1 이하 가능 | SKT 넷제로 목표 + SK엔무브 협력 언급 |
| "MTTR을 11분보다 더 줄이려면 어떻게 하나요?" | ML 기반 예측형 장애 감지(사후 복구 → 사전 예방)로 발생 자체를 줄임. Predictive Maintenance 모델 도입 시 MTTR이 아닌 장애 발생 횟수 자체가 감소 | AI 기반 운용 자동화 + SUPEX 목표 연결 |
| "GPU 서버와 일반 CPU 서버의 냉각 요구사항 차이는?" | H100 GPU는 TDP 700W로 일반 CPU(150~250W) 대비 3~5배. 단일 서버당 발열이 크게 높아 공냉 불충분. GPU 전용 DLC 쿨링 플레이트 또는 액침 냉각 필수 | GPUaaS 운용 = 고밀도 열 관리 문제 |
| "SLA 99.9%와 99.99%의 차이가 실제로 중요한가요?" | 99.9%는 연간 8.7시간 다운타임 허용, 99.99%는 52분. GPUaaS 기업 고객에게 H100 클러스터 8.7시간 중단은 수억 원 손실. SLA 등급이 계약 단가와 직결 | GPUaaS 수익화 + MTTR 최소화의 비즈니스 가치 |
| "5G SA와 NSA의 차이를 설명하고, SKT에서 SA가 왜 중요한가요?" | NSA(Non-Standalone)는 LTE 코어를 공유해 제어 신호가 LTE를 통함. SA는 5G 코어(5GC) 독립 구성으로 네트워크 슬라이싱·초저지연(URLLC)·MEC 완전 활용 가능. SKT의 UAM·B2B AI 솔루션 SLA 보장에 SA 필수 | 5G SA + MEC + UAM 연결 |
SKT 자소서는 지원 동기, 직무 역량, 도전 경험, SKMS 관련 4개 항목으로 구성됩니다. 각 항목에서 ICT 인프라 직무에 최적화된 서술 전략을 정리했습니다.
SKT ICT 인프라 면접에서 5G 코어망(5GC, 5G Core) 구조에 대한 질문은 빠지지 않습니다. 특히 5G SA(Standalone) 구조에서 각 네트워크 기능(NF, Network Function)의 역할과 MEC 연동 방식을 이해하는 것이 핵심입니다.
| 네트워크 기능 | 역할 | ICT 인프라 관련성 |
|---|---|---|
| AMF (Access and Mobility Management) | 단말 접속 관리, 이동성 관리, 핸드오버 절차 조율 | 기지국 핸드오버 실패 시 AMF 로그 분석 → 장애 원인 파악 |
| SMF (Session Management) | PDU 세션 생성·관리, IP 주소 할당, UPF 선택 | 데이터 세션 품질 모니터링, QoS 파라미터 설정 |
| UPF (User Plane Function) | 사용자 데이터 패킷 포워딩, 트래픽 필터링 | MEC 서버와 UPF를 연동 → 로컬 오프로드 구현 |
| gNB (5G 기지국) | 무선 신호 송수신, 스케줄링, 빔 관리 | 기지국 가용성 모니터링, 파라미터 최적화, 핸드오버 임계값 설정 |
| MEC (Mobile Edge Computing) | 기지국 근방 엣지 서버에서 컴퓨팅 처리, 레이턴시 최소화 | UAM 제어·실시간 AI 추론을 위한 엣지 서버 운용 |
| Network Slice | eMBB·URLLC·mMTC 등 서비스별 가상 망 분리 | 슬라이스별 QoS 보장, 격리된 가용성 확보 |
SK텔레콤의 AI 피라미드 전략은 3개 층위로 구성됩니다. 최하단의 AI 인프라(Infrastructure), 중간의 AIX(AI Transformation), 최상단의 AI 서비스(Service)입니다. ICT 인프라 직무는 피라미드 전체를 떠받치는 물리적 기반을 운용하고 유지하는 역할을 담당합니다.
| AI 피라미드 층위 | SKT 핵심 사업 | ICT 인프라 직무의 역할 | 핵심 기술 |
|---|---|---|---|
| Layer 1: AI 인프라 | 가산 AI DC, GPUaaS, Sovereign AI (리벨리온 NPU) | GPU 서버 가동률 99.9%+ 유지, AI DC PUE 최적화, 액침 냉각 운용 | 액침 냉각·DLC·PUE·Kubernetes |
| Layer 2: AIX | 5G 망 AI 최적화, 네트워크 슬라이싱, 자동화 운용 | 5G 기지국 가용성 보장, MTTR 최소화, MEC 서버 운용 | 5G NR·MEC·Ansible·Prometheus |
| Layer 3: AI 서비스 | 에이닷(A.), B2B AI 솔루션, UAM 통신 | 서비스 연결 인프라(네트워크·서버) 고가용성 보장 | SLA·가용성·이중화·CDN |
이 구조에서 ICT 인프라 직무의 핵심 가치는 명확합니다. 피라미드 상층이 무너지지 않도록 기반을 안정적으로 운용하는 것입니다. 그러나 2026년 SKT가 강조하는 것은 단순한 "안정적 운용"이 아닙니다. GPUaaS 수익화, AI DC ESG 개선, 5G 슬라이싱을 통한 새로운 BM 창출이라는 비즈니스 기여가 인프라 직무에서도 요구됩니다.
K.M.의 합격 경험을 토대로 구성한 ICT 인프라 준비 로드맵입니다. 각 영역별로 최소 1개 이상의 수치 기반 경험이 있어야 합니다.
| 준비 영역 | 핵심 경험·지식 | 자소서 표현 방법 | 중요도 |
|---|---|---|---|
| 네트워크 장애 대응 | MTTR 측정 경험, 장애 탐지 자동화 (Python/SNMP/Zabbix), 이중화 구성 | MTTR 단축 % + 사용 도구 + 장애 원인 분석 방법론 | ★★★ 필수 |
| AI DC 운용·설계 | PUE 측정/개선, 냉각 방식 이해(공냉/DLC/액침), 랙 전력 밀도 계산 | PUE 수치 + 냉각 방식 선택 근거 + 비용 절감 효과 | ★★★ 필수 |
| 5G/LTE 망 이해 | 5G SA/NSA 구조, gNB·AMF·SMF·UPF 역할, 핸드오버 과정 | 망 가용성 수치 + 핸드오버 실패율 + 파라미터 최적화 경험 | ★★★ 필수 |
| 자동화·운용 도구 | Ansible·Terraform (IaC), Prometheus·Grafana (모니터링), Kubernetes | 자동화로 단축한 운용 시간 + 구체 Playbook 활용 사례 | ★★☆ 권장 |
| GPUaaS·AI 인프라 | GPU 클러스터 구조, SLA 개념, 쿠버네티스 GPU 스케줄링 | GPUaaS 수익화 관점 + 가용성이 매출에 미치는 영향 논리 | ★★☆ 권장 |
| ESG·에너지 효율 | PUE 개념, 탄소 배출 계수, 재생에너지 연계(REC), SKT 넷제로 | PUE 개선 → CO₂ 절감량 수치 → SKT 2030 목표 연결 | ★☆☆ 가점 |
아래 문장들은 K.M.의 실제 합격 자소서에서 면접관이 긍정적으로 평가한 핵심 표현입니다. 단순 복사가 아닌 자신의 경험으로 재구성하는 참고 자료로 활용하세요.
자소서 한 문장을 만들기 위해 어떤 경험을 쌓고 어떻게 연결했는지 K.M.이 공유한 실제 준비 과정입니다.
| 시기 | 준비 활동 | 자소서 연결 포인트 |
|---|---|---|
| D-180 ~ D-150 | 대학 서버실 PUE 측정 프로젝트 시작. CRAC 설정값·핫아일 분리 실험 진행 | PUE 1.6→1.3 개선, 전력 비용 18% 절감 수치 확보 |
| D-150 ~ D-120 | Python+SNMP 장애 탐지 스크립트 개발. Prometheus+Grafana 대시보드 구성 | MTTR 72% 단축, 탐지 시간 45초 수치 확보 |
| D-120 ~ D-90 | Ansible Playbook으로 초기 복구 자동화. 5G NR 핸드오버 파라미터 이론 학습 | 자동화 운용 경험 + 5G 이해도 서술 근거 확보 |
| D-90 ~ D-60 | SKT AI 피라미드 전략 분석, GPUaaS·Sovereign AI 관련 IR 자료 학습 | 인프라 수익화 관점 + SKT 전략 연결 논리 완성 |
| D-60 ~ D-30 | 커리어던으로 자소서 초안 작성 및 진단. 약점 항목(5G NR 세부 지식) 보완 | 5개 항목 점수 균형 → 종합 88/100 달성 |
| D-30 ~ D-0 | 면접 예상 질문 50개 준비. PUE 계산·MTTR 단축 근거 추가 정리 | 면접에서 수치 즉답 → 기술 역량 신뢰도 확보 |
커리어던 AI 자소서 진단으로 MTTR 수치 표현·PUE 경험·GPUaaS 관점 포함 여부를 지금 바로 점검하세요
무료 자소서 진단 받기SK텔레콤 채용에서 'ICT 인프라'와 '인프라 엔지니어링'은 종종 혼동됩니다. 두 직무의 핵심 차이를 명확히 이해하고 자신의 강점에 맞는 직무를 선택해야 합니다.
| 구분 | ICT 인프라 (이 페이지) | 인프라 엔지니어링 |
|---|---|---|
| 핵심 역할 | 기존 인프라의 안정적 운용·유지·개선 | 차세대 인프라의 신규 설계·구축 |
| 주요 업무 | 장애 대응(MTTR 최소화), 5G 기지국 운용, AI DC 관리, PUE 최적화 | UAM 상공망 설계, 6G 망 아키텍처, AI DC 액침 냉각 시스템 설계 |
| 요구 경험 | 운용 자동화, 가용성 수치, 장애 분석, 모니터링 도구 숙련 | 채널 모델링, 안테나 설계, TCO 분석, 시뮬레이션 도구 경험 |
| 차별화 포인트 | 인프라 수익화(GPUaaS) 관점, MTTR·PUE 수치, 자동화 역량 | UAM 통신 설계 경험, 액침 냉각 타당성 분석, ESG 수치 연결 |
| 추천 지원자 | 서버·네트워크 운용 경험자, 자동화 스크립트 개발자, 데이터센터 경험자 | 드론·무인기 통신 실험자, AI DC 설계 프로젝트 수행자, 시뮬레이션 연구자 |
ICT 인프라 직무는 SKT 내 다양한 기술 전문가 트랙으로 성장할 수 있는 출발점입니다. AI DC 운용 경험은 클라우드 아키텍처 전문가로, 5G 망 운용 경험은 차세대 망 설계 엔지니어로 성장하는 경로를 열어줍니다.
| 성장 경로 | 주요 역할 | 연결 기술 | 목표 시기 |
|---|---|---|---|
| AI 인프라 전문가 | GPUaaS 클러스터 설계, AI 학습 인프라 최적화, Sovereign AI 인프라 구축 | GPU 아키텍처·Kubernetes·InfiniBand·400GbE | 입사 3~5년차 |
| 차세대 망 설계 엔지니어 | UAM 상공망 설계, 6G 코어망 아키텍처, MEC 배치 전략 | 5G SA·6G·MEC·URLLC·네트워크 슬라이싱 | 입사 5~8년차 |
| AI Ops/AIOps 전문가 | ML 기반 장애 예측, 자율 운용(Autonomous Network), 지능형 운용 자동화 | 머신러닝·Predictive Maintenance·자동화 파이프라인 | 입사 4~7년차 |
| 인프라 아키텍트 | SKT 전사 인프라 전략 수립, 신기술 도입 타당성 평가, 파트너사 협력 조율 | 멀티클라우드·엣지·AI DC·글로벌 표준 | 입사 8년차 이상 |
SKT ICT 인프라 직무는 통신망 운용에서 시작해 AI DC 고밀도 서버 운용, 차세대 망 설계, AIOps 자동화까지 확장할 수 있는 넓은 성장 경로를 제공합니다. 특히 GPUaaS 사업이 성장하면서 AI 인프라 전문가에 대한 수요가 빠르게 증가하고 있어, ICT 인프라 직무는 AI 시대의 핵심 전문직으로 재편되고 있습니다. 자소서에서 "단기적 운용 안정화 → 중기적 AI 인프라 전문화"라는 성장 로드맵을 함께 제시하면 면접관에게 장기적 가치를 어필할 수 있습니다.
K.M.은 커리어던의 AI 자소서 진단 서비스를 통해 초안의 약점을 발견하고 합격본으로 발전시켰습니다. 커리어던은 단순한 맞춤법 교정이 아닌, 직무별 합격 기준 데이터와 AI 분석을 결합한 전문 자소서 최적화 서비스입니다.