빅5 병원, '의료 인공지능(AI) 실증' 전면전 돌입
환자 진단·치료·예후관리 등 급속히 확대…행정까지 '전(全) 분야' 적용
2026.01.02 15:14 댓글쓰기



대한민국에서 의료 인공지능(AI)은 이제 ‘도입 여부’를 논의하는 단계를 넘어 의료 현장에 어떻게 활용할 것인가를 고민하는 국면에 접어들었다. 단순 영상 판독 보조를 넘어 진단과 치료 전략은 물론 예후 예측이 패러다임으로 구축되고 있다. 여기에 병원 행정 자동화까지 AI 적용 범위가 빠르게 확대되면서 병원들도 전략 마련에 총력을 기울이는 분위기다. 데일리메디는 빅5 병원을 비롯한 수도권, 지역 거점병원, 그리고 헬스케어 기업을 중심으로 국내 의료 AI 실증 현장 상황과 향후 파급력을 짚어본다. [편집자주]


서울대병원, 의료AI 실증 선도


먼저 빅5 병원 중에서는 서울대병원이 생성형 AI, 의료 거대언어모델 등 전(全) 영역에서 의료 AI 실증을 가장 폭넓게 전개하고 있다.


서울대병원 영상의학과 박창민·이동헌 교수와 소화기내과 임종필 교수팀은 최근 대장내시경 영상 1만6000개 이미지 조각을 학습한 생성형 AI 기반 내시경 시뮬레이터 ‘SeamXSim’을 개발했다. 


대장 구조 재현 오차는 기존 5.6mm에서 3.6mm로 줄었고 비디오 생성 모델 ‘SeamXSim-T’를 통해 영상 연속성과 일관성도 16% 이상 개선됐다. 전공의 8명을 대상으로 한 평가에서도 점막 질감, 혈관 패턴, 병변 식별력, 임상 적용 가능성 등 대부분 항목에서 평균 4점 이상을 기록했다. 


서울대병원은 앞서 네이버와 공동으로 한국형 의료 특화 거대언어모델 ‘KMed.ai’도 공개했다. 


KMed.ai는 국내 의료법·진료 가이드라인·의료 언어 체계를 반영한 주권형 의료 LLM(대규모언어모델)로, 의료진이 직접 개발 과정에 참여해 진료 기록 작성, 의학적 추론, 의사결정 보조까지 수행한다. 


2025년도 의사 국가고시(KMLE) 벤치마크 평가에서 평균 96.4점을 기록해 의료 특화 성능을 입증했다. 서울대병원은 이를 바탕으로 EMR 기반 문서 작성 보조, 진단 보조 기능 등 의료 에이전트 플랫폼을 단계적으로 실제 진료에 적용할 계획이다.


또 서울대병원 소아정신과 김붕년 교수와 융합의학과 김영곤 교수팀은 부모가 촬영한 1분 이내 영상만으로 자폐스펙트럼장애 위험을 예측하는 AI 모델을 개발해 공개했다.


해당 모델을 활용해 생후 18~48개월 영유아 510명을 분석한 결과 AUROC 0.83, 정확도 75%의 성능을 기록했다.


세브란스병원, 의료 AI 행정 자동화 성과


세브란스병원은 의료 AI 행정 자동화 영역에서 실질적인 성과를 냈다. 


응급의학교실 김지훈 교수와 의생명시스템정보학교실 유승찬 교수 연구팀은 응급실 퇴실 기록 작성 AI ‘와이낫(Y-Knot)’을 개발해 기록 작성 시간을 50% 이상 단축하고 정확도와 완전성도 수기 기록보다 향상시켰다.


또 세브란스병원 소아정신과 천근아·최항녕 교수와 연세대학교 의과대학 의생명시스템정보학교실 박유랑 교수 연구팀은 망막 안저 사진만으로 주의력결핍 과잉행동장애(ADHD)를 예측하는 AI 모델을 개발해 소아정신질환 진단 영역에서도 새로운 가능성을 제시했다.


연구팀은 망막 안저 사진 1108장과 4가지 학습 알고리즘, 망막 혈관을 형태학적으로 분석하는 오토모프 파이프라인(AutoMorph Pipeline) 기술을 이용해 ADHD를 객관적으로 선별하는 AI를 개발했다. 


그 결과, 민감도와 특이도를 종합한 AUROC 값은 최대 0.969, 정확도는 96.9%에 달해 매우 높은 예측 성능을 보였다. 또 샤플리부가설명(SHAP) 분석을 통해 혈관 밀도 증가, 동맥 혈관 폭 감소, 시신경유두 구조 변화 등이 ADHD와 관련된 주요 망막 특징으로 도출됐다.


연구팀은 AI가 ADHD 환자 망막 안저 사진을 통해 시각적 선택적 주의력 손상 정도까지 예측할 수 있는지도 분석했으며 이 항목에서도 정확도 87.3%를 기록했다.


서울아산병원, 환자 개인정보 사안 해결


서울아산병원은 의료 인공지능 확산 최대 난제로 꼽혀 온 ‘환자 개인정보 보호’ 문제를 기술적으로 해결하는 데 성공했다.

 

서울아산병원 마취통증의학과 이상욱 교수와 비뇨의학과 서준교 교수 연구팀은 데이터를 암호화한 상태 그대로 연산이 가능한 동형암호 기술을 적용해 신장 CT 영상으로 정상·낭종·종양을 분류하는 딥러닝 인공지능 모델을 개발했다. 


이는 의료영상 AI를 실제 임상에 적용할 때 가장 민감한 쟁점인 개인정보 유출 위험을 원천 차단한 사례로 평가된다.


연구팀은 먼저 비암호화 상태에서 신장 CT 영상 1만2446장(정상 5077장, 낭종 3709장, 종양 2283장)을 학습한 기준 딥러닝 모델을 구축한 뒤, 이를 암호화 환경에서도 동일하게 작동하도록 구조를 재설계했다. 


이후 실수 연산까지 가능한 ‘CKKS 스킴(Cheon–Kim–Kim–Song Scheme)’ 기반 동형암호 기술을 적용해 신장 CT 영상을 완전히 암호화한 상태에서 AI가 직접 분류 연산을 수행토록 구현했다. 


그 결과, 암호화 상태에서도 정상·낭종·종양 분류 정확도를 나타내는 AUC는 0.97~0.99로, 기존 비암호화 AI 모델과 거의 동일한 수준을 유지했다. 


암호화로 인한 데이터 용량 증가(약 500배)와 연산 지연이라는 기술적 한계는 고성능 GPU 활용으로 1~2분 내 분석이 가능하도록 보완했다. 


서울아산병원은 신생아 엑스레이 영상만으로 장천공 여부와 병변 위치를 판별하는 인공지능 판독 모델도 개발해 중환자 진단 영역에서의 AI 활용 가능성을 넓혔다. 


이번 연구는 영상의학과 윤희망 교수, 융합의학과 김남국 교수, 신생아과 이병섭 교수 연구팀이 공동으로 수행했다. 


장천공은 주로 미숙아에게 발생하는 응급 질환으로, 진단이 지연될 경우 패혈증과 사망으로 이어질 수 있어 조기 진단이 생존율을 좌우한다.


연구팀은 신생아 엑스레이 영상에서 장천공 여부와 복강 내 공기 분포를 동시에 학습하는 ‘딥 멀티태스크 학습 모델’을 설계했다. 


1995년부터 2018년까지 수집한 소아 엑스레이 약 260만 건 가운데 장천공 영상 294건과 대조군 252건을 선별해 학습시켰으며 다양한 촬영 환경과 자세를 반영하기 위해 데이터 증강 기법도 적용했다. 


그 결과 내부 검증에서 정확도 94.9%라는 매우 높은 성능을 기록했다.


임상 적용 가능성을 평가하기 위해 연구팀은 국내 11개 병원에서 확보한 외부 영상 6만4000건 중 장천공 영상 164건과 대조군 214건을 활용해 다기관 검증을 진행했으며 외부 검증에서도 정확도 84.1%를 유지했다. 


의료진이 AI를 보조 도구로 활용했을 때 진단 정확도는 82.5%에서 86.6%로 향상됐고, 판독자 간 일치도 역시 71%에서 86%로 크게 개선됐다.


서울성모병원, 진료 프로세스에 AI 내재화


서울성모병원 역시 간세포암(HCC) 환자에서 간이식과 간절제술 가운데 어떤 수술이 더 효과적인지 정량적으로 예측하는 AI 기반 의사결정 지원 모델을 개발했다. 


이번 연구는 서울성모병원 소화기내과 한지원 교수와 가톨릭의대 의학과 김현욱 학생(본과 4학년, 제1저자) 연구팀이 수행했다. 


연구팀은 한국중앙암등록본부와 서울성모병원 데이터를 기반으로 총 4529명(유도 코호트 3915명, 외부 검증 코호트 614명)의 대규모 환자군을 후향 분석했다. 


인구학적 요인, 임상 특성, 종양 변수 등 총 30개 변수를 활용해 환자가 간이식 또는 간절제술을 받았을 때의 3년 생존율을 시뮬레이션하는 방식으로 AI 모델을 구축했다. 


그 결과, 간이식에서는 지지벡터머신(SVM) 모델이 정확도 82%, 간절제술에서는 캣부스트(CatBoost) 모델이 정확도 79%를 기록했다. 


모의 분석 결과, AI 모델 권고에 따라 치료 전략을 선택할 경우 기존 임상 결정 대비 사망 위험이 54% 감소하는 것으로 나타났다. 


또 기존 간이식 환자의 74.7%를 간절제술로 재분류했고, 간절제술 환자의 19.4%에게만 간이식을 권고해 공여 장기라는 제한된 의료 자원 효율적 배분 가능성도 함께 제시했다. 


이처럼 빅5 병원들은 단순 진단 보조를 넘어 치료 전략 수립, 예후 예측, 행정 자동화까지 AI 역할을 구조적으로 재정의하고 있다. 


특히 금년 하반기부터는 단일 제품 도입을 넘어 병원 전체 진료 프로세스에 AI를 내재화하는 단계로 전환되고 있다.


삼성서울병원, 예후 예측·재택 기반 등 속도


삼성서울병원은 예후 예측과 재택 기반 관리, 심장·뇌혈관 질환 영역에서 두드러진 성과를 축적하고 있다. 


폐식도외과 김홍관 교수와 혈액종양내과 정현애 교수팀은 조기 비소세포폐암 환자 1만4177명을 대상으로 트랜스포머 기반 딥러닝 모델 ‘레이더 케어(RADAR CARE)’를 개발했다.


이 모델은 1년 내 재발 확률을 실시간으로 산출하며 전체 환자 기준 AUC 0.854, 1기 환자에서 0.872의 성능을 기록했다. 고위험군은 저위험군 대비 재발·사망 위험이 최대 9.67배 높게 나타나 위험 적응형 치료 전략의 근거를 제시했다.


신경과 서우근 교수팀은 피지컬 AI로 분석한 생체신호를 LLM과 결합해 스마트폰 대화형 인터페이스만으로 맥박·발음 이상 등 뇌졸중 전조 증상을 감지하는 기술을 개발했다. 


이 연구는 고려대안산병원, 서울아산병원, 한양대구리병원, 인천대가 참여한 3년간 다기관 연구이며 환각현상 제로화를 구현하고 국내 특허 등록을 완료했다.


삼성서울병원 순환기내과 박경민·홍다위 교수팀은 12유도 심전도 검사만으로 박출률 보존 심부전(HFpEF)을 예측하는 AI 모델을 개발해 AUC 0.81 성능을 기록했다. 


특히 AI 양성 예측 환자 5년 내 심장 사망 위험은 음성군 대비 약 10배 높아 조기 선별 도구로서 임상적 가치가 확인됐다.

???

(AI) . . AI . 5 , , AI . []?


, AI


5 AI, () AI .


16000 AI SeamXSim . 


5.6mm 3.6mm SeamXSim-T 16% . 8 , , , 4 . 


KMed.ai . 


KMed.ai LLM(), , , . 


2025 (KMLE) 96.4 . EMR , .


1 AI .


18~48 510 AUROC 0.83, 75% .


, AI


AI . 


AI (Y-Knot) 50% .


(ADHD) AI .


1108 4 , (AutoMorph Pipeline) ADHD AI . 


, AUROC 0.969, 96.9% . (SHAP) , , ADHD .


AI ADHD 87.3% .


,


.

 

CT . 


AI .


CT 12446( 5077, 3709, 2283) , . 


CKKS (CheonKimKimSong Scheme) CT AI . 


, AUC 0.97~0.99, AI . 


( 500) GPU 1~2 . 


AI . 


, , . 


, .



1995 2018 260 294 252 . 


94.9% .


11 64000 164 214 84.1% . 


AI 82.5% 86.6% , 71% 86% .


, AI


(HCC) AI . 


( 4, 1) . 


4529( 3915, 614) . 


, , 30 3 AI . 


, (SVM) 82%, (CatBoost) 79% . 


, AI 54% . 


74.7% , 19.4% . 


5 , , AI . 


AI .


,


, . 


14177 (RADAR CARE) .


1 AUC 0.854, 1 0.872 . 9.67 .


AI LLM . 


, , , 3 .


12 (HFpEF) AI AUC 0.81 . 


AI 5 10 .

1년이 경과된 기사는 회원만 보실수 있습니다.
댓글 0
답변 글쓰기
0 / 2000
메디라이프 + More
e-談