KT-ETRI-카이스트-한양대 ‘초거대 AI 모델’ 개발

KT-ETRI-카이스트-한양대 ‘초거대 AI 모델’ 개발

477
제공 : KT

[방송기술저널 백선하 기자] 인공지능(AI) 산·학·연 협의체인 KT ‘AI 원팀’이 ‘초거대 AI 모델’ 개발에 나선다. 내년 상반기까지 초거대 AI 모델을 상용화하고, AI 원팀 참여 기업과 국내외 산업계의 활용을 지원한다는 계획이다.

KT는 지난해 출범한 ‘AI 원팀’ 차원에서 한국전자통신연구원(ETRI), 한국과학기술원(KAIST), 한양대학교와 다자간 공동연구를 통해 초거대 AI 모델 개발에 나선다고 8월 18일 밝혔다.

KT는 “초거대 AI 언어모델이 빠르게 발전하고 있고 데이터 정제, 학습 알고리즘, 분산·병렬학습, 경량화, 응용모델 발굴 등 다양한 분야의 연구가 필요하기 때문에 단일 기업이 단독으로 추진하기는 어렵다”고 설명했다.

KT는 AI 원팀 차원에서 대규모 투자를 통해 GPU 인프라를 구축하고 최신 연구 동향을 반영한 기술을 제공하는 산학연 협력 방식으로 초거대 AI 개발을 추진할 계획이다. KT는 대규모 GPU 인프라 구축, 데이터 수집·분석, 모델 학습, 응용태스크 적용 등 연구개발(R&D)과 상용화 관련 업무를 총괄하고, 카이스트는 머신러닝 알고리즘 최적화와 애플리케이션 영역을 맡는다. 한양대는 데이터 정제·필터링 알고리즘 개발, 분산·병렬 알고리즘과 모델 최적화 분야에 힘을 보태고, ETRI는 대형 모델 학습·개발 분야에 참여한다.

AI 원팀 연구진은 올해 말까지 1차로 초거대 AI 학습을 완료하고 내년 상반기 초거대 AI 모델을 상용화할 계획이다. 함께 구축할 대규모 AI 연산 인프라에서 향후 2000억 개 파라미터(매개변수) 이상의 모델을 만들 수 있도록, 인프라 규모를 점차 확장할 예정이다. 또 AI 원팀 연구진은 학습데이터 필터링 강화, 데이터 간 균형 조정 등으로 AI 편향성을 제거하고, 딥러닝 기반 탐지 기술을 활용한 유해 콘텐츠(Toxic Content) 필터링 기술 등으로 잠재적인 AI 윤리 문제 소지를 사전에 차단할 예정이다.

이번에 개발될 초거대 AI 모델은 즉시 상용화할 수 있는 ‘과제 지향적’ 한국어 언어 모델로 설계된다. KT는 기존 AI 기반 제품·서비스인 ‘KT 기가지니’와 ‘KT AICC’를 고도화하는 데에 초거대 AI 모델의 음성인식(STT), 음성합성(TTS), 텍스트분석(TA), 대화 등 요소기술을 먼저 활용하고, 나아가 제조·금융·물류·유통 등 AI 원팀 참여 기업들의 다양한 사업 분야에 적용할 예정이다.

홍경표 KT 융합기술원장은 “초거대 AI 모델 개발은 차세대 AI 핵심 원천기술 확보라는 측면에서 각별한 의미를 가진다”며 “이번 프로젝트를 통해 대한민국의 국가 AI 산업 경쟁력 강화에 크게 기여하고, 산업 전반의 디지털전환과 고객 라이프스타일 변화를 선도하겠다”고 말했다.