챗GPT, 검색의 시대를 끝낼 수 있을까?

[칼럼] 챗GPT, 검색의 시대를 끝낼 수 있을까?

3909

[방송기술저널=박성환 박사, EBS 수석연구위원] OpenAI사의 GPT-4가 발표된 지 한 달여 지나고 있다. 2022년 11월 30일 챗GPT를 처음 내놓았을 때보다 반응이 뜨겁다. 챗GPT보다 학습량 매개변수가 500% 이상 늘어난 것으로 추정되면서 통제 불가능한 미래 세상을 앞당길 것이라는 우려도 나온다. 그동안의 인공지능 연구에서 보여준 언어처리 능력의 한계를 뛰어넘었기 때문일까? 긴 시간과 노력을 투입했던 학습 기반 인공지능, 기계 학습법 연구와는 차원이 다르다는 놀라움 때문일까? 2010년대의 딥러닝(심층 학습) 연구 이후 드디어 인공지능 연구의 발전적 결실을 보여준다. 학습용 빅데이터에 병렬 처리 기술을 접목하면서 가치를 발휘하기 시작했다.

이 분야 발전에서 코페르니쿠스적 전환의 기반은 구글 브레인의 바스 바니가 제안한 트랜스포머 알고리즘이라고 할 수 있다. 이는 일반 병렬 처리보다 수천 배 이상 높은, 수천억 단위로 데이터를 학습할 수 있는 능력을 보여주기 때문이다. 이때부터 자연어 처리에 새로운 차원이 열렸다. 데이터의 확률적 상관관계를 언어처리에 접목하면서 발전 속도는 날개를 단 듯 급부상 중이다.

그러면 GPT(Generative Pre-trained Transformer)란 무엇인가? 방대한 데이터를 미리 학습해서 사람처럼 문장으로 만들어 주는 생성형 인공지능(Generative AI)을 말한다. 그래서 챗GPT는 대화형 인공지능 챗봇이라고 한다. 초거대 언어모델 GPT-3.5 기반의 챗GPT가 미국의 법학전문대학원(로스쿨)과 경영전문대학원(MBA), 의사 면허 시험에 합격했다는 뉴스는 일상생활과 산업에 위협적인 존재임을 알려준다. 유료 모델인 GPT-4의 등장으로 범용 인공지능 시대를 열었다는 평가를 받는다. 챗GPT는 OpenAI가 만든 기존 GPT 알고리즘에 강화학습을 사용했다는 특징이 있다. 강화학습이란 무엇인가? 인간의 질문에 GPT가 내놓은 답을 보고 사람이 개입해서 자연스럽지 않은 부분을 판단하고, 매끄러운 문장으로 수정하는 학습법을 말한다.

GPT-4의 선제적 발표로 구글은 비상 상황이다. 가장 큰 우려는 ‘검색의 시대는 이대로 끝날 것인가?’라는 것이다. 구글의 비즈니스 모델은 멀티사이드 플랫폼(Multi-sided Platforms)으로 가치를 증대하는 능력이 있지만, 주 수익원은 검색 기반 광고이기 때문이다.

지금의 OpenAI가 사용하는 트랜스포머 기술의 원조는 구글이다. 구글은 2021년에 이미 트랜스포머 알고리즘을 사용해서 대화형 AI인 ‘람다(LaMDA)’를 개발하였다. 이들이 람다를 선제적으로 공개하지 않은 것은 광고 기반 비즈니스 모델 때문으로 보인다.

챗GPT가 공개된 이후 구글은 서둘러서 2023년 2월 6일 ‘바드(Bard)’를 공개했다. 바드는 구글의 대화형 언어모델 ‘람다(LaMDA)’를 기반으로 운용하는 새로운 생성형 인공지능 서비스를 말한다. 그렇다면 일반적인 우려처럼 구글이 구축한 검색의 시대는 이제 끝날까? 아직은 그런 걱정을 할 시기는 아니라고 본다. 구글의 바드(Bard)는 여전히 인공지능 검색엔진 서비스에 강하다. 그리고 구글은 웹 기반의 방대한 데이터를 보유하고 있고, 원하는 답을 찾는 가장 빠른 길을 안내하는 능력이 있다. ‘바드(Bard)’ 또한 이러한 장점 위에서 구동되기 때문에, 어떤 변화에도 대응할 준비가 되어 있다.

경쟁자 마이크로소프트의 행보도 참고해 보자. 마이크로소프트는 검색엔진보다는 새로운 AI 기술을 자체 클라우드 서비스 플랫폼인 애저(Azure)에 접목하는 비즈니스 모델을 구상 중인 것으로 알려져 있다. 마이크로소프트는 챗GPT와 OpenAI에 다년간 100억 달러를 투자하겠다고 밝히고, 챗GPT 기술을 가정 먼저 빙(Bing) 검색엔진에 접목하기는 했지만, 주력 비즈니스 목표는 검색이 아니라 잘하는 분야에 집중한다.

OpenAI사의 챗GPT가 쏘아 올린 인공지능 서비스 경쟁은 빅테크 기업 전반으로 퍼져나갈 것이다. 클라우드 서비스의 1등 주자인 아마존은 생성형 AI 서비스도 클라우드 컴퓨팅 플랫폼인 AWS(Amazon Web Service) 고도화에 응용할 것으로 보인다. 메타, 세일즈 포스와 트위터 등도 생성형 AI에 더 많은 투자를 발표하면서 신기술 2라운드 전쟁을 시작했다.

챗GPT는 인간 프롬프트(텍스트로 된 명령어)에 인간처럼 텍스트로 대답하는 능력은 지금까지 최고이다. 그래서 챗GPT는 책 쓰기, 기사 쓰기, 논문, 이메일 작성, 소설 창작, 그림 그리기 등 못하는 일이 없는 듯 보인다. 파이썬 프로그래밍에도 탁월한 능력이 있다. 하지만 아직 못하는 것도 많다. 챗GPT의 주특기인 자연어 처리용 대형 언어모델(LLM, Large Language Model) 이외의 분야에는 취약하다. 못하는 대표적인 일은 수학적 계산을 들 수 있다. 그리고 처방 약에 대한 조언을 받을 수도 없다. 또한 구글에서 2022년 연간 검색어 1등에 등극했던 ‘워들(Wordle) 게임’도 잘하지 못하는 것으로 알려져 있다. 워들은 5개의 알파벳으로 구성된 영어 단어를 맞추는 퍼즐 게임이다. 이 게임에 해당하는 영어 단어 2,315개도 학습하지 않았고, 게임 규칙도 습득하지 않아서 모른다는 것이다.

아직은 약점이 많은 챗GPT-4이지만, 지적 창작물을 대량 생산 가능하다는 점은 인간에게 위협이 아닐 수 없다. GPT-4의 발전으로 인간의 가치, 지식 습득이 무너지는 세상이 올 수도 있다는 두려움이 있다는 것도 사실이다. 검색의 시대도 다른 형태로 발전할 가능성이 크다. 하지만 사용자인 인간을 중심축으로 발전한다는 방향성을 잃어서는 안 될 일이다.