본문 바로가기
생활 Life

핫이슈 챗GPT 도대체 어떤 기능을 가지고 있고 정말 구글 알파고를 뛰어넘었나?

by KS지식 - 문화 YouTube 2023. 2. 8.
반응형
SMALL

마이크로소프트(MS)가 자사의 검색 엔진 빙(Bing)과 브라우저인 엣지에 인공지능 챗봇인 챗GPT를 장착했다. 1200억달러 규모로 추정되는 글로벌 검색 시장에서 구글과 한판 대결을 벌이겠다는 각오다.

7일(현지 시각) 마이크로소프트의 사티아 나델라 최고경영자(CEO)는 미국 워싱턴주 레드먼드에 있는 MS 본사에서 행사를 열고 인공지능 기반의 새로운 검색 엔진 ‘빙’을 발표했다. 나델라 CEO는 “검색의 새로운 시대를 열겠다”면서 “검색의 패러다임이 수십 년 동안 바뀌지 않았다. 하지만 인공지능이 기존 방법보다 더 유연하고 빠르게 정보를 전달할 수 있을 것”이라고 강조했다. 이어 그는 “오늘 경기가 새롭게 시작될 것이고, 우리는 빠르게 움직일 것”이라면서 “가장 중요한 것은 지금이 적기이기 때문에 검색을 다시 혁신하는 데 많은 즐거움을 주고 싶다”고 포부를 밝혔다.

이날 마이크로소프트는 크게 검색 엔진 빙(Bing)과 브라우저인 엣지에 챗GPT를 장착한 모습을 시연했다. 우선 새로워진 빙(Bing)에 검색하면 종전 검색에다 인공 지능이 주석을 단 결과를 함께 보여준다. 다른 방법은 빙 챗봇과 직접 대화를 나눌 수 있도록 했다. 또 브라우저인 엣지의 사이드바에 챗봇 창을 설치할 수 있도록 했다.

사용하려면 대기 리스트에 이름 올려야

이날 마이크로소프트는 요리법, 여행 팁, 이케아 가구 쇼핑 등 다양한 검색 예시를 들었다. “멕시코 시티로 5일간 여행을 떠나려고 하는데, 세부 일정을 작성해 달라”고 요청하자, 챗봇이 즉석에서 상세 일정을 제공했다. 가장 시선을 끈 점은 실시간 데이터에 대한 분석이다. 챗GPT와 달리 빙 챗봇은 한 시간 전에 나타난 뉴스까지 분석을 할 수 있는 것으로 나타났다.

챗봇과 실시간 채팅을 할 수 있는 이유는 1750억개 매개변수로 학습한 오픈AI의 초거대인공지능인 GPT-3.5를 업데이트했기 때문이다. 마이크로소프트는 이날 이에 대해 프로메테우스 모델을 도입했고 이를 통해 GTP-3.5보다 더 강력한 정보와 응답할 수 있었다고 덧붙였다.

빙의 인공지능 채팅 기능

다만 새로운 빙 챗봇을 사용하려면 대기 리스트에 이름을 올려야 한다. 전면 공개는 아닌 셈이다. 사용하기 위해서는 빙에 로그인해 신청해야 하고 크롬 확장프로그램에 빙을 설치해야 한다. 마이크로소프트가 원하는 것은 바로 챗봇을 무료로 제공하는 대신 구글이 장악한 검색 시장을 차지하겠다는 야심이다. 스태티스타에 따르면 2023년 현재 글로벌 검색 시장은 구글이 89%를 장악한 가운데 마이크로소프트의 빙이 약 9% 남짓 점유하고 있다. 이에 구글은 반격에 나선 상태다. 1350억개 매개변수로 학습한 람다를 기반으로 인공지능 챗봇인 ‘바드’를 런칭하고 조만간 일반에 공개한다고 밝혔다. 또 금일 파리에서 중대 발표를 할 예정이다.

혐오 콘텐츠 생성 차단이 관건...2016년 테이 봇 없어진 이유

반면 마이크로소프트는 새로운 검색 엔진을 통해 구글이 장악한 시장에 깊이 파고들겠다는 야심인 셈이다. 남은 과제는 윤리적 논란이다. 이에 대해 마이크로소프트는 “인공지능 챗봇을 속여 위험하거나 혐오스러운 콘텐츠 생성을 방지하는 이른바 제일브레이킹을 차단하기 위해 노력하고 있다”고 강조했다. 그동안 마이크로소프트는 인공지능 챗봇을 도입하기 위해 열성적이었다. 2016년 마이크로소프트는 챗봇 테이(Tay)를 공개했는데 페미니스트를 ‘암적인 존재’로 표기하거나 남녀평등은 페미니즘이라고 주장해 논란을 일으킨 바 있다.

 

지난 4일(현지시간) 블룸버그 등에 따르면 구글이 '클로드'라는 AI챗봇을 개발 중인 앤스로픽에 4억 달러(한화 5천억원)를 투자했다고 전했다. 앤스로픽은 오픈AI 창립자 일부가 나와 설립한 스타트업으로, 지난달 챗GTP에 맞설 클로드의 테스트 버전을 공개했다.

블룸버그는 MS가 최근 오픈AI에 100억 달러를 투자하자 구글도 앤스로픽과 맞손을 잡은 것이라고 분석했다. 또 생성 AI가 미래 검색 시장 등을 장악할 핵심 기술로 부상하자 빅테크와 AI 스타트업 간 제휴는 물론, 투자가 활발히 이뤄지고 있다고 전했다.

 

구글과 앤스로픽은 4억 달러 투자 보도에 대해 공식적으로 밝히진 않았으나, 앤스로픽이 구글의 클라우드 컴퓨팅 서비스를 사용하는 내용으로 별도 파트너십 계약을 체결했다고 발표했다.

앞서 MS는 지난 2019년 오픈AI에 10억달러를 투자한 데 이어 최근 최대 100억달러(약 12조4천800억원) 추가 투자를 고려 중인 것으로 알려졌다. 또 자사 검색 엔진 빙에 챗GPT를 탑재해 오는 3월 출시할 계획을 밝혔다. MS의 협업툴 팀즈, 오피스, 보안 소프트웨어에도 챗GPT 적용을 고려하고 있다. 최근에는 오픈AI의 대형언어모델(LLM) GPT-3.5를 포함해 최신 기술을 적용한 팀즈 프리미엄을 출시하는 등 AI적용을 가시화했다.

최근 네이버도 올해 상반기 챗GPT에 대항해 '서치GPT'를 출시할 예정이라고 밝혔다. 국내 최대 규모 한글 데이터를 기반으로 개발한 초거대 언어 모델(하이퍼클로바)을 활용, 복잡한 질문에도 적합한 정보를 제공하는 검색 서비스를 제공하겠다는 포부다. 네이버는 지난해 9월부터 '오로라 프로젝트'를 통해 AI를 활용한 검색 경험 개선 작업을 해왔다.

네이버의 서치GPT는 영어 기반의 챗GPT와 달리 한국어에 특화된 서비스라는 차별점이 있다. 최수연 네이버 대표는 지난 3일 컨콜을 통해 "AI의 단점으로 꼽히는 신뢰성과 최신성 부족, 영어 기반 번역 모델을 한국어로 번역함으로써 발생하는 정확성 저하를 네이버의 데이터와 기술 노하우 접목해 해결할 수 있을 것으로 자신한다"고 전하기도 했다.

 

 

 

◆"누가 더 잘할까?" 챗GPT에 물으니…일반적 답변 내놓아

챗GPT에 MS, 구글, 네이버 중 어느 기업이 제일 잘할 것이라 예상하는지 물어보았다. 이에 챗GPT는 "모든 기업들이 AI 기술을 발전시키고 있어서 누가 제일 잘하는지 확실히 말하기 어렵다"면서 "구글, 네이버, MS 모두 각자의 기술력과 전략을 가지고 AI 기술을 발전시키고 있으며, 고객의 요구에 따라 서로 다른 장점이 있다. 어떤 기업이 제일 잘하는지는 고객의 요구에 따라 달라질 수 있다"고 답했다.

또 각 사의 AI전략과 강점에 대해 물으니 "MS는 애저를 포함 광범위한 AI제품과 서비스를 보유하고 있고, 윤리적 인공지능에 상당한 투자를 하고 있다. 구글은 AI자회사 딥마인으가 AI연구 개발 분야 선두주자이고, 구글 어시스턴트, 포토를 포함한 다양한 제품에 AI 전문성이 반영되고 있다"면서 "네이버는 자연어 처리와 머신러닝 기술 개발에 집중하고 있으며 한국 시장에서 사용자 기반이 넓어 AI 연구개발에 필요한 데이터 수집에도 활용할 수 있다"고 답변했다.

이처럼 챗GPT의 답변은 논리적으로 보이나 질문자의 의도에 맞지 않는 일반적인 답변을 내놓았다. 또 챗GPT는 2022년 이후 일어난 사건에 대해선 부정확하게 답변하거나 의도치 않은 편향성을 내포하고 있는 등 아직은 완성도가 미흡하다. 하지만 이러한 오류는 반복적인 상호작용을 통해 개선될 것이라는 게 전문가의 의견이다.

한국지능정보진흥원(NIA) AI·미래전략센터가 최근 발간한 보고서 '챗GPT는 혁신의 도구가 될 수 있을까'에서 "챗GPT는 아직 완성도가 미흡한 부분이 있고, 인간 피드백을 통한 강화학습을 적용한 결과 오히려 인간의 결함과 실수를 쉽게 모방할 우려도 있다"면서 "특히 챗GPT의 답변은 때로는 꽤 논리적으로 보이지만 잘못된 정보이거나 무의미한 내용을 마치 존재하지 않는 환각을 보는 것처럼 그럴듯하게 답변하기도 한다"고 전했다.

보고서는 "하지만 결국에는 챗GPT가 언어모델로서 추가적인 학습과 전문적인 검증 과정을 통해 정확도를 높일 수 있고, 향후 GPT-4가 출시될 예정으로 초거대 AI 기술 진전은 가속화될 것"이라고 전망했다.

또한 앞으로 다가올 챗봇 네이티브에선 현재와 같은 검색엔진은 사라질 수 있고, AI기술 활용도가 중요한 경쟁력이 될 것이라고 내다봤다.

 

8일 오전 11시 5분 현재 드림어스컴퍼니는 전 거래일 대비 12.76% 오른 4285원에 거래되고 있다.

SKT는 이날 "2023년을 AI 컴퍼니 도약과 전환의 원년으로 삼겠다"라고 밝혔다.

이 회사는 에이닷을 통해 기업과 개인 간 거래(B2C) 분야에서 세계 최초로 한국어 GPT-3 상용화 서비스를 시작했다.

향후 챗GPT 접목 등 국내외 기업들과의 기술 제휴를 통해 에이닷을 고도화하고 올해 중 정식 서비스로 론칭할 예정이다.

 

광풍(狂風)입니다. 지난 수십 년간 이렇게 순식간에 사람들의 관심을 모았던 기술이나 서비스가 있었는지 모르겠습니다. 짐작하셨겠지만 오픈AI의 인공지능(AI) 채팅로봇 ‘챗GPT’ 얘기입니다. 지난 연말에 공개된 챗GPT를 사용해본 사람은 이미 전세계 1억명을 넘어섰습니다. 수많은 사람들이 챗GPT를 저마다의 방식으로 시험하고 있습니다. 의학 학술지에 실린 논문을 주고 요약하게 했더니 과학자들도 사람이 쓴 것과 구분하지 못했고 표절 검사는 100% 통과했습니다. 미국 대학 로스쿨 입학 시험, 경영대학원 기말시험, 의사 면허 시험도 합격했죠. 시·소설·논문도 척척 써냅니다.

오픈AI는 지금까지 구글이나 마이크로소프트 같은 빅테크에 비해 주목받지 못했습니다. 하지만 챗GPT 하나로 순식간에 스타가 됐습니다. 여기에는 경영진의 과감한 판단도 있었습니다. 뉴욕타임스에 따르면 당초 오픈AI는 챗GPT를 지난해말 공개할 계획이 없었습니다. 대신 훨씬 더 성능이 좋은 데이터베이스를 기반으로 한 챗GPT를 올해 상반기에 내놓을 생각이었죠. 하지만 오픈AI 경영진은 본인들이 준비하는 사이 다른 빅테크가 비슷한 성능을 가진 챗봇을 내놓을 것을 우려했습니다. 이 결정부터 실제 챗GPT 출시까지는 결정부터 고작 13일이 걸렸다고 합니다. 이 때문에 챗GPT가 갖게 된 한계에 대해서는 아래에 자세히 설명하겠습니다.

 

 

지금까지 챗GPT를 다룬 언론 보도는 대부분 ‘챗GPT가 이런 일을 해냈다’에 초점이 맞춰져 있습니다. 그런데 제가 최근 가장 많이 들은 질문은 “도대체 챗GPT는 어떤 원리로 작동하는가’ ‘챗GPT는 어떻게 사람인척 하는 것인가’ ‘챗GPT는 진짜로 문맥을 읽는 것인가’ 등이었습니다. 원리를 궁금해하는 사람이 많은 거죠. 이전에도 비슷한 일이 있었습니다. 7년 전 구글 딥마인드가 국제학술지 네이처에 “인간 프로기사를 뛰어넘는 바둑 실력을 가진 AI를 개발했다’고 발표했을 때가 대표적입니다. 바로 챗GPT 이전에 가장 유명했던 AI, 알파고(AlphaGo)입니다. 당시 언론과 전문가들은 알파고의 작동 원리에 대해 설명하느라 어려움을 겪었습니다.

 

 

새롭게 등장한(물론 전문가가 아닌 일반인의 입장에서) 기술에 대해 대중이 이해할 수 있도록 설명하는 것은 쉬운 일이 아닙니다. 게다가 기술의 작동 원리를 몰라도 활용하는 입장에서는 전혀 아쉬울 것이 없습니다. 스마트폰이나 블루투스 이어폰 속에 무슨 기술이 탑재됐는지 일일이 알 필요가 없는 것처럼 말입니다.

그래도 궁금하신 분들을 위해 디코드 2.0은 챗GPT의 원리를 파헤쳐보기로 했습니다. 다행스럽게도 오픈AI는 챗GPT의 작동 원리와 개발 과정을 논문과 홈페이지 등에 설명하고 있습니다. 어셈블리AI 같은 전문 교육 업체들도 기술 분석을 연재하고 있습니다. 다만 전문가들의 언어로 말이죠. 그래서 AI전문가인 유용균 원자력안전기반연구소 인공지능응용연구실장과 정우성 포스텍 산업경영공학과 교수의 자문을 얻어 챗GPT의 원리를 재구성해 봤습니다. AI 분야 종사자나 컴퓨터공학에 대한 이해가 있는 분들이라면 정확하지 않은 용어 사용이나 틀린 표현이 보일 수 있습니다. 이번 디코드는 어디까지나 ‘대중’을 위해 쓰여졌다는 점을 감안해주시면 감사하겠습니다. 격주 월요일에 발송되던 디코드 2.0은 이번 주부터 매주 월요일 독자 여러분을 찾아갑니다.

 

 

◇알파고와 챗GPT의 기본 원리는 같다

이세돌 9단이 구글이 만든 인공지능 바둑 프로그램 '알파고'와의 맞대결을 하루 앞두고 서울 종로구 포시즌스호텔에서 열린 사전 브리핑에 참석해 구글 딥마인드의 CEO 데미스 하사비스와 악수하고 있다.

챗GPT는 하늘에서 뚝 떨어진 존재가 아닙니다. 챗GPT를 학습시킨 핵심 기법들은 수십 년에 걸쳐 발전해온 전통적인 AI 학습 모델과 알고리즘입니다. 다양한 스타일과 목적으로 문장을 생성하는 챗봇은 셀 수 없이 많습니다. 하지만 챗GPT가 관심을 모은 것은 이전의 모델들보다 훨씬 더 정밀하고 상세하며 일관성이 있기 때문입니다. 특히 ‘사람과 하는 것 같은 대화’에서 강력한 힘을 발휘합니다.

 

 

챗GTP 같은 경우에는 인터넷에서 얻은 문장과 각종 질문·답변을 익히는 과정이 지도 학습, 이전에 없던 새로운 문장을 만들어보는 과정을 강화 학습이라고 할 수 있습니다. 그런데 오픈AI는 챗GPT에 새로운 강화 학습 기법을 추가했습니다. 이른바 RLHF(Reinforcement Learning from Human Feedback)라고 불리는 이 기술은 AI 학습 과정에 사람의 피드백을 사용해 유해하거나 거짓되고 편향된 답변을 최소화하는 역할을 합니다. RLHF의 작동 방법은 나중에 다시 설명하겠습니다.

 

 

◇사람이 직접 교육시킨 챗GPT

챗GPT는 GPT-3라는 거대한 언어 데이터베이스를 기반으로 만들어졌습니다. 챗GPT 이전에도 대규모 언어 모델을 이용한 챗봇이나 AI는 많았습니다. 기본적으로 인터넷의 방대한 텍스트 데이터를 활용해 가르치면 사람을 흉내 낸 문장을 만드는 것은 별로 어려운 일이 아닙니다. 문제는 AI의 답변이 사람의 기대에 미치지 못하거나, 원하는 의도를 파악하지 못할 가능성이 높다는 거죠. 챗GPT 이전의 AI가 가지고 있는 문제점은 △유용성 부족 : 질문자의 의도와 관련 없는 답변 △환각 : 존재하지 않거나 잘못된 사실을 만들어냄 △해석 가능성 부족 : AI가 결정이나 예측에 도달한 방법을 이해할 수 없음 △편향·독성 : 학습 데이터의 영향을 받아 편향된 답변을 만들어냄 등이었습니다. 왜 이런 현상이 생길까요.

언어 모델 학습에는 다음에 등장할 단어를 예측하는 ‘Next-token-prediction’ 같은 기술이 사용됩니다. 예를 들어 이 모델에 ‘고양이가 00에 앉았다’라는 문장을 입력할 경우 AI는 갖고 있는 자료에서 다음에 나타날 가능성이 높은 단어를 찾습니다. 이 경우 ‘매트’, ‘의자’, ‘바닥’ 같은 단어가 되겠죠. 괄호를 비워놓고 괄호 안에 들어갈 단어를 예측하도록 하는 ‘masked-language-modeling’ 같은 학습법도 있습니다. ‘00이 어디에 앉아서’라는 문장을 주고 AI가 개, 고양이, 토끼 등을 채워 넣도록 하는 것이죠. 이런 방법을 사용하는 것은 언어 모델이 일반적인 단어의 순서나 단어 사용 패턴을 통계적으로 익히는데 도움이 되기 때문입니다. 이런 사전 학습 단계를 반복하다 보면 언어 모델이 보다 자연스럽고 유창한 문장을 생성할 수 있기 때문에 모든 언어 모델이 이 방식을 사용합니다.

◇답변 점수화해 시스템 구축

오픈AI 연구팀은 지난해 3월 인터넷 논문게재 사이트 ‘아카이브(arXiv)’에 AI 교육에 사람이 개입하는 방법을 담은 논문을 게재했습니다. 챗GPT는 실제 이 방법으로 개발된 최초의 AI로 알려져 있습니다. 앞서 2017년부터 ‘사람의 개입’ 필요성을 강조했던 논문들이 여러 차례 나왔는데 대부분 오픈AI에서 나왔습니다.

 

RLHF(Reinforcement Learning from Human Feedback)는 크게 세 단계에 걸쳐 챗GPT를 교육시켰습니다. 우선 첫 단계는 ‘SFT(Supervised fine-tuning step)’입니다. 오픈AI는 인터넷에서 모은 데이터 전체를 신뢰하지 않았습니다. 이 때문에 먼저 인터넷을 기반으로 한 GPT-3라는 거대한 언어 데이터베이스에서 소수의 고품질 언어 데이터만 모아 챗GPT를 교육했습니다. 쉽게 말해 질문과 모범 답안 일부를 주입한 것이죠.

신뢰할 수 있는 질문과 답변을 배웠지만, 데이터의 양을 제한했기 때문에 1단계를 거친 언어 모델은 여전히 사용자의 의도에 부합하지 않는 답변을 내놓을 가능성이 높습니다. (오픈AI는 1단계의 데이터를 최대한 늘리기 위해 노력하고 있지만 비용상의 문제가 있다고 밝히고 있습니다.)

급속히 발전하는 인공지능의 성능

2단계는 보상 모델(reward model)입니다. 이 단계의 목표는 1단계를 거친 언어 모델의 답변이 질문자의 의도에 더 부합하도록 가르치는 겁니다. 놀랍게도 실제로 이걸 가르치는 것은 실제 사람입니다.

우선 1단계 언어 모델에 질문을 한 뒤 4~9개의 답변을 얻어냅니다. 라벨러로 불리는 인간 교육자는 이 답변들이 질문자의 의도를 얼마나 파악했는지 평가해 순서대로 순위를 매깁니다. 이를 별도의 데이터베이스화하는데 이 데이터 세트의 크기는 1단계의 데이터 세트보다 10배 가량 더 큽니다.

이 데이터 세트를 이용해 지속적으로 교육을 반복하면 AI는 사람이 어떤 질문을 할 때 어떤 답변을 하는 것을 좋아한다는 것을 통계적, 수학적으로 파악하게 되는 자동 시스템을 갖추게 됩니다. 실제로 질문자의 의도를 이해하는 것은 아니지만, 결과적으로는 마치 이해하는 것처럼 보이게 되는 것이죠.

◇성능 평가까지 사람이 적극 개입

마지막 3단계는 PPO(Proximal Policy Optimization)라는 알고리즘을 적용합니다. 3단계는 과거 학습을 경험하는 것이 아니라 실제 언어 모델을 작동하면서 생기는 문제점을 미세하게 조정하는 과정입니다. 선별된 데이터 세트로 1~2 단계를 진행한 결과 갖게 된 한계를 극복하고 보다 정확성을 높이는 과정입니다. 다만 언어 모델의 안정성을 보장하기 위해 변화의 폭은 이전 버전과 일정 수준 이상 벌어지지 않도록 제한합니다.

물론 이렇게 말처럼 간단하지는 않습니다. 3단계에는 가치 함수라는 개념이 포함돼 있는데 가치 함수는 보통 기대 수익률과 현재 수익률의 차이를 나타내는 함수를 계산하는 데 사용됩니다. 언어 모델의 경우에는 질문에 정확하게 답변할 가능성과 실제 정확하게 답변한 사례를 분석하는데 사용됩니다. 이를 활용하면 문제점을 수정했을 경우 이전보다 얼마나 개선됐는지도 파악할 수 있습니다.

챗GPT는 성능 평가의 핵심 부분도 사람에 의존합니다. 교육을 사람이 한 만큼 평가도 사람이 하는 겁니다. 평가는 세 가지 기준으로 이뤄집니다. 우선 ‘유용성’입니다. 사용자의 질문을 얼마나 잘 파악했는지, 적합한 답변을 내놓았는지 보는 겁니다. 다음은 ‘진실성’인데 데이터를 조합해 가짜 답변을 만들어냈는지를 들여다 봅니다. 마지막으로 ‘무해성’은 인종·성차별 같은 편향성을 가진 답변을 내놓지 않았는지 살핍니다. 오픈AI는 세 단계의 RLHF 교육과 평가에서 나타난 문제점을 다시 조정해 1~3단계를 반복하는 방법으로 챗GPT의 성능을 개선하고 있습니다.

◇챗GPT의 한계는 사람의 편향성

챗GPT가 현재 상용화된 AI 챗봇 가운데 가장 강력한 성능을 가진 것은 부인할 수 없는 사실입니다. 하지만 근본적으로 챗GPT가 갖고 있는 명확한 한계가 있습니다. 우선 학습되지 않은 주제나 답변에 대해서는 엉뚱한 답을 내놓는 수준이 아니라, 아예 거짓 정보를 내놓고 있습니다. 챗GPT가 활용한 GPT 3.5의 경우 2021년까지의 데이터를 활용했는데 그 결과 ‘지금 한국의 대통령’을 물어보면 ‘문재인 대통령’이라고 답합니다. 이는 서두에서 언급한 것처럼 오픈AI가 챗GPT를 서둘러 출시하면서 벌어진 일입니다.

 

 

 

오픈AI의 RLHF는 모든 사람이 동일한 가치를 공유한다는 이상적인 가정에서 출발합니다. 성별이나 연령, 인종에 따른 차이가 충분히 반영되지 않을 수 있습니다. 구글 딥마인드는 지난해 9월 아카이브에 RLHF의 문제점을 개선하고 좀 더 정확하고 편향되지 않은 답변을 내놓을 수 있는 시스템 ‘스패로(Sparrow)’를 발표한 바 있습니다. 구글이 챗GPT에 대항해 내놓을 서비스에 이 모델이 적용될 가능성이 높습니다.

마이크로소프트(MS)는 자사 퍼블릭 클라우드 애저에서 GPT-3.5, 코덱스(Codex), 달리2(DALL-E 2) 등 최신 인공지능(AI) 모델을 사용할 수 있는 '애저 오픈AI 서비스'를 공식 출시했다. /MS

사실 구글과 페이스북, 마이크로소프트 같은 기업들은 내부적으로 챗GPT 수준의 챗봇을 보유하고 있는 것으로 알려져 있습니다. 다만 과거 한국 스타트업이 내놓았던 챗봇 이루다처럼 사회적인 논란이 불거질 것을 우려해 공개 시점을 저울질하고 있었다는 분석도 있습니다. 그 장벽을 챗GPT는 단숨에 허물어 버렸습니다. 챗GPT가 촉발한 진짜 AI 주도권 경쟁은 이제부터 시작될 것 같습니다.

◇AI 편향성 해결 위한 프로젝트도 진행

AI의 편향성 문제 해결은 AI 연구자들의 공통된 숙제입니다. 이번 글의 맥락과는 차이가 좀 있지만, 이 분야에서 세계적으로 두각을 나타내고 있는 학자가 있습니다. 지난해 ‘천재들의 상’으로 불리는 맥아더상을 수상한 미국 워싱턴대 최예진 교수입니다. 최 교수는 마이크로소프트 공동 창업자 폴 앨런이 설립한 ‘앨런 인공지능 연구소’에서 ‘델파이’라는 AI를 개발했습니다. 챗GPT 처럼 사용자의 질문에 답하는 델파이의 개발 목적은 ‘AI에 윤리를 가르칠 수 있는가’입니다.

앨런 AI 연구소의 ‘델파이에 물어보세요’ 홈페이지. ‘더 큰 선(善)을 위해 인종차별을 정당화할 수 있는가?’라고 묻자 ‘잘못된 일’이라고 답한다. /앨런 AI연구소

2021년 공개 3주 만에 전세계 300만명이 몰려들 정도로 화제를 모았습니다. 델파이의 정확도는 92% 수준입니다. AI에게 윤리를 판단하도록 한 뒤 일반 대중의 답변과 비교했을 때 92% 정도 일치하는 답을 낸다는 겁니다. 최 교수는 과거 본지 인터뷰에서 “나라마다 문화마다 생각하는 방식이 다르고 윤리도 다르다”면서 “미국 중심으로 개발되고 있는 AI가 더 유용해지기 위해서는 다양성을 확보하는데 힘써야 한다”고 말했습니다. 그런데 미국 기업들이 AI에 한국의 문화와 윤리를 가르치기를 마냥 기다리고 있어야 할까요.

LG, 네이버, 카카오 같은 우리 기업들도 이미 챗GPT 같은 초거대AI 분야에 공격적으로 투자하고 있습니다. 엑사원, 클로바 같은 서비스도 이미 알려져 있죠. 최예진 교수는 “AI는 다른 테크 분야와 달리 이름도 들어본 적이 없는 대학이나 기업이 어느 순간 엄청난 성과를 발표하는 경우가 얼마든지 있다”고 했습니다. 빅테크의 기득권을 뛰어넘을 수 있는 분야가 바로 AI라는 것이죠. 리소스(자원) 결핍과 열악한 환경이 오히려 창의적인 아이디어를 탄생시킨다고도 했습니다. 한국 기업과 대학이 그런 성과를 내는 날이 올까요.

 

 

뉴욕타임즈와 블룸버그통신 등을 종합하면 메타 최고경영자(CEO)인 마크 저커버그는 작년 11월 AI 챗봇 '갈락티카(Galactica)를 출시했다. 이는 오픈AI가 세상에 '챗GPT'를 공개하기 2주 전이다. 당시 메타는 '갈락티카'에 대해 과학적 연구조사를 위해 만들었다고 설명했다. 논문을 쓰고, 수학 문제를 풀고, 컴퓨터 코드를 직접 생성하는가 하면 그림 같은 시각물(image)에 대해 설명을 붙일 수도 있었다.

하지만 문제가 발생했다. 지금 '챗GTP'에서도 보여지듯 갈락티카도 역사적 날짜를 잘못 말하거나 허황된 이야기를 글에 담는 등 사실과 먼 내용이 뒤섞였다. 어떤 이용자는 이 프로그램을 활용해 '우주 속 곰의 역사' 같은 비과학적 글을 써냈다. 갈락티카에 '지금 실리콘밸리는 누가 운영하나요'라고 질문하면 고인이 된 '스티브잡스'라고 대답하는 식이었다. 인종차별적인 정보도 나왔다.

업계는 갈락티카를 사용할 경우 부정확하고 편향된 사실, 잘못된 사례가 퍼질 수 있다는 우려를 전했다. 갈락티카로 만들어진 잘못된 정보나 혐오 발언이 페이스북이나 인스타그램, 왓츠앱과 같은 관련 소셜네트워킹서비스(SNS)로 퍼지며 확대재생산 되는 상황을 마주하면서 3일 만에 이를 중단했다. 이렇게 메타는 갈락티카를 지웠다.

메타의 수석 AI과학자인 얀 르쿤 박사는 지난달 실리콘밸리의 한 온라인 포럼에 참석해 "당시의 뜨거운 논란을 감당할 수가 없었다. 그래서 (갈락티카) 데모 서비스를 중단했다"면서 "거짓말을 퍼뜨리는 역할을 하는 대기업이라는 평판 우려로 좌절에 부딪힌 것"이라고 설명했다.

메타의 이러한 행보는 최근 '챗GTP'가 일부 오류가 있는 대답을 내놓고 있음에도 불구하고 세계적으로 열광적인 반응을 얻고 있는 상황과는 대조적이다. 챗GPT의 인기가 지속될 것으로 보이면서 빅테크 기업들도 재빠르게 챗봇 서비스 일정을 앞당겨 공개하는 추세다.

구글은 6일 AI 챗봇 '바드'(Bard) 출시를 공식화했고, 마이크로소프트도 7일 자사 검색엔진 '빙'에 AI를 장착한다고 밝혔다. 중국 최대 검색업체 바이두도 AI형 챗봅 '어니봇(Ernie Bot)' 테스트를 마쳤고 곧 정식으로 선보이겠다고 했다. 한국의 네이버 역시 상반기 중 '서치GPT'를 출시할 예정이다.

 

 

세계 최대 검색엔진 업체 구글이 대화형 인공지능(AI) 챗봇 '챗GPT'에 대항할 제품을 개발하고 있는 AI 스타트업 앤스로픽(Anthropic)에 5000억원을 투자했다.
4일(현지시간) 블룸버그통신은 소식통을 인용해 구글이 '클로드'라는 새 인공지능 챗봇을 개발 중인 앤스로픽과 제휴 관계를 맺고 4억달러(5000억원)에 가까운 돈을 투자했다고 전했다.
앤스로픽은 작년 11월 말 챗GPT를 공개해 전 세계에 화제를 불러일으킨 오픈AI에서 갈라져 나온 업체다.

 

오픈AI 창립자 그룹의 일원이었던 대니엘라 애머데이, 다리오 애머데이 남매가 2021년 이 스타트업을 설립했다.
앤스로픽은 챗GTP에 맞설 클로드의 제한된 테스트 버전을 지난달 공개했다.
블룸버그는 세계 최대 소프트웨어 업체 마이크로소프트(MS)가 제휴 관계인 오픈AI에 최근 100억 달러를 투자하자 구글도 앤스로픽과 맞손을 잡은 것이라고 분석했다.

구글과 앤스로픽은 4억 달러 투자 보도를 공식적으로 확인하진 않았지만, 앤스로픽이 구글의 클라우드 컴퓨팅 서비스를 사용하는 내용으로 별도의 파트너십 계약을 체결했다고 밝혔다.
토머스 쿠리언 구글 클라우드 최고경영자(CEO)는 성명에서 "구글 클라우드는 차세대 AI 스타트업을 위한 개방형 인프라를 제공하고 있다"며 "AI는 모든 산업에서 성장과 향상된 서비스를 위한 새로운 기회를 창출하고 있다"고 말했다.

 

세계 최대의 검색엔진 업체 구글이 대화형 인공지능(AI) 챗봇 '챗GPT'에 맞설 제품을 개발 중인 AI 스타트업 앤스로픽에 5천억 원을 투자했다고 4일(현지시간) 블룸버그 통신이 보도했다.

블룸버그는 소식통을 인용해 구글이 '클로드'라는 새로운 인공지능 챗봇을 개발 중인 앤스로픽과 제휴 관계를 맺고 4억 달러(5천억 원)에 가까운 돈을 투자했다고 전했다.

앤스로픽은 작년 11월 말 챗GPT를 공개해 전 세계에 화제를 불러일으킨 오픈AI에서 갈라져 나온 업체다.

 

오픈AI 창립자 그룹의 일원이었던 대니엘라 애머데이, 다리오 애머데이 남매가 2021년 이 스타트업을 설립했다. 앤스로픽은 챗GTP에 맞설 클로드의 제한된 테스트 버전을 지난달 공개했다.

블룸버그는 세계 최대 소프트웨어 업체 마이크로소프트(MS)가 제휴 관계인 오픈AI에 최근 100억 달러를 투자하자 구글도 앤스로픽과 맞손을 잡은 것이라고 분석했다.

이어 몇 초 만에 텍스트와 이미지를 만들어내는 생성형 AI가 미래의 검색 시장 등을 장악할 핵심 기술로 부상하자 빅테크와 AI 스타트업 간 제휴가 활발히 이뤄지고 있다고 설명했다.

구글과 앤스로픽은 4억 달러 투자 보도를 공식적으로 확인하진 않았으나 앤스로픽이 구글의 클라우드 컴퓨팅 서비스를 사용하는 내용으로 별도의 파트너십 계약을 체결했다고 발표했다.

 

 

 

출처: 매일경제, 파이낸셜뉴스, 조선일보, 머니투데이, 연합뉴스, 한국경제

반응형
LIST

댓글