이미지 보고 원하는 결과를 내놓고 어려운 시험도 최상위 수준으로 풀어내는 GPT-4가 공개됐다.


오픈AI는 현지 시각으로 14일 대규모 언어 모델 GPT-4를 발표했다. 마이크로소프트 일부 지사를 통해 먼저 공개 소식이 공개된 바 있는 GPT-4는 현재 챗GPT에 적용되어 있는 GPT-3.5의 다음 모델로 다양한 버그를 해결하고 이론적 기반을 개선해 선보인다.

오픈AI 측은 일상적인 대화 수준에서는 지금까지의 GPT-3.5와 GPT-4의 차이를 확연히 구분하기 어렵다고 밝혔다. 하지만 복잡성이 충분한 수준에 도달한 후에는 그 차이가 벌어진다고 소개했다.

이러한 복잡성 처리 능력 향상을 가늠할 수 있는 부분은 전문 부문의 시험 결과다. 오픈AI는 미국 변호사 시험(Uniform Bar Exam), SAT 등 다양한 최신 테스트 및 연습 시험을 진행했다. 일부 문제가 교육 모델에 포함될 수는 있지만 오픈AI가 테스트를 위해 별도의 특별한 훈련을 하지 않았음에도 GPT-4는 GPT-3.5보다 높은 백분위수를 기록했다. 특히 GPT-3.5가 하위 10%를 기록한 일부 시험에서 GPT-4는 상위 10% 수준의 결과를 받기도 했다.


일반 지식과 문제 해결 능력 향상을 통한 어려운 문제 해결 능력은 다양한 예시로도 소개됐다.

노래 작곡, 시나리오 작성 등의 작문 등 창의적 기술 영역. 기존의 3,000단어에서 8배 넘게 확대된 25,000단어 이상의 텍스트 처리를 통한 긴 형식의 코텐츠와 확장된 대화를 기반으로 한 긴 맥락. 그리고 이미지를 입력하면 이를 기반으로 분류, 분석 결과를 생성하는 기능 등이 새롭게 소개됐다.

예를 들어 A부터 Z까지 모든 문자를 순서대로 활용한 단어 조합으로 신데렐라 줄거리를 설명한다거나 위키피디아 페이지를 주고 특정 주제에 대해 설명하도록 명령할 수도 있다. 계란, 치즈가 담긴 이미지를 보여주고 이를 재료로 활용해 만들 수 있는 요리를 제안하기도 한다. 추론 기능의 개선으로 논리적인 결과물 역시 정확하게 도출한다. 도표를 보여주고 특정 추론 과정을 제공하는 경우도 예시로 소개됐다.


▲ A에서 Z를 순서대로 사용한 단어로 신데렐라 이야기를 설명할 수 있다

AI 대중화 단계에서 문제가 대두된 윤리, 안전 문제 역시 학습을 통해 일부 해결하고자 하는 노력을 보여준다. 예를 들어 폭탄 제조법이나 싼 담배 구매처 등을 질문하면 불법 활동에 대해 알려줄 수 없다고 선을 긋고 담배 구매 방법을 알려줄 때에는 흡연의 위험성을 정보 전 함께 제공하기도 한다. 부정확한 정보를 확신과 함께 설명하는 오류 역시 상당히 줄였다.

오픈AI는 다만 이러한 '나쁜 행동'에 대한 우회로 역시 존재하고 GPT-3.5처럼 GPT-4와 같이 여전히 완벽하지 않다고 전하며 해결할 문제가 여전히 남아있음을 이야기했다.

오픈AI는 GPT-4 발표 이후 챗GPT의 유료 모델인 챗GPT 플러스에 이를 적용하고 API를 제공받기 위한 대기자 등록을 시작했다. 오픈AI에 대규모 투자를 진행하고 챗봇을 자사 검색 엔진 빙에 담았던 마이크로소프트는 GPT-4 출시를 축하하는 글을 올리며 빙에 GPT-4가 적용되고 있음을 공식 확인하기도 했다.

▲ 이미지가 어떤 밈인지 설명하거나

▲ 이미지 속 재료로 만들 수 있는 요리를 설명하는 GPT-4