본문 바로가기
테크&IT 이슈

OpenAI, 스스로 검증하는 AI 모델 'o1' 공개 – 주요내용 정리!

by 찌릿찌릿 너굴맨 2024. 9. 13.
반응형

안녕하세요, 오늘은 AI 업계의 큰 이슈인 OpenAI의 차세대 모델, 코드명 'Strawberry', 정식명 'o1'에 대해 이야기해보려고 합니다. 사실 AI에 관심 많은 분들이라면 벌써 눈치채셨겠지만, 이번 o1은 기존 AI와는 차원이 다른 스펙을 자랑합니다. 저도 이 뉴스를 보고 나서 꽤 충격적이더라고요.

 

o1 모델, 과연 뭐가 다를까?

OpenAI o1

o1은 단일 모델이 아니고, 여러 모델이 포함된 일종의 '모델 패밀리'입니다. 현재 공개된 두 가지 버전은 'o1-preview'와 'o1-mini'인데, 이 중 'o1-mini'는 코드 생성에 특화된 모델이라 더 효율적으로 작동한다고 하네요.

 

근데 아쉽게도, 현재는 ChatGPT Plus 또는 Team 구독자만 사용할 수 있습니다. 일반 무료 사용자는 아직 사용 못하고, 기업용이나 교육용으로는 다음 주부터 풀릴 예정이라고 합니다. 다만, o1은 아직까지는 조금 기본적인 기능만 제공되는데, 웹 브라우징이나 파일 분석 같은 건 아직 지원하지 않아요. 이미지 분석 기능도 개발 중이라 좀 더 기다려야겠네요.

 

지난달에서는 서치GPT 발표를 하더니 GPT-o1까지 OpenAI 정말 숨가쁘게 달려가고 있네요 searchGPT에 대한 자세한 정보는 이전 포스트를 참고해주세요!

<서치GPT>에 대해 알아보자 : OpenAI의 새로운 도전

 

<서치GPT>에 대해 알아보자 : OpenAI의 새로운 도전

OpenAI가 새로운 검색 엔진인 서치GPT(SearchGPT)를 발표했습니다. 이번 글에서는 서치GPT의 특징과 가능성, 그리고 기존 검색 엔진과의 차별점을 알아보겠습니다. 서치 GPT(SearchGPT)의 특징서치GPT는 Ope

electroraccoon.tistory.com

 

o1, 가격이 너무 비싸다?

사실 가장 논란이 될 부분이 바로 가격일 겁니다. API 기준으로 'o1-preview'는 100만 입력 토큰당 15달러, 출력 토큰당 60달러입니다. 이게 무슨 소리냐면, GPT-4o보다 입력 비용은 3배, 출력 비용은 무려 4배나 비싸다는 거죠. 참고로 100만 토큰은 대략 75만 단어 정도라고 하네요.

 

그러니 많은 사람들이 '이거 너무 비싼 거 아니냐'는 반응을 보일 만도 하죠. 근데 또 OpenAI는 'o1-mini'를 무료 사용자에게도 제공할 계획이 있다고 하니까, 조금만 기다려보면 무료로도 쓸 수 있을 날이 올지도 모르겠네요.

 

진짜 '생각'하는 AI가 등장하다

이번 o1이 진짜 대박인 건 뭐냐면, 질문에 답변할 때 단순히 데이터를 조합해서 내놓는 게 아니라, 말 그대로 '생각'을 하고 답변한다는 거예요. OpenAI에 따르면, 이 모델은 질문에 답하기 전에 더 많은 시간을 들여서 내용을 검토하고, 스스로 검증까지 할 수 있다고 합니다. AI가 스스로 '체크'하고 답을 주는 거죠.

 

특히 여러 단계를 거쳐야 하는 복잡한 작업에 적합하다고 하네요. 예를 들면, 변호사의 이메일에서 중요한 내용을 골라내거나, 마케팅 전략 같은 복합적인 문제 해결에서 뛰어난 성능을 발휘한다고 합니다.

강화 학습을 통해서 '생각의 사슬(chain of thought)'이라는 방식으로 훈련되었다고 하는데, 이게 더 많은 데이터를 바탕으로 생각할 시간을 주면 줄수록 더 정확해진다고 하네요. 신기하죠?

 

실제 성능은?

아직 TechCrunch 같은 큰 매체에서는 테스트해보지 못했지만, 일부 테스트를 해본 사람들에 따르면 확실히 이전 모델보다 똑똑하다고 합니다. 예를 들어 Thomson Reuters의 부사장이 o1을 테스트해본 결과, 법률 문서 분석이나 논리 게임 문제 해결에서 GPT-4o보다 훨씬 뛰어났다고 하네요.

ML벤치마크 테스트 결과
ML벤치마크 테스트 결과

또한 국제 수학 올림피아드 예선에서 o1은 83%의 문제를 해결했고, GPT-4o는 13%밖에 못 풀었다고 합니다. 프로그램 코드 최적화 같은 작업에서도 매우 우수한 성능을 보였다고 하니, 개발자들에게도 큰 도움이 될 것 같습니다.

 

한계는 없을까?

물론 완벽한 모델은 없습니다. o1도 때때로 답변 속도가 느리고, 단순한 게임에서는 실수를 할 때도 있다고 합니다. 특히 틱택토 같은 간단한 게임에서 가끔 실수를 한다고 하네요. 그리고 '환각(hallucination)'이라고 불리는, 말도 안 되는 답변을 자주 내놓는 문제도 여전히 존재한다고 합니다.

 

경쟁사들도 비슷한 문제를 해결하기 위해 연구 중인데, Google DeepMind 같은 곳에서는 모델의 컴퓨팅 시간을 늘려 성능을 높이는 방법을 연구하고 있다고 합니다. 결국 누가 더 빨리, 더 정확하게 발전시키느냐가 관건이 되겠죠.

 

마무리

이번에 공개된 OpenAI의 o1은 AI의 새로운 장을 여는 모델임에는 분명합니다. 다만 아직 가격적인 부담과 일부 기능의 제한이 아쉽긴 하네요. 경쟁이 치열한 AI 시장에서 OpenAI가 얼마나 빠르게 더 나은 버전의 o1을 출시하고, 더 저렴하게 제공할 수 있을지가 중요한 포인트가 될 것 같습니다.

 

반응형

댓글