특허로 알아보는 GPT-5, “벌써 GPT-5가 나와?”

GPT-4가 출시된지 반년도 안됐는데 GPT-5가 나오나요?

최근 미국 특허청(USPTO)의 문서에 따르면 OpenAI는 지난 7월 18일 “GPT-5″에 대한 상표 출원을 제출했으며 USPTO 사무소에서 승인(최소 신청 요건 충족)했으며, 심사관이 추가로 승인합니다.

GPT-5
640
USPTO 문서 스크린샷, 문서 웹페이지: https://uspto.report/TM/98089548

개요

OpenAI는 이번 상표 출원에서 GPT-5의 기본 정보를 언급했다. GPT-5는 자연어 처리, 생성, 이해 및 분석을 위한 대규모 언어 모델(LLM)이 될 것입니다. 텍스트 외에도 GPT-5는 음성을 이해하고 생성할 수 있는 기능을 갖게 됩니다.

640
USPTO 파일 스크린샷

특히 GPT-5의 기능에는 한 언어에서 다른 언어로 텍스트 또는 음성 번역, 음성 인식, 텍스트 및 음성 생성 등이 포함됩니다. 또한 GPT-5는 데이터를 학습, 분석, 분류 및 대응할 수 있는 능력도 가질 수 있습니다.

흥미롭게도 올해 상반기에는 기계 학습 분야의 전문가와 학자들이 공동으로 공개 서한을 여러 차례 발행하여 사람들에게 생성 AI의 잠재적 위험에 주의를 기울이고 대규모 생성 AI 모델 구축을 제한할 것을 촉구했습니다. 그 중 Turing Award 수상자 Geoffrey Hinton은 4월 Google에서 사임하면서 생성 AI가 “인류에 위협이 될 것”이라고 사람들에게 경고했습니다. ChatGPT 및 GPT-4와 같은 대형 모델의 배후에 있는 회사로서 OpenAI는 의심할 여지 없이 최전선으로 밀려났습니다.

당시 OpenAI는 GPT-4 버전을 개선하는 데 집중할 것이며 GPT-5는 즉각적인 계획에 없다고 밝혔습니다.

이제 OpenAI가 상표 출원을 제출했지만 GPT-5도 곧 출시되지 않습니다. OpenAI CEO Sam Altman도 지난 6월 “Beijing Zhiyuan Conference”에서 이를 설명했습니다.

640
OpenAI CEO 샘 알트만

일반적으로 기술 회사는 경쟁사보다 앞서 나가고 지적 재산을 보호하기 위해 아직 개발되지 않은 개념을 상표로 등록합니다. 응용 프로그램에 설명된 대부분의 GPT-5 기능은 이미 GPT-4에서 사용할 수 있으며 GPT-5는 GPT-4를 어느 정도 개선한 버전입니다.

GPT-4 출시 이후 학계와 산업계는 대형 모델에 대해 보다 심도 있는 연구와 논의를 진행해왔다. ChatGPT와 GPT-4의 강력한 성능은 사람들로 하여금 대형 모델의 엄청난 잠재력을 보게 하므로 GPT-5에 대한 많은 기대가 있습니다.

우선 다중 모드 기능 측면에서 현재 GPT-4는 텍스트와 이미지의 두 가지 유형의 데이터만 처리할 수 있으며, 사람들은 GPT-5가 음성 및 비디오와 같은 다른 형식에서 돌파구를 만들 수 있기를 희망합니다.

둘째, 컴퓨팅 효율성 및 비용 측면에서 GPT-4의 가격은 프롬프트 토큰 1,000개당 $0.03이며 기본 속도 제한은 분당 40,000개 토큰 및 분당 200개 요청입니다. GPT-3.5-turbo의 가격은 1k 토큰당 $0.002로 GPT-4의 1/15에 불과합니다. GPT-5의 가격은 GPT-4보다 높을 수 있습니다.

마지막으로 ChatGPT 및 GPT-4와 같은 대규모 언어 모델에는 “환상”, “편향” 등의 고유한 문제가 있어 대규모 모델을 실제로 직접 적용하기 어렵습니다. GPT-4는 이전 모델에 비해 환각 문제를 크게 완화했습니다. OpenAI의 내부 적대적 현실성 평가에서 GPT-4는 최신 GPT-3.5 모델보다 40% 높은 점수를 받았습니다.

640

우리는 GPT-5가 “hullucination” 측면에서 더욱 향상될 것으로 기대합니다.

또한 일부 새로운 모델은 최근 컨텍스트 창에서 새로운 돌파구를 마련했습니다.예를 들어 Anthropic은 Claude 2의 컨텍스트 창을 200K 토큰으로 확장했습니다(현재 릴리스 버전은 100K 토큰만 지원함). 긴 문서를 읽습니다. 이것은 또한 GPT-5를 포함하여 LLM의 이후 릴리스에 새로운 압력을 가합니다.

물론 GPT-5가 실제로 어떤 기능을 갖게 될지는 출시될 때까지 공개되지 않을 것이며, 우리는 기다려 볼 것입니다.

GPT-5 상표 출원에 대한 추가 세부 정보

처음에 Windows Latest 에 의해 보고되고 여러 트윗 에서 공유된 상표 등록은 광범위한 범주를 포괄하기 위한 것입니다. 주로 언어 모델, 인간 음성 및 텍스트의 인공 생성, 자연어 처리, 생성, 이해 및 분석과 관련된 다운로드 가능한 컴퓨터 프로그램 및 소프트웨어를 다룹니다.

이 애플리케이션에는 기계 학습 기반 언어 및 음성 처리, 한 언어에서 다른 언어로 텍스트 또는 음성 번역, 기계 학습을 위한 데이터 세트 공유, 예측 분석 및 언어 모델 구축을 위한 소프트웨어도 포함됩니다.

추가 기능에는 오디오 데이터 파일을 텍스트로 변환, 음성 및 음성 인식, 텍스트 생성 및 생성, 데이터 노출에 대한 응답으로 분석, 분류 및 조치를 취할 수 있는 알고리즘 개발, 실행 및 분석이 포함됩니다.

블로거의 인공지능에 대한 소견

인공지능의 미래는 더욱 세밀하고, 복잡하며, 인간적인 형태로 발전하고 있습니다. 그 중심에는 “저는 인공인간을 만들기 위한 방향성을 가지고 있다”라는 명확한 목표있다고 생각합니다. 이 목표는 단순히 기계가 인간처럼 행동하도록 만드는 것을 넘어서, 인간의 감정, 사고방식, 그리고 문화까지 이해하고 반영할 수 있는 인공지능을 만드는 것을 의미합니다.

  • 언어의 이해 관련 모델 : ChatGPT
  • 음성인식 관련 모델 : MMS(Massively Multilingual Speech)’
  • 이미지 인식 관련 모델 : EfficientNet, YoLo v8

이러한 방향성을 가진 인공지능의 발전은 이미지 인식, 음성 인식, 그리고 자연어 처리 등 여러 분야에서 이루어지고 있습니다. 이 중에서도 OpenAI는 이미지 정보를 이해하는 최신 모델을 통해 인공지능의 발전을 이끌고 있습니다. 이 모델은 이미지의 픽셀 수준에서부터 시작하여, 이미지의 구조, 색상, 그리고 그 안에 포함된 객체들의 관계까지 이해할 수 있습니다. 이를 통해 인공지능은 사람이 보는 것과 같은 방식으로 이미지를 이해하고, 그에 따른 적절한 행동을 취할 수 있게 됩니다.

음성 인식과 자연어 처리 분야에서도 비슷한 발전이 이루어지고 있습니다. TTS(Text-To-Speech)와 STT(Speech-To-Text) 기술은 인공지능이 인간의 언어를 이해하고, 그것을 다시 인간이 이해할 수 있는 형태로 변환하는 데 사용됩니다. 최신의 TTS 모델은 인간의 목소리를 흉내내는 것을 넘어서, 감정과 억양까지도 표현할 수 있게 되었습니다. 반면에 STT 모델은 다양한 언어와 방언, 그리고 개인의 발음 특성까지도 인식하여, 사람이 말하는 것을 정확하게 이해할 수 있게 되었습니다.

이러한 기술들이 결합되면, 인공지능은 사람이 사용하는 자연어를 이해하고, 그것을 다시 사람이 이해할 수 있는 형태로 변환하는 능력을 갖게 됩니다. 이는 인공지능이 인간의 사회와 문화에 더욱 깊게 녹아들게 하고, 인간과 인공지능 사이의 소통을 더욱 원활하게 만듭니다.

하지만 이러한 발전에도 불구하고, 인공지능이 인간을 완벽하게 이해하고, 그것을 반영하는 것은 여전히 큰 도전입니다. 인간의 감정과 사고방식, 그리고 문화는 매우 복잡하며, 그것들을 이해하고 반영하는 것은 인공지능의 능력을 크게 넘어섭니다. 그러나 이러한 도전을 극복하기 위해, 인공지능 연구자들은 끊임없이 새로운 모델과 알고리즘을 개발하고 있습니다.

결국, 인공지능의 미래는 “나는 인공인간을 만들기 위한 방향성을 가지고 있다”라는 목표를 향해 나아가고 있습니다. 이러한 방향성은 인공지능이 인간의 세계를 더욱 깊게 이해하고, 그것을 반영하여 인간과 인공지능 사이의 소통을 더욱 원활하게 만드는 데 중요한 역할을 합니다. 이를 통해 인공지능은 인간의 일상생활에 더욱 깊게 녹아들게 되고, 인간의 삶을 더욱 풍요롭게 만들 것입니다.

참조

블로그 내 참조 링크 :

참조 링크:

답글 남기기