배경: 2022년 11월 OpenAI는 대화 텍스트, 컴퓨터 코드 등으로 서면 프롬프트에 응답할 수 있는 AI 챗봇인 ChatGPT를 출시했다. 2월에는 월간 사용자가 1억 명 이상인 역사상 가장 빠르게 성장하는 앱이 되었다.
인기에도 불구하고 ChatGPT는 "환각"하는 경향이 있는 가장 큰 결함 중 하나인 상당한 개선의 여지가 있음을 보여주었다. 사실처럼 들리지만 그렇지 않은 텍스트를 생성한다.
AI가 폭력이나 불법 활동을 조장하는 텍스트와 같은 허용되지 않는 콘텐츠를 작성하지 못하도록 설계된 과거 필터를 얻는 것도 상대적으로 쉬운 것으로 입증되었으며 ChatGPT는 본질적으로 전체 인터넷에서 훈련되었기 때문에 때때로 인터넷 사용자가 나타내는 편견이 출력에 포함된다.
최신 소식: ChatGPT는 GPT-3.5라는 AI 언어 모델을 기반으로 구축되었으며 OpenAI는 이제 기술의 다음 발전인 GPT-4를 발표했다.
이 모델과 이전 모델 사이의 가장 큰 발전 중 하나는 텍스트 및 이미지 프롬프트에 응답하는 기능이다. 그림 뒤에 있는 아티스트를 식별하거나 밈의 의미를 설명하거나 사진에 대한 캡션을 생성하도록 요청할 수 있다.
이 시스템은 또한 GPT-3.5보다 "더 똑똑"하여 SAT, LSAT 및 Bar를 포함한 수많은 시험에서 ChatGPT 모델을 능가한다.
아마도 더 중요한 것은 GPT-4가 GPT-3.5의 문제를 제거하지는 않지만 일부 문제를 최소화한다는 것이다. OpenAI에 따르면 이 모델은 사실에 입각한 콘텐츠를 생성할 가능성이 40% 더 높고 허용되지 않는 프롬프트에 응답한다.
CEO인 스티브 알트만(Steve Altman)은 또한 새로운 모델이 "편향이 적다"고 언급했지만 사용 가능한 정보를 기반으로 어느 정도 또는 어떻게 측정했는지는 명확하지 않다.
야생의 GPT-4: OpenAI는 아직 GPT-4의 이미지 입력 기능을 대중에게 제공하지 않았지만 나머지 모델은 이제 월 $20의 비용이 드는 챗봇의 구독 버전인 ChatGPT Plus에 있다(무료 ChatGPT 버전은 여전히 GPT-3.5에서 실행 중이다).
하지만 어떤 사람들은 인지도 못한 채 이미 차세대 AI를 무료로 사용했을 수도 있다. OpenAI에 130억 달러를 투자한 Microsoft는 GPT-4를 새로운 Bing 검색 엔진에 통합했다.
"지난 5주 동안 언제든지 새로운 Bing 미리 보기를 사용했다면 이미 이 강력한 모델의 초기 버전을 경험한 것이다."라고 GPT-4 출시 당일 Microsoft의 기업 부사장이자 소비자 CMO인 Yusuf Mehdi가 썼다.
GPT-4에 대한 조기 액세스 권한을 부여받은 다른 회사에는 학생들을 위한 가상 튜터를 만드는 데 사용하는 비영리 교육 비영리 칸 아카데미(Khan Academy)와 시각 장애가 있는 사람들을 위해 사진을 분석하는 AI 도우미를 개발하는 데 사용하는 덴마크의 비 마이 아이즈(Be My Eyes)가 있다.
Be My Eyes의 CEO인 Michael Buckley는 "우리가 액세스할 수 있었던 짧은 시간 동안 우리는 이미지-텍스트 개체 인식 도구에 비할 데 없는 성능을 보았다."라고 말했다. "글로벌 접근성에 미치는 영향은 심오하다."
전망: OpenAI는 블로그 게시물, Twitter 및 인터뷰에서 GPT-4에 여전히 결함이 있음을 강조한다.
그러나 빠른 속도로 상당한 진전을 이루고 있는 것으로 보이며 이미 오디오, 비디오 및 기타 입력을 향후 버전에 통합하는 방법을 모색하고 있다.
"우리는 GPT-4가 많은 응용 프로그램을 지원하여 사람들의 삶을 개선하는 데 유용한 도구가 되기를 기대한다."라고 회사는 말한다. "아직 해야 할 일이 많이 남아 있으며 커뮤니티 구축, 탐색 및 모델에 기여하는 커뮤니티의 공동 노력을 통해 이 모델을 개선할 수 있기를 기대한다."