시작페이지로　l　즐겨찾기　l　RSS　l　편집 2024.04.28 [11:56]

세상을 바꾸자
AI바이오제약 수명연장
자율차,드론, 교통, 에너지,기후
유투브
신기술&메타버스AR/VR
AiMindbot과 미래 우주
챗GPT와 AI, 로봇
라이프,거버넌스, 조직, 유망직종

챗GPT와 AI, 로봇

[ChatGPT 1주년: AI 상호작용의 미래 재편] 가장 유능하고 다재 다능한 AI 시스템을 개발하기 위한 경쟁으로 인해 ChatGPT와 같은 오픈 소스 모델과 독점 모델이 모두 확산되었다. 일반적인 기능을 이해하려면 광범위한 작업에 대한 포괄적인 벤치마크가 필요하다. 이러한 벤치마크를 살펴보고 ChatGPT를 포함한 다양한 모델이 서로 어떻게 비교되는지 조명한다.

https://www.unite.ai/chatgpts-first-anniversary-reshaping-the-future-of-ai-interaction/

JM Kim | 기사입력 2023/12/08 [00:00]

챗GPT와 AI, 로봇

[ChatGPT 1주년: AI 상호작용의 미래 재편] 가장 유능하고 다재 다능한 AI 시스템을 개발하기 위한 경쟁으로 인해 ChatGPT와 같은 오픈 소스 모델과 독점 모델이 모두 확산되었다. 일반적인 기능을 이해하려면 광범위한 작업에 대한 포괄적인 벤치마크가 필요하다. 이러한 벤치마크를 살펴보고 ChatGPT를 포함한 다양한 모델이 서로 어떻게 비교되는지 조명한다.

https://www.unite.ai/chatgpts-first-anniversary-reshaping-the-future-of-ai-interaction/

JM Kim

| 입력 : 2023/12/08 [00:00]

ChatGPT의 첫해를 되돌아보면 이 도구가 AI 현장을 크게 변화시켰다는 것이 분명하다. 2022년 말에 출시된 ChatGPT는 AI와의 상호 작용이 기계가 아닌 사람과의 채팅처럼 느껴지도록 하는 사용자 친화적인 대화 스타일로 인해 두각을 나타냈다. 이 새로운 접근 방식은 빠르게 대중의 시선을 사로잡았다. 출시 후 불과 5일 만에 ChatGPT는 이미 백만 명의 사용자를 유치했다. 2023년 초까지 이 숫자는 월간 사용자 수 약 1억 명으로 급증했으며, 10월까지 플랫폼은 전 세계적으로 약 17억 건의 방문을 기록했다. 이 숫자는 그 인기와 유용성에 대해 많은 것을 말해준다.

지난 한 해 동안 사용자는 이메일 작성, 이력서 업데이트와 같은 간단한 작업부터 성공적인 비즈니스 시작에 이르기까지 ChatGPT를 사용하는 모든 종류의 창의적인 방법을 찾았다. 그러나 사람들이 그것을 어떻게 사용하는지에 관한 것이 아니다. 기술 자체가 성장하고 향상되었다. 처음에 ChatGPT는 자세한 텍스트 응답을 제공하는 무료 서비스였다. 이제 ChatGPT-4가 포함된 ChatGPT Plus가 있다. 이 업데이트된 버전은 더 많은 데이터를 기반으로 훈련되어 잘못된 답변이 줄어들고 복잡한 지침을 더 잘 이해한다.

가장 큰 업데이트 중 하나는 ChatGPT가 이제 다양한 방식으로 상호 작용할 수 있다는 것이다. 즉, 듣고 말하고 이미지를 처리할 수도 있다. 즉, 모바일 앱을 통해 말을 걸고 사진을 보여주어 응답을 받을 수 있다. 이러한 변화는 AI에 대한 새로운 가능성을 열어줬고 우리 삶에서 AI의 역할에 대해 사람들이 보고 생각하는 방식을 변화시켰다.

기술 데모로 시작하여 기술 세계의 주요 플레이어로서의 현재 상태에 이르기까지 ChatGPT의 여정은 매우 인상적이다. 처음에는 대중의 피드백을 받아 기술을 테스트하고 개선하는 방법으로 여겨졌다. 그러나 이는 빠르게 AI 환경의 필수적인 부분이 되었다. 이러한 성공은 지도 학습과 인간의 피드백을 모두 사용하여 대규모 언어 모델(LLM)을 미세 조정하는 것이 얼마나 효과적인지 보여준다. 결과적으로 ChatGPT는 광범위한 질문과 작업을 처리할 수 있다.

가장 유능하고 다재 다능한 AI 시스템을 개발하기 위한 경쟁으로 인해 ChatGPT와 같은 오픈 소스 모델과 독점 모델이 모두 확산되었다. 일반적인 기능을 이해하려면 광범위한 작업에 대한 포괄적인 벤치마크가 필요하다. 이 섹션에서는 이러한 벤치마크를 살펴보고 ChatGPT를 포함한 다양한 모델이 서로 어떻게 비교되는지 조명한다.

LLM 평가: 벤치마크

1.MT-Bench: 이 벤치마크는 쓰기, 역할극, 정보 추출, 추론, 수학, 코딩, STEM 지식, 인문학/사회 과학 등 8개 영역에 걸쳐 다중 회전 대화 및 지시 따르기 능력을 테스트한다. GPT-4와 같은 더 강력한 LLM이 평가자로 사용된다.

2.AlpacaEval: AlpacaFarm 평가 세트를 기반으로 하는 이 LLM 기반 자동 평가기는 GPT-4 및 Claude와 같은 고급 LLM의 응답에 대해 모델을 벤치마킹하여 후보 모델의 승률을 계산한다.

3.개방형 LLM 리더보드: 언어 모델 평가 하네스를 활용하는 이 리더보드는 제로샷 및 소수 설정 모두에서 추론 과제 및 일반 지식 테스트를 포함한 7가지 주요 벤치마크에서 LLM을 평가한다.

4.BIG-bench: 이 협업 벤치마크는 다양한 주제와 언어를 포괄하는 200개 이상의 새로운 언어 작업을 다룬다. LLM을 조사하고 향후 역량을 예측하는 것을 목표로 한다.

5.ChatEval: 팀이 개방형 질문 및 기존 자연어 생성 작업에 대한 다양한 모델의 응답 품질을 자율적으로 논의하고 평가할 수 있는 다중 에이전트 토론 프레임워크이다.

비교 성능

일반적인 벤치마크 측면에서 오픈소스 LLM은 눈에 띄는 발전을 보여왔다. 예를 들어 Llama-2-70B는 특히 명령 데이터를 미세 조정한 후 인상적인 결과를 얻었다. 그 변형인 Llama-2-chat-70B는 AlpacaEval에서 92.66%의 승률로 GPT-3.5-turbo를 능가했다. 그러나 GPT-4는 95.28%의 승률로 여전히 선두 주자로 남아 있다.

더 작은 모델인 Zephyr-7B는 특히 AlpacaEval 및 MT-Bench에서 더 큰 70B LLM에 필적하는 기능을 시연했다. 한편, 다양한 명령어 데이터로 미세 조정된 WizardLM-70B는 MT-Bench에서 오픈 소스 LLM 중 가장 높은 점수를 받았다. 그러나 여전히 GPT-3.5-터보와 GPT-4에는 뒤처져 있다.

흥미로운 출품작인 GodziLLa2-70B는 Open LLM 리더보드에서 경쟁력 있는 점수를 획득하여 다양한 데이터세트를 결합한 실험 모델의 잠재력을 보여주었다. 마찬가지로, 처음부터 개발된 Yi-34B는 GPT-3.5 터보와 비슷한 점수로 눈에 띄었고 GPT-4보다 약간 뒤처졌다.

다양하고 고품질의 데이터를 미세 조정한 UltraLlama는 제안된 벤치마크에서 GPT-3.5-turbo를 능가했으며 세계 및 전문 지식 분야에서도 이를 능가했다.

확장: 거대한 LLM의 부상

2020년 이후 최고의 LLM 모델

LLM 개발의 주목할만한 추세는 모델 매개변수의 확장이다. Gopher, GLaM, LaMDA, MT-NLG 및 PaLM과 같은 모델은 한계를 뛰어넘어 최대 5,400억 개의 매개변수를 갖춘 모델로 완성되었다. 이러한 모델은 뛰어난 기능을 보여주었지만 비공개 소스 특성으로 인해 더 넓은 적용 범위가 제한되었다. 이러한 제한으로 인해 오픈 소스 LLM 개발에 대한 관심이 촉발되었으며, 이는 추진력을 얻고 있는 추세이다.

모델 크기를 확장하는 것과 병행하여 연구자들은 대체 전략을 모색했다. 단순히 모델을 더 크게 만드는 대신 더 작은 모델의 사전 학습을 개선하는 데 중점을 두었다. 예를 들어 Chinchilla와 UL2는 더 많다고 해서 항상 더 좋은 것은 아니라는 사실을 보여준다. 더 똑똑한 전략으로 효율적인 결과를 얻을 수도 있다. 또한 FLAN, T0 및 Flan-T5와 같은 프로젝트가 이 영역에 상당한 기여를 하면서 언어 모델의 명령 조정에 상당한 관심이 있었다.

ChatGPT 촉매

OpenAI의 ChatGPT 도입은 NLP 연구에 전환점이 되었다. OpenAI와 경쟁하기 위해 Google과 Anthropic과 같은 회사는 각각 Bard와 Claude라는 자체 모델을 출시했다. 이러한 모델은 많은 작업에서 ChatGPT와 비슷한 성능을 보여주지만 여전히 OpenAI의 최신 모델인 GPT-4에 비해 뒤떨어져 있다. 이러한 모델의 성공은 주로 추가 개선을 위해 연구 초점이 높아지고 있는 기술인 인간 피드백 강화 학습(RLHF)에 기인한다.

OpenAI의 Q*(Q-Star)에 대한 소문과 추측

최근 보고서에 따르면 OpenAI의 연구원들은 Q*(Q 스타로 발음)라는 새로운 모델의 개발을 통해 AI 분야에서 상당한 발전을 이루었을 수 있다고 한다. Q*는 초등학교 수준의 수학을 수행할 수 있는 능력을 갖고 있는 것으로 알려져 있으며, 이는 인공 일반 지능(AGI)을 향한 이정표로서의 잠재력에 대해 전문가들 사이에서 논의를 촉발시켰다. OpenAI는 이러한 보고서에 대해 언급하지 않았지만 Q*의 소문난 능력은 소셜 미디어와 AI 애호가들 사이에서 상당한 흥분과 추측을 불러일으켰다.

ChatGPT 및 GPT-4와 같은 기존 언어 모델은 일부 수학적 작업을 수행할 수 있지만 이를 안정적으로 처리하는 데 특별히 능숙하지 않기 때문에 Q*의 개발은 주목할 만하다. 문제는 AI 모델이 현재 딥 러닝과 변환기를 통해 패턴을 인식하는 것뿐만 아니라 추상적 개념을 추론하고 이해해야 한다는 것이다. 추론의 벤치마크인 수학에서는 AI가 여러 단계를 계획하고 실행하여 추상적 개념에 대한 깊은 이해를 보여주어야 한다. 이 능력은 AI 능력의 상당한 도약을 의미하며 잠재적으로 수학을 넘어 다른 복잡한 작업으로 확장될 것이다.

그러나 전문가들은 이러한 발전을 과대평가하지 말라고 경고한다. 수학 문제를 안정적으로 해결하는 AI 시스템은 인상적인 성과이겠지만, 이것이 반드시 초지능 AI나 AGI의 출현을 의미하는 것은 아니다. OpenAI의 노력을 포함한 현재 AI 연구는 보다 복잡한 작업에서 다양한 수준의 성공을 거두면서 기본적인 문제에 중점을 두었다.

Q*와 같은 잠재적인 응용 프로그램 발전은 맞춤형 개인 지도부터 과학 연구 및 엔지니어링 지원에 이르기까지 광범위하다. 그러나 기대치를 관리하고 이러한 발전과 관련된 한계와 안전 문제를 인식하는 것도 중요하다. OpenAI의 근본적인 우려인 AI가 실존적 위험을 초래한다는 우려는 여전히 유효하며, 특히 AI 시스템이 현실 세계와 더 많이 인터페이스하기 시작함에 따라 더욱 그렇다.

오픈 소스 LLM 운동

오픈 소스 LLM 연구를 활성화하기 위해 Meta는 Llama 시리즈 모델을 출시하여 Llama를 기반으로 한 새로운 개발의 물결을 촉발했다. 여기에는 Alpaca, Vicuna, Lima 및 WizardLM과 같은 지침 데이터로 미세 조정된 모델이 포함된다. 연구는 또한 Llama 기반 프레임워크 내에서 에이전트 기능, 논리적 추론 및 장기 컨텍스트 모델링을 향상시키는 방향으로 확장되고 있다.

또한 MPT, Falcon, XGen, Phi, Baichuan, Mistral, Grok 및 Yi와 같은 프로젝트를 통해 처음부터 강력한 LLM을 개발하는 추세가 증가하고 있다. 이러한 노력은 비공개 소스 LLM의 기능을 민주화하여 고급 AI 도구에 대한 접근성과 효율성을 높이려는 노력을 반영한다.

의료 분야에서 ChatGPT 및 오픈 소스 모델의 영향

우리는 LLM이 임상 메모 작성, 환급 양식 작성, 의사의 진단 및 치료 계획 지원을 지원하는 미래를 기대하고 있다. 이는 거대 기술 기업과 의료 기관 모두의 관심을 끌었다.

선도적인 전자 건강 기록 소프트웨어 제공업체인 Epic과 Microsoft가 논의한 것은 LLM을 의료 서비스에 통합하는 것을 의미한다. UC 샌디에고 헬스와 스탠포드 대학 메디컬 센터에서는 이미 이 계획을 시행하고 있다. 마찬가지로 Google과 Mayo Clinic의 파트너십 및 Amazon Web Services의 AI 임상 문서 서비스인 HealthScribe 출시는 이러한 방향에서 중요한 진전을 의미한다.

그러나 이러한 급속한 배치는 의료 통제권을 기업 이익에 양도하는 것에 대한 우려를 불러일으킨다. 이러한 LLM의 독점 특성으로 인해 평가가 어렵다. 수익성을 이유로 수정하거나 중단할 경우 환자 치료, 개인 정보 보호 및 안전이 손상될 수 있다.

의료 분야의 LLM 개발에 대한 개방적이고 포괄적인 접근 방식이 시급히 필요하다. 의료 기관, 연구원, 임상의 및 환자는 전 세계적으로 협력하여 의료용 오픈 소스 LLM을 구축해야 한다. 조 매개변수 컨소시엄(Trillion Parameter Consortium)과 유사한 이 접근 방식을 통해 계산, 재정 자원 및 전문 지식을 풀링할 수 있다.

JM Kim의 다른기사보기

ChatGPT, 인공지능, LLM 관련기사목록

[세계미래보고서]시리즈, 판매제품

신간소개 [세계미래보고서2024-2034] 이르면 10년 안에 등장할 인공일반지능 신기술이 가져올 유토피아와 디스토피아를 미리 살펴보자!

많이 본 기사

[소멸직종 15] 소멸직종 15가지 2030년 여행사와 직원, 캐시어 점원, 패스트푸드 요리사, 우체부, 은행원, 섬유 노동자, 인쇄소, 보석상, 배달원, 텔레마케터, 어민, 법무비서관, 조립제작사,

[Beyond Enterprizes/Actioneer.AI] 이 회사는 전통적인 전략 자문 회사의 한계를 달성하고 실행하며 극복하기 위해 고안되었다. 기업과 협력하여 그들이 직면한 기술 및 비즈니스 과제에 대한 솔루션을 찾아내고, 새로운 비즈니스 벤처를 시작한 수십 년간의 경험을 바탕으로 지침을 제공한다.

[AI 전투기 조종사와 인간 조종사의 세기의 대결] 처음으로 AI 전투기 조종사가 공중에서 실제 제트기를 이용한 공중전에서 인간 조종사와 대결했다. 이는 자율 비행 및 군사 자동화 분야에서 큰 이정표를 세웠다.

[OPEN AI에 필적할 멀티모달 AI 모델] 일론 머스크의 AI 벤처인 xAI가 오픈AI와의 경쟁 무대에 진입하면서 최초의 멀티모달 선보임. 문서, 차트, 다이어그램, 스크린샷 및 사진을 포함한 다양한 시각적 형식을 이해할 수 있는 기능을 자랑

유투브 책[2023년에 얼마나 많은 사람들이 YouTube를 사용하나 각종 통계들] 2006년 20억으로 구글이 사들인 유투브는 2005년 2월 14일에 설립, 첫비디오는 4월 23일에 게시, 지금은 20억명이 넘는 사용자보유, 인터넷사용자 43%가 매일 유투브를 본다.

[획기적인 메타물질을 개척] 식물의 놀라운 회복력에서 영감을 얻은 호주 과학자들은 레이저와 금속 분말을 활용하여 전례 없는 중량 대비 강도 비율을 달성하는 획기적인 메타물질

유투브[AI가 일본의 인구 문제를 해결할 수 있을까? ] 일본의 노동력 위기 대응: AI 도입으로 미래를 준비하다. 정부의 AI 활용 확대.

마인드봇[AI 및 딥테크 솔루션을 위한 10억 달러 이상의 자금을 조달] AI, Web3, 로보틱스, 공간 컴퓨팅 및 양자 기술 포트폴리오 회사에 투자할 파트너십 조건 및 블록버스터 자금 조달에 대한 세부 정보가 최근 파나마에서 열린 유익한 AGI 서밋에서 신속하게 처리

유투브[배우의 소멸? 할리우드, 배우들의 AI 복제 시작] CAA와 AI: 헐리우드의 미래와 배우의 디지털 복제. 배우의 AI 복제본 제작 파트너십 체결: 헐리우드 미래를 바꿀까?

챗GPT와 AI, 로봇 많이 본 기사

[음악가들이 AI 업계에 경고를 보낸다]음악계 거장들, AI 기술의 창작물 활용에 경고장 발송. 이들은 인공지능이 인간의 창의성을 향상시킬 잠재력을 인정하면서도, 인간을 대체하거나 인간의 수입을 감소시키는 모든 활동에 대해 단호히 반대

유투브[AI가 일본의 인구 문제를 해결할 수 있을까? ] 일본의 노동력 위기 대응: AI 도입으로 미래를 준비하다. 정부의 AI 활용 확대.

[4월 18일 AI뉴스] AI 여자친구의 부상, 비디오의 생성적 채우기, Google의 로봇 공학 혁신. 프롬프트만으로 AI 노래를 무료로 생성. AI로 파킨슨병 치료 가속화. 스탠포드 대학의 502페이지 AI 보고서.

[사람을 위한 AI: 개방형 및 분산형 시스템의 시급한 사례] AGI로 가는 길에 대한 OpenAI의 성명을 보면 그들은 이 기술이 민주주의와 자본주의를 종식시키고 어쩌면 우리 모두를 죽일 것이라고 말합니다. 나는 그것이 마음에 들지 않습니다

최신기사

신간소개 [세계미래보고서2024-2034] 이르면 10년 안에 등장할 인공일반지능 신기술이 가져올 유토피아와 디스토피아를 미리 살펴보자!

[인공지능(AI), 기후변화 대응의 핵심 무기로 떠오르다] AI는 방대한 데이터 분석을 통해 에너지 생산 및 소비 패턴을 파악하고, 이를 기반으로 탄소 배출량을 최적화하는 전략을 수립하는 데 활용

[인공지능(AI), 인간 건강의 미래를 혁신하다] 최근 몇 년 동안 인공지능(AI)은 의료 분야에서 놀라운 발전을 보여주고 있으며, 인간 건강에 혁신적인 변화를 가져올 것으로 기대됩니다. AI가 어떻게 우리 건강에 영향을 미치는지

[AMAZON의 로봇 혁명: 인간 협업을 수용하면서 효율성 향상] 창고 자동화에 대한 Amazon의 최근 진출은 창고 운영에 혁명을 일으키기 위한 휴머노이드 로봇과 고급 로봇 시스템의 도입으로 효율성과 혁신의 새로운 시대를 예고

회원약관 ㅣ 개인정보취급방침 ㅣ 회사소개 ㅣ 청소년보호정책 ㅣ 직원게시판 ㅣ 기사제보 ㅣ 보도자료 ㅣ 기사검색

AI넷ㅣ 주소 : 우)02821 서울특별시 성북구 북악산로 1길 31 ㅣ 전화 : 02-313-6300 ㅣ 팩스 : 02-908-9494
등록번호 : 서울, 아02236ㅣ 등록일 : 2009.11. 19. ㅣ E-mail : unfutures@gmail.com, futures2055@gmail.com
회사명 : AI넷 ㅣ 발행/편집인 : 박영숙ㅣ 발행일: 2020.09.05｜청소년보호책임자 : 박영숙
사업자등록번호 : 209-15-39241 (사)유엔미래포럼 www.unfuture.org
Copyright ⓒ 2020 AI넷. All rights reserved. (This is a non-profit organization/a free newspaper.)