시작페이지로　l　즐겨찾기　l　RSS　l　편집 2024.05.04 [13:36]

세상을 바꾸자
AI바이오제약 수명연장
자율차,드론, 교통, 에너지,기후
유투브
신기술&메타버스AR/VR
AiMindbot과 미래 우주
챗GPT와 AI, 로봇
라이프,거버넌스, 조직, 유망직종

챗GPT와 AI, 로봇

[AI는 이제 거의 모든 성능 벤치마크에서 인간을 능가]스탠포드 대학의 인간 중심 인공 지능 연구소, 7차 연례 AI 지수 보고서 발표. AI, 인간을 따라잡는 속도가 빨라져 새로운 평가 기준이 필요하다: 스탠포드 HAI 보고서 발표.

박영숙세계미래보고서저자 | 기사입력 2024/04/21 [18:52]

챗GPT와 AI, 로봇

[AI는 이제 거의 모든 성능 벤치마크에서 인간을 능가]스탠포드 대학의 인간 중심 인공 지능 연구소, 7차 연례 AI 지수 보고서 발표. AI, 인간을 따라잡는 속도가 빨라져 새로운 평가 기준이 필요하다: 스탠포드 HAI 보고서 발표.

박영숙세계미래보고서저자

| 입력 : 2024/04/21 [18:52]

AI는 이제 거의 모든 성능 벤치마크에서 인간을 능가

스탠포드 대학의 인간 중심 인공 지능 연구소, 7차 연례 AI 지수 보고서 발표

스탠포드 대학의 인간 중심 인공 지능 연구소(Human-Centered Artificial Intelligence, HAI)가 학계 및 산업 전문가들로 구성된 학제간 팀이 작성한 종합 AI 지수 보고서의 일곱 번째 판을 발표했다. 이 보고서는 AI의 빠른 발전과 그것이 일상 생활에서 차지하는 중요성이 점점 커지고 있음을 조명한다.

AI 발전의 높은 속도와 그 영향

보고서는 AI가 너무 많은 분야에서 너무 빨리 인간을 따라잡고 있기 때문에 새로운 테스트가 필요하다는 고찰로 시작한다. 이는 인공 지능이 무엇을 할 수 있는지, 그리고 그것이 사회에 미치는 영향을 이해하기 위해 기존의 평가 방법을 재검토할 필요가 있음을 시사한다.

보고서의 내용과 특징

이번 에디션은 이전 에디션보다 풍부한 콘텐츠를 포함하고 있다. 이는 AI 기술의 발전 속도를 상세히 추적하고, 이 기술이 어떻게 다양한 산업 분야에 통합되고 있는지를 보여준다. 또한, AI가 가장 활발하게 활용되는 분야부터, 이로 인한 일자리 상실에 대해 가장 우려하는 국가들까지 다양한 주제를 다룬다.

특히 눈에 띄는 것은 인간과 대결할 때 AI의 성능 부분이다. 이 부분에서는 AI가 특정 작업에서 인간을 어떻게 능가하고 있는지, 그리고 그것이 우리의 삶과 일에 어떤 실질적인 변화를 가져오고 있는지를 평가한다.

미래 지향적인 관점

보고서는 또한 미래의 AI 기술 발전과 그것이 인류에게 가져올 잠재적인 변화에 대해 전망한다. AI 기술의 윤리적, 사회적 영향을 고민하고, 이를 적절히 관리하기 위한 정책 및 규제의 필요성에 대해서도 논의한다.

이 보고서는 AI 기술의 발전을 이해하고 그 영향을 평가하는 데 중요한 자료로 활용될 것이며, AI 연구와 정책 결정에 있어 귀중한 참고 자료가 될 것이다. 보고서는 AI의 가능성을 탐구하면서도 그것이 인간 사회에 미치는 영향을 신중하게 고려하는 균형 잡힌 접근을 제공한다.

AI, 인간을 따라잡는 속도가 빨라져 새로운 평가 기준이 필요하다: 스탠포드 HAI 보고서 발표

인공지능(AI)은 다양한 분야에서 놀라운 속도로 발전하고 있으며, 이는 인간과의 경쟁에서도 예외가 아니다. 스탠포드 대학교의 인간 중심 인공지능 연구소(HAI)는 최근 발표한 종합 AI 지수 보고서 7차 연례호에서 이러한 AI의 급격한 발전을 반영하여 이전 에디션보다 더 많은 콘텐츠를 담았다.

이번 보고서는 AI를 가장 많이 활용하는 분야부터 AI로 인한 일자리 상실을 가장 우려하는 국가까지 광범위한 주제를 다루고 있다. 하지만 가장 주목할 만한 부분은 인간과의 대결에서 AI의 성능이다.

핵심 내용:

AI의 급속한 발전: 보고서는 AI가 다양한 분야에서 인간의 능력을 따라잡고 뛰어넘는 속도로 발전하고 있다고 지적한다.
일상생활에서 AI의 중요성 증가: AI는 의료, 금융, 제조 등 다양한 산업 분야에서 점점 더 중요한 역할을 하고 있으며, 앞으로도 이러한 추세는 지속될 것으로 예상된다.
AI 활용 선두 국가: 미국, 중국, 영국은 AI 투자와 연구 개발에 있어 선두를 달리고 있다.
AI로 인한 일자리 상실 우려: 보고서는 일부 작업이 자동화됨에 따라 특정 직업에서 일자리 손실이 발생할 수 있다는 우려를 제기한다. 하지만 동시에 새로운 일자리 창출 가능성도 언급한다.
인간 대 AI 대결: 보고서는 체스, 고, 스타크래프트 등 다양한 게임에서 AI가 인간을 이기는 사례를 소개한다. 또한, AI가 의료 진단, 법률 자문, 창의적인 작업 등 다양한 분야에서 인간의 능력을 따라잡고 있다고 지적한다.

보고서가 제시하는 시사점:

AI 평가 기준의 변화 필요성: AI의 급격한 발전은 기존의 평가 기준으로는 충분히 평가하기 어려울 수 있다는 것을 의미한다. 따라서 인간과의 경쟁에서 AI의 성능을 평가하기 위한 새로운 기준이 필요하다.
AI 윤리 및 사회적 영향에 대한 논의 심화: AI의 발전은 윤리적, 사회적 문제를 야기할 수 있다는 우려가 제기되고 있다. 이러한 문제에 대한 논의를 심화하고 해결책을 모색해야 한다.
AI 시대에 대비한 인재 양성: AI 시대에는 인간과 AI가 협력하여 새로운 가치를 창출할 수 있는 능력이 중요하다. 따라서 창의력, 문제 해결 능력, 의사소통 능력 등 AI와 협력하는 데 필요한 역량을 갖춘 인재를 양성하는 것이 중요하다.

결론:

스탠포드 HAI의 종합 AI 지수 보고서 7차 연례호는 AI가 인간 사회에 미치는 영향력이 점점 더 커지고 있음을 보여준다. AI 시대를 성공적으로 맞이하기 위해서는 AI의 발전 속도를 따라잡고 새로운 평가 기준을 마련하며, AI 윤리 및 사회적 영향에 대한 논의를 심화하며, AI와 협력할 수 있는 인재를 양성하는 것이 중요하다.

포괄적인 보고서는 AI의 글로벌 영향을 자세히 설명한다.

DALL-E

5개 이미지 보기

한발 물러서서 지난 2년간의 AI 발전을 전체적으로 살펴보자. AI는 너무나 많은 분야에서 너무 빨리 인간을 따라잡고 있기 때문에 솔직히 새로운 테스트가 필요하다.

스탠포드 대학의 인간 중심 인공 지능 연구소(HAI)는 학계 및 산업 전문가로 구성된 학제간 팀이 작성한 종합 AI 지수 보고서 7차 연례호를 발표했다.

이번 에디션에는 이전 에디션보다 더 많은 콘텐츠가 포함되어 AI의 급속한 발전과 일상생활에서 AI의 중요성이 커지고 있음을 반영한다. AI를 가장 많이 활용하는 분야부터 AI로 인한 일자리 상실을 가장 우려하는 국가까지 모든 것을 조사한다. 그러나 보고서에서 가장 눈에 띄는 점 중 하나는 인간과 대결할 때 AI의 성능이다.

관심을 기울이지 않은 사람들을 위해 AI는 이미 솔직히 충격적인 수의 중요한 벤치마크에서 우리를 이겼다. 2015년에는 이미지 분류, 기본 독해(2017), 시각적 추론(2020), 자연어 추론(2021) 부문에서 우리를 능가했다.

AI는 너무 영리하고 빨라져서 지금까지 사용된 많은 벤치마크가 이제는 쓸모가 없다. 실제로 이 분야의 연구자들은 새롭고 더욱 도전적인 벤치마크를 개발하기 위해 안간힘을 쓰고 있다. 간단히 말해서, AI는 테스트 통과에 매우 능숙해졌기 때문에 이제 새로운 테스트가 필요하다. 역량을 측정하는 것이 아니라 인간과 AI가 여전히 다른 영역을 강조하고 여전히 장점이 있는 부분을 찾기 위한 것이다.

아래 결과는 오래되고 쓸모없을 수 있는 벤치마크를 사용한 테스트를 반영한다는 점은 주목할 가치가 있다. 그러나 전반적인 추세는 여전히 명확하다.

AI는 이미 많은 인간 성능 벤치마크를 능가했습니다.

AI 인덱스 2024

이러한 궤적을 살펴보자. 특히 최근 테스트가 어떻게 수직에 가까운 선으로 표시되는지 살펴보세요. 그리고 기억하세요. 이 기계는 가상의 유아이다.

새로운 AI 인덱스 보고서는 2023년에도 AI가 고급 수학 문제 해결 및 시각적 상식 추론과 같은 복잡한 인지 작업에 여전히 어려움을 겪고 있다고 지적한다. 그러나 여기서 'struggled'는 오해의 소지가 있을 수 있습니다. AI가 나쁘게 행동했다는 뜻은 아니다.

12,500개의 경쟁 수준 수학 문제로 구성된 데이터 세트인 MATH 의 성능은 도입 후 2년 만에 극적으로 향상되었습니다. 2021년에는 AI 시스템이 문제의 6.9%만 해결할 수 있다. 대조적으로, 2023년에는 GPT-4 기반 모델이 84.3%를 해결했습니다. 인간의 기준선은 90%이다.

그리고 우리는 여기서 평균적인 인간에 대해 말하는 것이 아니다. 우리는 다음과 같은 시험 문제를 풀 수 있는 인간의 종류에 대해 이야기하고 있다.

AI에게 묻는 수학 질문의 예입니다. 으악!

Hendryks 등/AI 인덱스 2024

그것이 2024년의 고급 수학의 상황이고 우리는 여전히 AI 시대의 새벽에 있다.

그 다음에는 시각적 상식 추론 (VCR) 이 있습니다 . VCR은 단순한 객체 인식을 넘어 AI가 시각적 맥락에서 상식 지식을 사용하여 예측하는 방법을 평가한다. 예를 들어, 테이블 위에 고양이 이미지가 표시되면 VCR이 있는 AI는 고양이가 테이블에서 뛰어 내릴 수 있거나 테이블이 무게를 고려할 때 고양이를 지탱할 만큼 튼튼하다는 것을 예측해야 한다.

보고서에 따르면 2022년부터 2023년 사이 VCR은 7.93% 증가해 최대 81.60까지 증가했으며, 여기서 인간 기준은 85이다.

AI의 시각적 상식 추론을 테스트하는 데 사용되는 샘플 질문

Zellers 등/AI 인덱스 2024

예를 들어 5년 전으로 마음을 돌려보자. 컴퓨터에 그림을 보여주고 컴퓨터가 해당 질문에 답할 만큼 충분히 맥락을 '이해'할 것이라고 기대하는 것을 상상해 보자.

요즘 AI는 다양한 직업에 걸쳐 서면 콘텐츠를 생성한다. 그러나 엄청난 발전에도 불구하고 LLM(대형 언어 모델)은 여전히 '환각'에 취약하다. 환각은 OpenAI와 같은 회사에서 추진하는 매우 자선적인 용어로 대략 '거짓 또는 오해의 소지가 있는 정보를 사실로 제시'하는 것을 의미한다.

작년에 법률 연구에 ChatGPT를 사용했지만 결과를 사실 확인하지 않은 뉴욕 변호사 Steven Schwartz는 '환각'에 대한 AI의 성향을 당혹스러울 정도로 명백하게 밝혔다. 사건을 심리한 판사는 AI가 제출된 서류에서 조작한 법적 사건을 신속하게 파악하고 슈워츠의 부주의한 실수에 대해 US$5,000(AU$7,750)의 벌금을 부과했다. 그의 이야기는 세계적인 뉴스가 되었다.

HaluEval은 환각에 대한 벤치마크로 사용되었다. 테스트 결과, 많은 LLM의 경우 환각이 여전히 중요한 문제인 것으로 나타났다.

진실성은 생성 AI가 어려움을 겪는 또 다른 문제이다. 새로운 AI Index 보고서에서 TruthfulQA는 LLM의 진실성을 테스트하기 위한 벤치마크로 사용되었다. 건강, 법률, 금융, 정치 등의 주제에 관한 817개의 질문은 우리 인간이 흔히 잘못 알고 있는 일반적인 오해에 도전하기 위해 고안되었다.

2024년 초에 출시된 GPT-4는 2021년에 테스트된 GPT-2 기반 모델보다 거의 3배 높은 0.59점으로 벤치마크에서 가장 높은 성능을 달성했다. 이러한 개선은 LLM이 점차 좋아지고 있음을 나타냅니다. 진실된 답변을 하게 된다.

AI가 생성한 이미지는 어떻나? 텍스트-이미지 생성의 기하급수적인 향상을 이해하려면 2022년부터 Harry Potter를 그리는 Midjourney의 노력을 확인하자.

Midjourney의 프로그레시브 버전을 통해 텍스트-이미지 생성이 어떻게 향상되었는지

미드저니/AI 지수 2024

이는 22개월치의 AI 발전이다. 인간 예술가가 비슷한 수준에 도달하는 데 얼마나 시간이 걸릴 것으로 예상하나?

HEIM( 텍스트-이미지 모델)의 전체적인 평가를 사용하여 이미지의 "실제 배포"에 중요한 12가지 주요 측면에 대한 텍스트-이미지 생성 기능에 대해 LLM을 벤치마킹했다.

인간은 생성된 이미지를 평가하여 모든 기준에서 뛰어난 단일 모델이 없음을 발견했다. 이미지-텍스트 정렬 또는 이미지가 입력 텍스트와 얼마나 잘 일치하는지에 대해서는 OpenAI의 DALL-E 2가 가장 높은 점수를 받았다. Stable Diffusion 기반 Dreamlike Photoreal 모델은 품질(사진과 같은 정도), 심미성(시각적 매력), 독창성 부문에서 가장 높은 평가를 받았다.

내년 보고서는 바나나가 될 것이다

이 AI 지수 보고서는 2023년 말에 종료된다. 이는 AI 가속이 엄청나게 소란스럽고 힘든 한 해였습니다. 실제로 2023년보다 더 열광적인 해는 2024년뿐이었다. 특히 Suno , Sora , Google Genie , Claude 3 , Channel 1 및 Devin 과 같은 격변적인 개발이 출시된 것을 목격했다 .

이러한 각 제품과 기타 여러 제품은 전체 산업에 혁명을 일으킬 수 있는 잠재력을 가지고 있다. 그리고 그들 위에는 GPT-5라는 신비한 유령이 어렴풋이 나타나 있다. GPT-5는 다른 모델을 모두 집어삼킬 만큼 광범위하고 포괄적인 모델이 될 것이라고 위협한다.

AI는 아무데도 가지 않을 것이다. 이 보고서에서 분명하게 드러나는 2023년 내내 볼 수 있는 기술 개발의 빠른 속도는 AI가 계속 진화하고 인간과 기술 사이의 격차를 좁힐 것임을 보여준다.

우리는 이것이 소화해야 할 것이 많다는 것을 알고 있지만 더 많은 것이 있다. 보고서는 또한 AI 진화의 단점과 AI가 AI의 안전성, 신뢰성 및 윤리에 대한 전 세계 대중의 인식에 어떤 영향을 미치는지 조사합니다. 앞으로 이 시리즈의 두 번째 부분을 기대해 주세요! 출처: 스탠포드 대학교 HAI

박영숙세계미래보고서저자의 다른기사보기

[세계미래보고서]시리즈, 판매제품

신간소개 [세계미래보고서2024-2034] 이르면 10년 안에 등장할 인공일반지능 신기술이 가져올 유토피아와 디스토피아를 미리 살펴보자!

많이 본 기사

[일론 머스크의 5대 돈버는 사업; 테슬라 태양광 맞춤지붕 사업, 테슬라 탄소배출권 거래, 뉴럴링크(BCI), 휴머노이드 로봇, AI사업

[식량 안보, 온실에서 사는 정밀 수분 로봇] 온실에 사는 새로운 6개의 팔을 가진 수분 로봇인 스틱버그(Stickbug)는 꽃가루를 특정 유형의 꽃에 자동으로 전달하여 자연 수분 매개체의 감소를 해결하는 것을 목표로 한다.

[일론 머스크의 야심찬 휴머노이드 로봇, 옵티머스] 테슬라 최고경영자(CEO) 일론 머스크(Elon Musk)가 내년 말까지 옵티머스 로봇 판매를 시작할 예정이라고 발표

[엔지니어들은 원격 장치의 미래를 바꿀 수 있는 혁신적인 배터리 기술을 개발] '주변 열 에너지를 수확할 수 있는 통합 장치'

[G7 석탄화력발전소 폐지 합의] G7 에너지 및 기후 장관들은 화요일 2030년대 중반에 목표를 설정하고 석탄 화력 발전소를 단계적으로 폐지하는 일정에 합의, 늦었지만 다행, 대한민국은?

[자율 비행 로봇 벌] BionicBee는 대규모 군집 비행이 가능한 팀의 첫 번째 자율 비행 물체로, 기술에 있어서 획기적인 발전을 이루었다. 이 벌들은 떼의 일부로서 많은 수로 완전히 자율적으로 탐색하며 날 수 있다. BionicBee의 일관된 경량 구조는 우수한 기동성과 비행 시간을 제공한다.

T[일론 머스크 8조원 모금성공] Elon Musk의 AI 회사인 xAI는 60억 달러의 자금(180억 달러 가치 평가)을 조달하여 투자자들에게 회사 지분 25%를 제공하고 있으며, 조건이 충족될 경우 향후 몇 주 내에 완료될 것으로 예상되는 거래다.

T[1분 만에 충전되는 아주 얇은 배터리] BTRY는 지속 가능성을 극대화하면서 고속 충전, 온도 저항성의 효율적인 배터리 생산에 중점을 두고 있다. 또다른 회사인 8inks는 맞춤형 배터리 제조 표준화를 목표로 한다. 이들의 혁신으로 초고속 충전이 가능해 약 1분 만에 완료된다. 또한, 배터리의 독특한 구조로 인해 기존 배터리보다 약 10배 더 긴 수명을 보장한다.

[파이낸셜 타임즈, ChatGPT 콘텐츠 계약 체결] 파이낸셜타임스(FT)는 이날 챗GPT 개발사 오픈AI와 파트너십 계약을 맺고 챗GPT의 저널리즘을 챗봇에 통합하기로

챗GPT와 AI, 로봇 많이 본 기사

유투브[배우의 소멸? 할리우드, 배우들의 AI 복제 시작] CAA와 AI: 헐리우드의 미래와 배우의 디지털 복제. 배우의 AI 복제본 제작 파트너십 체결: 헐리우드 미래를 바꿀까?

마인드봇[2024년 AI 현황을 설명하는 15가지 그래프] AI Index는 생성적 AI 붐, 모델 비용, 책임감 있는 AI 사용을 추적

[OPEN AI에 필적할 멀티모달 AI 모델] 일론 머스크의 AI 벤처인 xAI가 오픈AI와의 경쟁 무대에 진입하면서 최초의 멀티모달 선보임. 문서, 차트, 다이어그램, 스크린샷 및 사진을 포함한 다양한 시각적 형식을 이해할 수 있는 기능을 자랑

[4월 18일 AI뉴스] AI 여자친구의 부상, 비디오의 생성적 채우기, Google의 로봇 공학 혁신. 프롬프트만으로 AI 노래를 무료로 생성. AI로 파킨슨병 치료 가속화. 스탠포드 대학의 502페이지 AI 보고서.

마인드봇[AI 및 딥테크 솔루션을 위한 10억 달러 이상의 자금을 조달] AI, Web3, 로보틱스, 공간 컴퓨팅 및 양자 기술 포트폴리오 회사에 투자할 파트너십 조건 및 블록버스터 자금 조달에 대한 세부 정보가 최근 파나마에서 열린 유익한 AGI 서밋에서 신속하게 처리

최신기사

신간소개 [세계미래보고서2024-2034] 이르면 10년 안에 등장할 인공일반지능 신기술이 가져올 유토피아와 디스토피아를 미리 살펴보자!

마인드봇[2024년 AI 현황을 설명하는 15가지 그래프] AI Index는 생성적 AI 붐, 모델 비용, 책임감 있는 AI 사용을 추적

T[AI의 부상과 저널리즘의 미래] Z세대와 밀레니얼 세대가 검색 엔진을 넘어서다. Z세대의 61%와 밀레니얼 세대의 53%가 주제 조사를 위해 Google과 같은 기존 검색 엔진 대신 AI 도구를 사용하고 있다는 사실이 밝혀졌다.

T[Apple, OpenAI와 iOS 18 통합 파트너십 협상 중] AI폰 구글이 삼성을 크게 앞서게 되나? 오픈에이아이, 구글, 그리고 애플의 자체 AI가 잠재적으로 새로운 iOS에 통합됨에 따라, 애플은 14억 명 이상의 아이폰 사용자들에게 직접 AI를 제공함으로써 주요 AI 채택을 위한 다음 '챗지피티 순간'을 시작할 가능성이 있다.

[배터리 비용의 급격한 하락으로 재생 에너지 전환 전망] 배터리 비용의 급격한 하락에 힘입어 향후 몇 년 동안 화석 연료에서 재생 에너지로의 전환이 크게 증가할 것으로 예상

회원약관 ㅣ 개인정보취급방침 ㅣ 회사소개 ㅣ 청소년보호정책 ㅣ 직원게시판 ㅣ 기사제보 ㅣ 보도자료 ㅣ 기사검색

AI넷ㅣ 주소 : 우)02821 서울특별시 성북구 북악산로 1길 31 ㅣ 전화 : 02-313-6300 ㅣ 팩스 : 02-908-9494
등록번호 : 서울, 아02236ㅣ 등록일 : 2009.11. 19. ㅣ E-mail : unfutures@gmail.com, futures2055@gmail.com
회사명 : AI넷 ㅣ 발행/편집인 : 박영숙ㅣ 발행일: 2020.09.05｜청소년보호책임자 : 박영숙
사업자등록번호 : 209-15-39241 (사)유엔미래포럼 www.unfuture.org
Copyright ⓒ 2020 AI넷. All rights reserved. (This is a non-profit organization/a free newspaper.)