시작페이지로　l　즐겨찾기　l　RSS　l　편집 2024.05.04 [01:23]

세상을 바꾸자
AI바이오제약 수명연장
자율차,드론, 교통, 에너지,기후
유투브
신기술&메타버스AR/VR
AiMindbot과 미래 우주
챗GPT와 AI, 로봇
라이프,거버넌스, 조직, 유망직종

챗GPT와 AI, 로봇

[Microsoft AI는 한 장의 사진으로 무서운 실제 유성 동영상을 만든다.] 마이크로소프트 VASA-1, 딥페이크 기술 또 한 단계 진화. Microsoft의 VASA-1 프레임워크는 또 다른 큰 도약처럼 보인다.

윤소정 | 기사입력 2024/04/21 [19:07]

챗GPT와 AI, 로봇

[Microsoft AI는 한 장의 사진으로 무서운 실제 유성 동영상을 만든다.] 마이크로소프트 VASA-1, 딥페이크 기술 또 한 단계 진화. Microsoft의 VASA-1 프레임워크는 또 다른 큰 도약처럼 보인다.

윤소정 | 입력 : 2024/04/21 [19:07]

Microsoft AI는 한 장의 사진으로 무서운 실제 유성 동영상을 만든다.

Microsoft Research Asia의 새로운 AI 모델: 사실적인 딥페이크 비디오 생성 기능 공개

Microsoft Research Asia가 단일 스틸 이미지와 오디오 트랙만으로 사실적인 딥페이크 비디오를 생성할 수 있는 새로운 AI 모델을 공개했다고 발표했다. 이 혁신적인 기술, VASA-1 프레임워크는 놀라운 발전을 이루었으며, 온라인 상의 정보를 어떻게 받아들여야 할지, 우리의 믿음을 어떻게 형성해야 할지에 대한 새로운 질문을 제기한다.

딥페이크 기술의 발전과 그 의미

이 새로운 AI 모델은 음성과 이미지를 결합하여 놀랍도록 사실적인 비디오를 생성한다. 이 기술은 온라인 콘텐츠의 진위를 판단하는 데 큰 도전을 제시하며, 가짜 뉴스 및 오보의 확산에 대한 우려를 새롭게 강조한다. 이미 인공지능 시스템은 주요 벤치마크에서 인간의 능력을 넘어섰으며, 이러한 기술의 발전은 많은 사람들이 직업에서 조기에 퇴출되거나 알고리즘으로 대체되는 것에 대한 불안을 증가시킨다.

스마트 장치의 변화와 생산성 도구로서의 역할

우리는 최근 스마트 장치가 단순한 기능을 넘어서 중요한 일상 비서 및 생산성 도구로 변모하는 것을 목격했다. 이러한 장치는 이제 무성 비디오 클립에 사실적인 음향 효과를 생성하거나 텍스트 프롬프트에서 멋진 영상을 만들어 낼 수 있는 능력을 갖추고 있다. 이는 기술의 급속한 발전이 일상 생활에 얼마나 깊숙이 통합되고 있는지를 보여준다.

도전과 기회

Microsoft의 VASA-1 프레임워크는 기술 발전에서 또 다른 큰 도약으로 보인다. 이 기술은 창의적인 콘텐츠 생성에 엄청난 잠재력을 가지고 있지만, 동시에 사회적, 윤리적 문제를 야기할 수 있다. 따라서 이와 같은 기술의 개발과 사용에는 철저한 규제와 책임 있는 접근이 필요하다.

결론적으로, Microsoft Research Asia의 이번 발표는 인공지능 기술이 인간 생활에 가져올 긍정적인 변화와 함께 그에 따른 윤리적, 사회적 책임의 필요성을 다시 한번 상기시킨다. 우리는 이 기술의 발전을 주시하며, 그것이 우리 사회에 미치는 영향을 심도 깊게 고민해야 할 것이다.

마이크로소프트, 단일 이미지와 오디오로 딥페이크 비디오 제작 가능한 AI 모델 공개…온라인 정보 신뢰도 급락 위기

마이크로소프트 리서치 아시아는 단일 정지 이미지와 오디오 트랙만으로도 놀랍도록 사실적인 딥페이크 영상을 생성할 수 있는 인공지능(AI) 모델을 공개했다. 이는 앞으로 우리가 온라인에서 보고 듣는 모든 정보를 얼마나 믿을 수 있을까 하는 심각한 질문을 던진다.

인공지능, 인간 능력 뛰어넘어

인공지능 시스템은 지난 몇 년 동안 주요 벤치마크에서 인간의 능력을 뛰어넘으며 빠르게 발전해 왔다. 이미 많은 사람들은 인공지능으로 인해 일자리가 사라지고 알고리즘으로 대체될 것이라는 우려를 표출하고 있다.

스마트 장치, 강력한 도구로 진화

최근에는 제한적이었던 스마트 장치들이 강력한 일상 비서와 중요한 생산성 도구로 진화하는 것을 목격했다. 또한, 무성 비디오 클립에 사실적인 음향 효과를 생성하고 텍스트 프롬프트만으로도 멋진 영상을 제작할 수 있는 모델들이 등장했다.

마이크로소프트 VASA-1, 딥페이크 기술 또 한 단계 진화

마이크로소프트가 개발한 VASA-1 프레임워크는 딥페이크 기술을 한 단계 더 진화시킨 것으로 보인다. VASA-1은 단순히 얼굴이나 목소리를 바꾸는 것이 아니라, 표정, 몸짓, 목소리 톤까지 사실적으로 변형하여 딥페이크 영상을 제작할 수 있다는 점에서 차별화된다.

온라인 정보 신뢰도 급락 위기

이러한 기술 발전은 온라인에서 소비되는 정보의 신뢰도를 크게 떨어뜨릴 수 있다. 누구나 쉽게 딥페이크 영상을 제작하여 허위 정보를 퍼뜨릴 수 있기 때문이다. 특히, 정치, 사회, 경제 등 중요한 분야에서 딥페이크 영상이 악용될 경우 심각한 사회적 혼란을 야기할 수 있다.

딥페이크 기술, 윤리적 사용 절실

따라서 딥페이크 기술의 윤리적 사용에 대한 논의가 더욱 중요해진다. 딥페이크 기술을 악용하지 않도록 막는 방안과 동시에, 딥페이크 기술을 긍정적인 목적으로 활용할 수 있는 방안을 모색해야 한다.

결론

마이크로소프트 VASA-1 프레임워크는 인공지능 기술의 놀라운 발전을 보여주는 동시에, 온라인 정보의 신뢰도를 급격히 떨어뜨릴 수 있는 위험성을 내포하고 있다. 딥페이크 기술의 윤리적 사용을 위한 사회적 합의와 제도적 장치 마련이 시급하다.

마이크로소프트, 사진 효과 생성을 위한 AI VASA-1 출시 - Vietnam.vn

페이스북

VASA-1 AI 모델은 오디오 트랙에 립싱크된 단일 참조 사진에서 사실적인 말하는 머리 비디오 영상을 생성할 수 있습니다.

VASA-1 AI 모델은 오디오 트랙에 립싱크된 단일 참조 사진에서 사실적인 말하는 머리 비디오 영상을 생성할 수 있다.

마이크로소프트 리서치 아시아

Microsoft의 VASA-1은 단 하나의 이미지에서 사실적인 말하는 얼굴을 생성할 수 있습니다 | 크립토폴리탄 Microsoft Research Asia는 단일 스틸 이미지와 오디오 트랙에서 놀랍도록 사실적인 딥페이크 비디오를 생성할 수 있는 AI 모델을 공개했다. 앞으로 우리가 온라인에서 보고 듣는 것을 어떻게 믿을 수 있을까?

앞서 언급했듯이 인공지능 시스템은 지난 몇 년 동안 주요 벤치마크에서 우리를 능가했으며 이미 많은 사람들이 조기에 퇴출되어 알고리즘으로 대체되는 것에 대해 매우 걱정하고 있다.

우리는 최근 상당히 제한적인 스마트 장치가 강력한 일상 비서 와 중요한 생산성 도구 로 변모하는 것을 목격했다. 그리고 무성 비디오 클립에 사실적인 음향 효과를 생성 하고 텍스트 프롬프트에서 멋진 영상을 생성할 수도 있는 모델이 있다. Microsoft의 VASA-1 프레임워크는 또 다른 큰 도약처럼 보인다.

VoxCeleb2 데이터 세트에서 약 6,000명의 실제 말하는 얼굴 장면으로 모델을 훈련한 후, 이 기술은 새로 애니메이션된 피사체가 제공된 음성 오디오 트랙에 정확하게 립싱크할 수 있을 뿐만 아니라 또한 하나의 정적 얼굴 사진에서 다양한 얼굴 표정과 자연스러운 머리 움직임을 볼 수 있다.

이는 몇 달 전에 등장한 Alibaba 지능형 컴퓨터 연구소의 Audio2Video 확산 모델과 매우 유사하지만 훨씬 더 사실적이고 정확하다. VASA-1은 초당 40프레임에서 512x512픽셀의 동기화된 비디오를 생성할 수 있으며 "시작 대기 시간은 무시할 수 있습니다."라고 한다.

VASA-1: Lifelike Audio-Driven Talking Faces Generated in Real Time

VASA-1 AI 모델은 제공된 음성 오디오 트랙에 립싱크할 수 있을 뿐만 아니라 얼굴 표정과 자연스러운 머리 움직임을 모두 포함하는 무서운 실제 비디오를 생성할 수 있다. 이 모든 것이 단일 정적 헤드 샷에서 가능하다.

마이크로소프트 리서치 아시아

프로젝트 데모에 사용된 모든 참조 사진은 StyleGAN2 또는 DALL-E에서 AI로 생성한 것이었지만 훈련 세트를 벗어나는 프레임워크의 능력을 보여주는 데 사용된 눈에 띄는 실제 사례가 하나 있다. 모나리자 !

프로젝트 페이지에는 스틸 이미지에서 생성되어 오디오 트랙과 일치하는 말하고 노래하는 비디오의 많은 예가 있지만 이 도구에는 감정, 표정, 가상 비디오캠과의 거리 등 " 얼굴 역학 및 머리 자세 "를 설정하는 옵션 컨트롤도 있다. 그리고 시선 방향. 강력한 것.

"AI가 생성한 말하는 얼굴의 출현은 기술이 인간-인간, 인간-AI 상호작용의 풍부함을 증폭시키는 미래를 향한 창을 제공합니다."라고 성과를 자세히 설명하는 논문의 서문이 나와 있다. "이러한 기술은 디지털 의사소통을 풍부하게 하고, 의사소통 장애가 있는 사람들의 접근성을 높이고, 대화형 AI 튜터링을 통해 교육 방법을 혁신하고, 의료 분야에서 치료 지원과 사회적 상호 작용을 제공할 수 있는 가능성을 담고 있습니다."

VASA-1: Lifelike Audio-Driven Talking Faces Generated in Real Time

모두 매우 칭찬할 만한 일이지만 연구자들은 오용의 가능성도 인정한다. 우리가 매일 접하는 온라인 뉴스를 소화할 때 노골적인 조작에서 사실을 걸러내는 것이 이미 불가능한 작업처럼 느껴지지만, 거의 모든 사람이 당신이 원하는 대로 말하는 것처럼 보이게 할 수 있는 도구를 마음대로 사용할 수 있다고 상상해 보자.

이는 좋아하는 할리우드 배우나 팝스타의 FaceTime을 사용해 친척에게 해롭지 않은 장난을 치는 행위, 온라인 자백을 게시하여 무고한 사람을 심각한 범죄에 연루시키는 행위, 소중한 손자의 모습을 취하여 누군가에게 돈을 요구하는 사기 행위로 나타날 수 있다. 주요 정치인들이 논쟁의 여지가 있는 안건을 지지하는 목소리를 내는 등의 문제가 있다. 현실적이고 설득력 있게.

그러나 VASA-1 모델에 의해 생성된 콘텐츠에는 "식별 가능한 인공물이 포함되어" 있으며 연구원들은 "해당 기술이 적절한 규정에 따라 책임감 있게 사용될 것이라는 확신이 있을 때까지" 플랫폼을 공개적으로 제공할 계획이 없다.

프로젝트를 자세히 설명하는 논문이 arXiv 서버 에 게시되었다. 출처: 마이크로소프트 리서치

윤소정의 다른기사보기

[세계미래보고서]시리즈, 판매제품

신간소개 [세계미래보고서2024-2034] 이르면 10년 안에 등장할 인공일반지능 신기술이 가져올 유토피아와 디스토피아를 미리 살펴보자!

많이 본 기사

[식량 안보, 온실에서 사는 정밀 수분 로봇] 온실에 사는 새로운 6개의 팔을 가진 수분 로봇인 스틱버그(Stickbug)는 꽃가루를 특정 유형의 꽃에 자동으로 전달하여 자연 수분 매개체의 감소를 해결하는 것을 목표로 한다.

[일론 머스크의 야심찬 휴머노이드 로봇, 옵티머스] 테슬라 최고경영자(CEO) 일론 머스크(Elon Musk)가 내년 말까지 옵티머스 로봇 판매를 시작할 예정이라고 발표

[엔지니어들은 원격 장치의 미래를 바꿀 수 있는 혁신적인 배터리 기술을 개발] '주변 열 에너지를 수확할 수 있는 통합 장치'

[자율 비행 로봇 벌] BionicBee는 대규모 군집 비행이 가능한 팀의 첫 번째 자율 비행 물체로, 기술에 있어서 획기적인 발전을 이루었다. 이 벌들은 떼의 일부로서 많은 수로 완전히 자율적으로 탐색하며 날 수 있다. BionicBee의 일관된 경량 구조는 우수한 기동성과 비행 시간을 제공한다.

T[일론 머스크 8조원 모금성공] Elon Musk의 AI 회사인 xAI는 60억 달러의 자금(180억 달러 가치 평가)을 조달하여 투자자들에게 회사 지분 25%를 제공하고 있으며, 조건이 충족될 경우 향후 몇 주 내에 완료될 것으로 예상되는 거래다.

[일론 머스크의 5대 돈버는 사업; 테슬라 태양광 맞춤지붕 사업, 테슬라 탄소배출권 거래, 뉴럴링크(BCI), 휴머노이드 로봇, AI사업

[G7 석탄화력발전소 폐지 합의] G7 에너지 및 기후 장관들은 화요일 2030년대 중반에 목표를 설정하고 석탄 화력 발전소를 단계적으로 폐지하는 일정에 합의, 늦었지만 다행, 대한민국은?

T[1분 만에 충전되는 아주 얇은 배터리] BTRY는 지속 가능성을 극대화하면서 고속 충전, 온도 저항성의 효율적인 배터리 생산에 중점을 두고 있다. 또다른 회사인 8inks는 맞춤형 배터리 제조 표준화를 목표로 한다. 이들의 혁신으로 초고속 충전이 가능해 약 1분 만에 완료된다. 또한, 배터리의 독특한 구조로 인해 기존 배터리보다 약 10배 더 긴 수명을 보장한다.

[4월 27일 AI뉴스] 머스크, xAI를 위해 (친구들로부터) 60억 달러 모금. 만능AI JAT 출시. AI뉴스앵커 대거출현. OpenAI 기반 iPhone.

[4월 25일 AI뉴스] AI 의사를 방문할 시간. Moderna는 ChatGPT Enterprise를 통해 결과를 확인. Apple, 온디바이스 AI용 OpenELM 공개 엘론 머스크: 테슬라는 AI 회사다 AI 지원 Gmail 쓰기 잠금 해제.

챗GPT와 AI, 로봇 많이 본 기사

유투브[배우의 소멸? 할리우드, 배우들의 AI 복제 시작] CAA와 AI: 헐리우드의 미래와 배우의 디지털 복제. 배우의 AI 복제본 제작 파트너십 체결: 헐리우드 미래를 바꿀까?

[음악가들이 AI 업계에 경고를 보낸다]음악계 거장들, AI 기술의 창작물 활용에 경고장 발송. 이들은 인공지능이 인간의 창의성을 향상시킬 잠재력을 인정하면서도, 인간을 대체하거나 인간의 수입을 감소시키는 모든 활동에 대해 단호히 반대

마인드봇[2024년 AI 현황을 설명하는 15가지 그래프] AI Index는 생성적 AI 붐, 모델 비용, 책임감 있는 AI 사용을 추적

[OPEN AI에 필적할 멀티모달 AI 모델] 일론 머스크의 AI 벤처인 xAI가 오픈AI와의 경쟁 무대에 진입하면서 최초의 멀티모달 선보임. 문서, 차트, 다이어그램, 스크린샷 및 사진을 포함한 다양한 시각적 형식을 이해할 수 있는 기능을 자랑

[4월 18일 AI뉴스] AI 여자친구의 부상, 비디오의 생성적 채우기, Google의 로봇 공학 혁신. 프롬프트만으로 AI 노래를 무료로 생성. AI로 파킨슨병 치료 가속화. 스탠포드 대학의 502페이지 AI 보고서.

최신기사

신간소개 [세계미래보고서2024-2034] 이르면 10년 안에 등장할 인공일반지능 신기술이 가져올 유토피아와 디스토피아를 미리 살펴보자!

마인드봇[2024년 AI 현황을 설명하는 15가지 그래프] AI Index는 생성적 AI 붐, 모델 비용, 책임감 있는 AI 사용을 추적

[일론 머스크의 5대 돈버는 사업; 테슬라 태양광 맞춤지붕 사업, 테슬라 탄소배출권 거래, 뉴럴링크(BCI), 휴머노이드 로봇, AI사업

AI, 기후위기대응, 탄소중립 실천의 핵으로 부상] AI 활용 기후위기극복, 탄소배출권 확보, 탄소세 책정 그리고 글로벌 갑부들의 청년 공동체 지원, AI 연계된 사업에 지원

[Georgia Tech와 Meta, 탄소 포집, AI 솔루션] 직접 공기 포집 기술의 경우 모든 환경과 위치에는 고유한 특정 설계가 필요. 텍사스의 직접 공기 포집 구성은 아이슬란드의 구성과 다를 수밖에 없다.

회원약관 ㅣ 개인정보취급방침 ㅣ 회사소개 ㅣ 청소년보호정책 ㅣ 직원게시판 ㅣ 기사제보 ㅣ 보도자료 ㅣ 기사검색

AI넷ㅣ 주소 : 우)02821 서울특별시 성북구 북악산로 1길 31 ㅣ 전화 : 02-313-6300 ㅣ 팩스 : 02-908-9494
등록번호 : 서울, 아02236ㅣ 등록일 : 2009.11. 19. ㅣ E-mail : unfutures@gmail.com, futures2055@gmail.com
회사명 : AI넷 ㅣ 발행/편집인 : 박영숙ㅣ 발행일: 2020.09.05｜청소년보호책임자 : 박영숙
사업자등록번호 : 209-15-39241 (사)유엔미래포럼 www.unfuture.org
Copyright ⓒ 2020 AI넷. All rights reserved. (This is a non-profit organization/a free newspaper.)