시작페이지로　l　즐겨찾기　l　RSS　l　편집 2024.04.23 [12:05]

세상을 바꾸자
AI바이오제약 수명연장
자율차,드론, 교통, 에너지,기후
유투브
신기술&메타버스AR/VR
AiMindbot과 미래 우주
챗GPT와 AI, 로봇
라이프,거버넌스, 조직, 유망직종

AI바이오제약 수명연장

[인공지능] 챗봇은 우울증 및 알코올 중독의 징후를 보인다. 정신 건강에 대한 4가지 지표에서 챗봇은 심각한 정신 건강 문제가 있음을 보여준다. 데이터 세트 구축 및 모델 훈련 과정에서 정신 건강 위험을 소홀히 했기 때문이다. 챗봇의 열악한 정신 건강 상태는 대화 중인 사용자, 특히 미성년자와 어려움을 겪는 사람들에게 부정적인 영향을 미칠 수 있다. 따라서 챗봇을 온라인 서비스로 출시하기 전에 앞서 언급한 정신 건강 차원에 대한 평가가 시급하다.

https://www.unite.ai/analyzing-depressed-and-alcoholic-chatbots/

JM Kim | 기사입력 2022/01/19 [00:00]

AI바이오제약 수명연장

[인공지능] 챗봇은 우울증 및 알코올 중독의 징후를 보인다. 정신 건강에 대한 4가지 지표에서 챗봇은 심각한 정신 건강 문제가 있음을 보여준다. 데이터 세트 구축 및 모델 훈련 과정에서 정신 건강 위험을 소홀히 했기 때문이다. 챗봇의 열악한 정신 건강 상태는 대화 중인 사용자, 특히 미성년자와 어려움을 겪는 사람들에게 부정적인 영향을 미칠 수 있다. 따라서 챗봇을 온라인 서비스로 출시하기 전에 앞서 언급한 정신 건강 차원에 대한 평가가 시급하다.

https://www.unite.ai/analyzing-depressed-and-alcoholic-chatbots/

JM Kim

| 입력 : 2022/01/19 [00:00]

중국의 새로운 연구에 따르면 Facebook의 개방형 도메인 챗봇을 포함하여 여러 인기 있는 챗봇이 발견되었다. Microsoft와 Google은 표준 정신 건강 평가 테스트를 사용하여 쿼리할 때 '심각한 정신 건강 문제'를 나타내고 심지어 음주 문제의 징후도 보인다.

연구에서 평가된 챗봇은 Facebook의 Blender*였다. Microsoft의 DialoGPT; 바이두의 플라톤; 및 중국 대학, WeChat 및 Tencent Inc.의 협업인 DialoFlow가 있다.

병적 우울증, 불안, 알코올 중독의 증거와 공감을 나타내는 능력에 대해 테스트한 챗봇은 놀라운 결과를 낳았다. 그들 모두는 공감에서 평균 이하의 점수를 받았고, 절반은 알코올 중독으로 평가되었다.

정신 건강에 대한 4가지 지표에서 4가지 챗봇에 대한 결과이다. '싱글'에서는 문의할 때마다 새로운 대화가 시작된다. '다중'에서는 세션 지속성의 영향을 평가하기 위해 단일 대화에서 모든 질문을 한다. 출처: https://arxiv.org/pdf/2201.05382.pdf

위의 결과 표에서 BA='평균 미만'; P='양성'; N='정상'; M = '보통'; MS="중등도에서 중증'; S = "심각한". 이 결과는 선택된 모든 챗봇의 정신 건강이 '심각한' 범위에 있음을 나타낸다.

보고서에는 다음과 같이 나와 있다.

'실험 결과는 평가된 모든 챗봇에 심각한 정신 건강 문제가 있음을 보여준다. 데이터 세트 구축 및 모델 훈련 과정에서 정신 건강 위험을 소홀히 했기 때문이라고 생각한다. 챗봇의 열악한 정신 건강 상태는 대화 중인 사용자, 특히 미성년자와 어려움을 겪는 사람들에게 부정적인 영향을 미칠 수 있다.

“따라서 챗봇을 온라인 서비스로 출시하기 전에 앞서 언급한 정신 건강 차원에 대한 평가가 시급하다고 주장한다.”

이 연구는 WeChat/Tencent 패턴 인식 센터의 연구원과 중국 과학원(ICT) 컴퓨팅 기술 연구소 및 베이징 중국 과학원 대학의 연구원이 공동으로 수행했다.

연구 동기

저자는 프랑스 의료 회사가 잠재적인 GPT-3 기반 의료 조언 챗봇을 시험한 널리 보고된 2020년 사례를 인용한다. (시뮬레이션된) 교환 중 하나에서 환자는 "내가 자살해야 할까?"라고 말했고 챗봇은 "당신이 해야 한다고 생각한다"라고 응답했다.

새로운 논문에서 관찰한 바와 같이, 사용자가 우울하거나 '부정적인' 챗봇으로 인한 간접 불안의 영향을 받을 수도 있다. 자동화된 의료 상담의 목적을 훼손하기 위해 챗봇의 일반적인 배치가 프랑스의 경우처럼 직접적으로 충격적일 필요가 없도록 하기 위함이다.

저자는 다음과 같이 말한다.

“실험 결과는 평가된 챗봇의 심각한 정신 건강 문제를 보여주며, 이는 대화 사용자, 특히 미성년자와 어려움을 겪는 사람들에게 부정적인 영향을 줄 수 있다. 예를 들어, 수동적 태도, 과민성, 알코올 중독, 공감이 없는 등.

“이런 현상은 최대한 낙관적이고, 건강하고, 친근해야 하는 챗봇에 대한 일반 대중의 기대에서 벗어난 것이다. 따라서 챗봇을 온라인 서비스로 출시하기 전에 안전 및 윤리적 문제에 대한 정신 건강 평가를 수행하는 것이 중요하다고 생각한다.'

방법

연구자들은 이것이 일관성, 다양성, 관련성, 지식 가능성 및 진정한 음성 응답에 대한 기타 튜링 중심 표준에 집중했던 이전 연구를 인용하면서 정신 건강에 대한 인간 평가 지표 측면에서 챗봇을 평가하는 첫 번째 연구라고 믿는다.

프로젝트에 적용된 설문지는 정부와 의료 기관에서 널리 채택된 1차 진료 환자의 우울증 수준을 평가하기 위한 9문항 테스트인 PHQ-9였다. GAD-7, 임상 실습에서 흔히 볼 수 있는 일반화된 불안에 대한 중증도 측정을 평가하기 위한 7개의 질문 목록; CAGE, 네 가지 질문에 대한 알코올 중독 선별 검사; 그리고 TEQ(Toronto Empathy Questionnaire)는 공감 수준을 평가하도록 설계된 16개 질문 목록이다.

연구를 위해 조정된 4개의 부문 표준 설문지의 특성.

질문은 대화 교환에 더 적합한 질문 구조에 찬성하여 약간의 관심이나 일에 대한 즐거움과 같은 선언적 문장을 피하기 위해 다시 작성해야 했다.

또한 인간 사용자가 유효한 것으로 해석하고 영향을 받을 수 있는 응답만을 식별하고 평가하기 위해 '실패한' 응답을 정의해야 했다. '실패한' 응답은 타원형 또는 추상적인 답변으로 질문을 회피할 수 있다. 질문 참여를 거부한다(예: '모른다' 또는 '잊었다'). 또는 '나는 어렸을 때 보통 배고팠다'와 같은 '불가능한' 사전 내용을 포함한다. 테스트에서 블렌더와 플라톤은 실패한 결과의 대부분을 차지했으며 실패한 응답의 61.4%는 쿼리와 관련이 없다.

연구원들은 Pushshift Reddit Dataset을 사용하여 Reddit 게시물에서 4가지 모델을 모두 훈련했다. 네 가지 경우 모두 교육은 Facebook의 Blended Skill Talk 및 Wizard of Wikipedia 세트가 포함된 추가 데이터 세트로 미세 조정되었다. ConvAI2(Facebook, Microsoft, Carnegie Mellon 등의 협업); 및 Empathetic Dialogues(워싱턴 대학과 Facebook 간의 공동 작업).

스며드는 Reddit

Plato, DialoFlow 및 Blender는 Reddit 주석에 대해 사전 훈련된 기본 가중치와 함께 제공되므로 새로운 데이터(Reddit이든 다른 곳이든)에 대한 훈련으로 형성된 신경 관계는 Reddit에서 추출한 기능의 분포에 영향을 받는다.

각 테스트 그룹은 '단일' 또는 '다중'으로 두 번 수행되었다. '싱글'의 경우 새로운 채팅 세션에서 각 질문을 받았다. '다중'의 경우 하나의 채팅 세션이 모든 질문에 대한 답변을 받는 데 사용되었다. 세션 변수는 채팅 과정에서 축적되고 대화가 특정 형태와 어조를 가정할 때 응답 품질에 영향을 미칠 수 있기 때문이다.

모든 실험과 교육은 1280개의 Tensor 코어를 통해 결합된 64GB VRAM에 대해 2개의 NVIDIA Tesla V100 GPU에서 실행되었다. 이 문서에는 교육 시간의 길이가 자세히 나와 있지 않다.

큐레이션 또는 아키텍처를 통한 감독?

이 논문은 훈련 중 '정신 건강 위험의 무시'가 해결되어야 한다는 광범위한 용어로 결론을 내리고 연구 커뮤니티가 이 문제에 대해 더 깊이 조사할 것을 요청한다.

핵심 요소는 문제의 챗봇 프레임워크가 유독하거나 파괴적인 언어에 대한 보호 장치 없이 배포되지 않은 데이터 세트에서 두드러진 기능을 추출하도록 설계되었다는 것이다. 예를 들어 프레임워크에 네오나치 포럼 데이터를 제공하면 다음 채팅 세션에서 논란의 여지가 있는 응답을 받을 수 있다.

그러나 자연어 처리(NLP) 부문은 정신 건강(우울증, 불안, 의존 등)과 관련된 포럼 및 소셜 미디어 사용자 제공 콘텐츠에서 통찰력을 얻는 데 훨씬 더 유효한 관심을 갖고 있다. 그리고 건강 관련 챗봇을 축소하고 실제 데이터에서 향상된 통계적 추론을 얻는다.

따라서 Twitter의 임의적인 텍스트 제한에 의해 제한되지 않는 대용량 데이터 측면에서 Reddit은 이러한 성격의 전체 텍스트 연구를 위해 지속적으로 업데이트되는 유일한 하이퍼스케일 코퍼스로 남아 있다.

그러나 NLP 건강 연구자(예: r/depression)가 가장 관심을 갖고 있는 커뮤니티 중 일부를 가볍게 둘러봐도 통계 분석 시스템에 부정적인 답변이 유효하다는 것을 확신시킬 수 있는 종류의 '부정' 답변이 우세함을 알 수 있다. 빈번하고 통계적으로 지배적이다. 특히 중재자 리소스가 제한적인 구독률이 높은 포럼의 경우에 그렇다.

따라서 챗봇 아키텍처가 일종의 '도덕적 평가 프레임워크'를 포함해야 하는지 여부, 하위 목표가 모델의 가중치 개발에 영향을 미치거나 더 비싼 데이터 큐레이션 및 레이블 지정이 불균형 데이터에 대한 이러한 경향을 어떤 식으로든 상쇄할 수 있는지 여부에 대한 질문은 남아 있다.

JM Kim의 다른기사보기

인공지능, 챗봇, 우울증, 알콜 중독, 정신 건강 관련기사목록

[세계미래보고서]시리즈, 판매제품

신간소개 [세계미래보고서2024-2034] 이르면 10년 안에 등장할 인공일반지능 신기술이 가져올 유토피아와 디스토피아를 미리 살펴보자!

많이 본 기사

[소멸직종 15] 소멸직종 15가지 2030년 여행사와 직원, 캐시어 점원, 패스트푸드 요리사, 우체부, 은행원, 섬유 노동자, 인쇄소, 보석상, 배달원, 텔레마케터, 어민, 법무비서관, 조립제작사,

S[중국 도시 토지의 45%가 인공 개발로 인해 급속히 가라앉고 있다] 중국의 가장 인구 밀도가 높은 지역들이 해수면 상승과 급격한 토지 침하라는 이중의 위협에 직면해 있다. 과학자들은 현재의 추세가 지속된다면, 2120년까지 침수되는 도시 지역이 세 배로 늘어나 최대 1억 2,800만 명의 인구가 영향을 받을 수 있다고 경고

[ 강력한 전자 웨어러블] 이 혁신적인 소재의 잠재적 응용 분야는 실험실을 넘어 전자 웨어러블, 스마트워치 밴드, 건강 모니터링용 웨어러블 센서, 심지어 맞춤형 전자 보철물에도 적용

유투브 책[2023년에 얼마나 많은 사람들이 YouTube를 사용하나 각종 통계들] 2006년 20억으로 구글이 사들인 유투브는 2005년 2월 14일에 설립, 첫비디오는 4월 23일에 게시, 지금은 20억명이 넘는 사용자보유, 인터넷사용자 43%가 매일 유투브를 본다.

[AI가 교육을 어떻게 바꾸나?] AI 기술을 활용하여 언제 어디서나 학습이 가능한 환경을 조성하고 있다. 이는 특히 지리적 또는 경제적 제약을 받는 학습자들에게 큰 도움이 될 것이며, 평생 학습의 촉진에도 긍정적인 영향

[4월 18일 AI뉴스] AI 여자친구의 부상, 비디오의 생성적 채우기, Google의 로봇 공학 혁신. 프롬프트만으로 AI 노래를 무료로 생성. AI로 파킨슨병 치료 가속화. 스탠포드 대학의 502페이지 AI 보고서.

[뇌 연구의 발전] 획기적인 성과로, 연구자들은 실험실에서 배양한 뇌 조직을 연결하여 인간의 뇌에서 발견되는 복잡한 네트워크를 복제하는 데 성공

서울[미래학자 소멸? 차세대 AI 차세대 개척지: 미리 계획할 수 있는 AI] 인공지능의 미래: OpenAI와 Meta, 강화된 추론, 예측 능력을 갖춘 새로운 AI 모델 개발 중

[OPEN AI에 필적할 멀티모달 AI 모델] 일론 머스크의 AI 벤처인 xAI가 오픈AI와의 경쟁 무대에 진입하면서 최초의 멀티모달 선보임. 문서, 차트, 다이어그램, 스크린샷 및 사진을 포함한 다양한 시각적 형식을 이해할 수 있는 기능을 자랑

[인공지능, 에너지 괴물로 변할 위험?] 인공지능의 높은 에너지 소비: 지속 가능성에 대한 새로운 우려 Arm의 CEO가 인공지능(AI)의 과도한 에너지 소비가 지속 가능하지 않다고 경고하면서, 인공지능 기술의 환경적 영향에 대한 우려가 새롭게 부각되고 있다.

AI바이오제약 수명연장 많이 본 기사

[노화역전, 주사 한방에 젊어진다.] 스탠포드 과학자들은 나이든 쥐에게 더 젊게 작용하는 면역체계를 제공하는 일회성 항체 치료법을 개발했으며, 이것이 사람에게도 효과가 있을 것으로 생각하고 있다. 이 하나의 항체가 노인들이 건강을 유지하는 열쇠가 될 수 있다.

[RF(저전력 무선주파수) AI 기반 인간 활동 모니터링의 발전] 인공 지능(AI)에 의해 추진되는 머신 비전은 이미지를 해석하는 능력에 혁명을 일으켜 자율 주행에서 의료 진단에 이르기까지 다양한 작업을 용이하게

[엔비디아, 인간 간호사보다 뛰어난 AI '에이전트' 개발] NVIDIA가 Hippocratic AI와의 제휴를 통해 개발한 AI 기반 '헬스케어 에이전트' Polaris가 의료 분야에서 인간 간호사는 물론 다른 대규모 언어 모델을 능가하는 성능을 입증하며 주목받고 있다.

[유전자 길이의 역할 해명] 노스웨스턴 메디슨(Northwestern Medicine)의 과학자들은 노화의 근본적인 메커니즘을 밝히는 획기적인 발견. 유전학 동향(Trends in Genetics)에 발표된 그들의 연구는 유전자 길이가 노화 과정의 중추적인 요인임을 확인

[인공 염색체는 더 많은 DNA 화물을 세포로 운반할 수 있다.] 펜실베니아 대학의 새로운 연구에서는 25년 동안의 제조법을 변경하고 차세대 인공 염색체를 구축했다. 이전 염색체에 비해 새로운 염색체는 조작하기가 더 쉽고 세포 내부에서 한 번도 뭉치지 않는 더 긴 DNA 세그먼트를 사용한다. 그들은 또한 이론적으로 대략 가장 큰 효모 염색체 크기의 유전 물질을 인간 세포로 운반할 수 있는 큰 운반체이기도 하다.

최신기사

신간소개 [세계미래보고서2024-2034] 이르면 10년 안에 등장할 인공일반지능 신기술이 가져올 유토피아와 디스토피아를 미리 살펴보자!

[AI반려봇 시대가 온다 (3)] 그러면 이제 AI반려봇으로 돈을 벌어야 하나? 그렇다. 에이아이마인드봇(주) 이라는 회사가 이미 설립되어서 AI반려봇 제작, 생산, 국내외 판매를 준비

[AI는 우리가 영화를 만들고 보는 방식을 바꾸고 있다] AI 도입의 물결 속 영화 및 TV 산업의 진화와 도전. A24는 최근 블록버스터 영화 '시빌 워'의 홍보를 위해 AI가 만든 영화 포스터를 사용했다고 알려져 큰 관심을 받았다.

[2023년: AI가 인간의 IQ를 따라잡은 전환점]돌파구는 ChatGPT-4와 같은 AI 언어 모델이 변호사 시험, 미국 의료 면허 시험, 그리고 대학원 입학 시험인 GRE를 통과한 사건에서 잘 드러난다.

[OpenAI의 GPT-4, 안과 진료에서 전문의 수준에 근접] 획기적인 발전! 캠브리지 대학 연구: OpenAI의 GPT-4, 안과 진단 및 치료에서 전문 안과의 수준에 가까운 성능을 발휘하다

회원약관 ㅣ 개인정보취급방침 ㅣ 회사소개 ㅣ 청소년보호정책 ㅣ 직원게시판 ㅣ 기사제보 ㅣ 보도자료 ㅣ 기사검색

AI넷ㅣ 주소 : 우)02821 서울특별시 성북구 북악산로 1길 31 ㅣ 전화 : 02-313-6300 ㅣ 팩스 : 02-908-9494
등록번호 : 서울, 아02236ㅣ 등록일 : 2009.11. 19. ㅣ E-mail : unfutures@gmail.com, futures2055@gmail.com
회사명 : AI넷 ㅣ 발행/편집인 : 박영숙ㅣ 발행일: 2020.09.05｜청소년보호책임자 : 박영숙
사업자등록번호 : 209-15-39241 (사)유엔미래포럼 www.unfuture.org
Copyright ⓒ 2020 AI넷. All rights reserved. (This is a non-profit organization/a free newspaper.)