광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
로고

[2023년에 알아야 할 5가지 무료 ChatGPT 경쟁자들] ChatGPT는 사람들이 모든 종류의 사용 사례와 사용 방법에 대한 아이디어를 제시하면서 인터넷을 강타했다. 이 콘텐츠 중 많은 부분이 엉뚱하고 잘못된 정보로 동영상을 만드는 인플루언서의 산물이지만, 이 소문은 그러한 기술의 잠재력을 증명한다. 그러나 ChatGPT는 현재 API 및 액세스 제한 뒤에 있다. 꽤 멋진 일을 할 수 있지만 이러한 대규모 언어 모델을 사용하여 자신의 응용 프로그램을 구축하려는 사람에게는 더 많은 오픈 소스/액세스 솔루션이 중요하다.

https://medium.com/geekculture/5-free-chatgpt-competitors-you-should-know-about-for-2023-ff5fc48d0430

JM Kim | 기사입력 2023/01/31 [00:00]

[2023년에 알아야 할 5가지 무료 ChatGPT 경쟁자들] ChatGPT는 사람들이 모든 종류의 사용 사례와 사용 방법에 대한 아이디어를 제시하면서 인터넷을 강타했다. 이 콘텐츠 중 많은 부분이 엉뚱하고 잘못된 정보로 동영상을 만드는 인플루언서의 산물이지만, 이 소문은 그러한 기술의 잠재력을 증명한다. 그러나 ChatGPT는 현재 API 및 액세스 제한 뒤에 있다. 꽤 멋진 일을 할 수 있지만 이러한 대규모 언어 모델을 사용하여 자신의 응용 프로그램을 구축하려는 사람에게는 더 많은 오픈 소스/액세스 솔루션이 중요하다.

https://medium.com/geekculture/5-free-chatgpt-competitors-you-should-know-about-for-2023-ff5fc48d0430

JM Kim | 입력 : 2023/01/31 [00:00]

2022년은 머신러닝 및 AI 연구에 미친 해였다. Big Tech 회사는 개발자에게 많은 혜택을 줄 놀라운 라이브러리를 많이 출시했다. 우리는 거대 기술 회사와 소규모 그룹 모두에서 훌륭한 연구 논문을 보았다. 특히 AI의 대체 모드를 탐색할 수 있는 잠재력을 보여주는 자체 조립 AI에 대한 연구가 있었다.

 

그리고 물론 2022년은 대규모 언어 모델의 해였다. ChatGPT는 사람들이 모든 종류의 사용 사례와 사용 방법에 대한 아이디어를 제시하면서 인터넷을 강타했다. 이 콘텐츠 중 많은 부분이 엉뚱하고 잘못된 정보로 동영상을 만드는 인플루언서의 산물이지만, 이 소문은 그러한 기술의 잠재력을 증명한다. 그러나 ChatGPT는 현재 API 및 액세스 제한 뒤에 있다. 꽤 멋진 일을 할 수 있지만 이러한 대규모 언어 모델을 사용하여 자신의 응용 프로그램을 구축하려는 사람에게는 더 많은 오픈 소스/액세스 솔루션이 중요하다.

 

OPT

 

이 목록을 시작하기 위해 Open Pretrained Transformer 또는 OPT라고 하는 Meta GPT 버전을 공유한다. OPT에는 GPT를 대체할 수 있는 몇 가지 흥미로운 기능이 있다. 예를 들어 Zero-Shot NLP 평가의 경우 OPT GPT 모델과 매우 유사한 정확도를 보인다.

 

 

Source

 

또한 증오심 표현을 탐지하는 데 있어 OPT는 실제로 DaVinci(GPT-3의 업그레이드 버전)를 능가한다. 따라서 솔루션의 우선 순위가 높은 경우 OPT가 더 매력적인 옵션이 된다.

 

 

마크 주커버그의 메타버스 포부를 고려할 때 증오심 표현 감지에 중점을 두는 것은 완벽하다. 그들이 여기 얼마나 가까운지 분석했다. ( I analyzed how close they were here)

 

이 모델의 또 다른 흥미로운 측면은 에너지 효율성이다. 교육 OPT GPT-3 탄소 발자국의 1/7만 사용했다. 이를 통해 더 큰 시스템에서 기본 모델로 능동적으로 상호 작용할 수 있는 가능성이 향상된다.

 

우리는 GPT-3 1/7 탄소 발자국만을 사용하여 이 크기의 모델을 성공적으로 훈련하여 에너지 효율성을 염두에 두고 OPT-175B를 개발했다. 이는 Megatron-LM 내에서 Meta의 오픈 소스 FSDP(Fully Sharded Data Parallel) API NVIDIA의 텐서 병렬 추상화를 결합하여 달성했다. NVIDIA 80GB A100 GPU에서 ~147 TFLOP/s/GPU 사용률을 달성했으며, 이는 유사한 하드웨어에 대해 NVIDIA 연구원이 발표한 것보다 약 17% 더 높다.

 

이 목록에서 Meta를 다시 볼 수 있기를 기대한다. 모델, 교육 데이터, 로그 등을 공유하는 완전한 오픈 소스 접근 방식을 채택했다. 이것은 머신러닝 분야에 많은 영향을 미치는 전례 없는 움직임이다.

 

이것( OPT 모델)에 대해 자세히 알아보려면 다음문서(https://medium.com/discourse/metas-challenge-to-gpt-3-and-open-ai-149c9a1f766f)를 확인하라.

 

 

OPT 모델은 GPT의 대안으로 설계된 것으로 보인다는 점에서 GPT를 대체할 가능성이 많다. 그러나 Meta는 경주에서 말이 있는 유일한 테크 자이언트가 아니다.

 

AlphaSignal은 머신러닝의 최고 개발에 대한 무료 주간 요약이다. 그들은 AI를 사용하여 해당 분야의 최고 개발 순위를 매긴다. 한번 확인해 볼만하다.

 

여기에서 가입할 수 있다- https://alphasignal.ai/?referrer=Devansh

 

 

PALM

 

PaLM 모델이 놀라운 이유를 이해하려면 먼저 Pathways 생태계를 이해해야 한다. Pathways는 모든 대규모 언어 모델을 생성하는 Google 아키텍처이다. 이러한 세부 사항에 관심이 없고 PaLM 모델에 직접 들어가고 싶다면 조금 아래로 스크롤하라. 자세한 내용은 섹션 끝에 있다.

 

Google Pathways 생태계는 많은 팡파르와 함께 발표되었다. 그리고 올해 Flamingo, Gato 및 놀라운 PaLM(the Pathways Language Model)과 같은 모델을 통해 큰 성과를 거두었다. 이 모델은 머신러닝 공간을 뒤흔들었고 딥 러닝 및 트랜스포머에 대한 논의에 많은 기여를 했다.

 

 

https://www.youtube.com/shorts/WQknR9SgpHE

 

Google LLM에 대한 몇 가지 주요 통찰력과 AGI에 대한 가능한 디딤돌로서의 잠재력에 기여한 결과는 놀라웠다. 위의 비디오는 특정 작업에서 인간을 능가하는 모델의 예이다.

 

많은 사람들이 개별 모델 자체에 대해 이야기해 왔지만 진정한 혁신은 Pathways 아키텍처에 있다. Pathways 대규모 언어 모델 패러다임에 3가지 주요 기여를 한다.

 

1.Multi-Modal Training- Pathways 모델은 비디오, 그림 및 텍스트를 비롯한 여러 유형의 데이터에 대해 학습된다. 이것은 주로 텍스트 기반인 GPT와 매우 다르다.

 

2. 스파스 활성화 - 모든 추론에 전체 아키텍처를 사용하는 대신 하나의 작업에 뉴런의 하위 집합만 사용된다. 결과적으로 모델은 실행 비용을 낮게 유지하면서 많은 뉴런(더 나은 성능, 더 많은 작업)의 이점을 누릴 수 있다. 이것은 눈에 띄는 구성 요소였다. 다양한 희소 활성화 알고리즘을 살펴보고 여기서 가장 유망한 것에 대한 비디오를 만들었다.

 

3. 여러 감각의 사용 - 모델이 다양한 작업에 대해 여러 유형의 입력을 받을 수 있는 것은 한 가지이다. 모델이 동일한 작업에 대해 여러 종류의 입력을 사용하는 것이 훨씬 더 어렵다. Pathways 아키텍처를 사용하는 모델은 이를 수행할 수 있으므로 훨씬 더 큰 유연성을 제공한다.

 

다음 기사에서 Pathways 아키텍처와 그것이 미친 기능에 어떻게 기여하는지 자세히 살펴보았으니 더 자세히 알아보려면 확인하라.

 

https://medium.com/geekculture/google-ai-sparks-a-revolution-in-machine-learning-403f4dbf3e70

 

 

최근 누군가가 PaLM을 개선하기 위해 인간 피드백과 함께 강화 학습을 사용했다. 이것은 ChatGPT GPT-3에서 학습된 방식과 유사하다. 따라서 여러 면에서 이 설정은 ChatGPT보다 훨씬 나을 수 있다(다중 모달 기능을 염두에 두어야 한다). 운 좋게도 그들은 작업을 공유했으므로 아래 프로젝트를 확인할 수 있다.

 

https://github.com/lucidrains/PaLM-rlhf-pytorch

 

 

많은 인터넷 전문가들이 ChatGPT와 검색 엔진으로서 Google을 대체할 수 있는 잠재력에 대해 이야기해 왔다. 이것이 가능하지 않은 데에는 여러 가지 이유가 있다. 그러나 검색 공간에서 Google의 우위를 방해하는 데 더 적합한 다른 언어 모델이 있다. 그리고 그것은 그들의 라이벌 거대 기술 회사인 Meta에 의해 만들어졌다. 그들이 다시 나타날 것이라고 말했다.

 

 

AI, 소프트웨어 및 기술 산업에 대한 더 많은 통찰력을 얻으려면 내 뉴스레터를 확인하라. 내 뉴스레터에 대한 자세한 내용은 기사 끝에 있다.

 

Sphere

 

Meta의 머신러닝 연구원은 Sphere라는 새로운 LLM(Large Language Model)을 출시했다. 검색 관련 작업에 대한 놀라운 성능과 수십억 개의 문서를 분석할 수 있는 능력을 통해 Meta의 다른 NLP 작업과 결합하여 Meta는 검색 시장을 방해할 수 있는 좋은 위치에 있다.

 

Sphere는 질문에 답하기 위해 방대한 양의 정보를 탐색할 수 있다. 인용을 확인하고 콘텐츠와 더 잘 일치하는 대체 인용을 제안할 수도 있다. 다른 곳에서는 본 적이 없다.

 

 

이것이 당신을 흥분시키지 않는다고 말해달라. 출처-How AI could help make Wikipedia entries more accurate

 

Sphere의 기능은 흥미로운 잠재력을 제공한다. 다목적 검색 엔진으로서 Google을 대체하기에는 충분하지 않을 수 있다. 그러나 연구용 검색 엔진에 관해서는 이것은 신의 선물이 될 것이다. Sphere의 오픈 소스 특성을 통해 사람들은 모델이 검색하는 기본 코퍼스를 변경할 수 있다. 이것은 많은 유연성을 제공한다. 이 모델에 대한 조사를 기반으로 Sphere는 모든 LLM 모델 중에서 가장 상업적인 실행 가능성이 있는 모델이다.

 

Sphere에 대해 자세히 알아보고 싶은 분들을 위해 아래 기사에서 Sphere 모델 및 관련 간행물에 대한 자세한 분석을 수행했다.

 

https://medium.com/discourse/meta-ai-declares-war-on-google-1c7e58015813

 

 

BLOOM

 

Hugging Face에 설명된 대로 “BLOOM은 산업 규모의 계산 리소스를 사용하여 방대한 양의 텍스트 데이터에 대한 프롬프트에서 텍스트를 계속하도록 훈련된 자동 회귀 대형 언어 모델(LLM)이다. 이처럼 46개 언어와 13개 프로그래밍 언어로 사람이 쓴 텍스트와 거의 구별할 수 없는 일관된 텍스트를 출력할 수 있다. BLOOM은 명시적으로 훈련되지 않은 텍스트 작업을 텍스트 생성 작업으로 캐스팅하여 수행하도록 지시할 수도 있다.”

 

BLOOM GPT의 차이점을 발견할 수 없는 유일한 사람은 아니다. 이것은 사고가 아니다. BLOOM은 대형 모델에 대한 Big Tech 교착 상태를 방해하기 위해 만들어졌다. 지난 몇 년 동안 기술 회사는 일반 연구원/그룹이 복제할 수 없는 엄청난 양의 계산 능력을 사용하여 연구를 수행해 왔다. 이로 인해 독립적인 사람들이 Big Tech 기업이 내놓은 연구를 검증하고 비판하는 것이 불가능하다. 이로 인해 데이터 과학자는 종종 이러한 논문의 결과를 맥락에서 벗어나 비효율적이고 비용이 많이 드는 파이프라인을 생성하게 되었다.

 

 

https://huggingface.co/bigscience/bloom

 

BLOOM은 이에 대응하기 위한 시도였다. 사람들을 위한 모델이라고 생각하면 된다. Big Tech의 통제를 받지 않아 자유로운 연구를 촉진하는 모델이다. 따라서 ChatGPT에 대한 오픈 소스 대안을 찾고 있다면 BLOOM이 귀하의 요구에 맞는 모델이 될 수 있다. 나는 이 모델들이 멋지기 전인 6월경에 처음으로 그것을 취재하기 시작했다. 나는 그것으로 괜찮은 결과를 얻었다. ChatGPT(또는 이 목록에 있는 다른 것)만큼 강력하지는 않았지만 자유로운 성격을 감안할 때 초조한 십대들에게 어필할 수 있다.

 

Galactica

 

마지막으로 Meta의 또 다른 모델이 있다. 아니, 그들은 나에게 돈을 지불하지 않았다. Sphere가 연구원을 위한 Google이 될 수 있는 방법에 대해 어떻게 언급했는지 기억할까? 글쎄, 마크 주커보그는 한 번의 싸움을 선택하는 데 만족하지 않았다. 그는 또한 연구 인력을 대상으로 하는 ChatGPT와 동등한 기능을 가지고 있었다.

 

ChatGPT를 상상해보라. 많은 연구 텍스트에 대해 교육을 받았다. 이러한 모델은 수학 공식을 설명하고, 논문 작성을 돕고, Latex를 만드는 등의 작업을 수행할 수 있다. 이것이 바로 Galactica였다. 단순한 연구 관련 작업을 넘어 많은 일이 가능하다. Yannic Kilcher는 환상적인 비디오를 가지고 있으므로 자세한 내용을 알고 싶은 사람을 위해 아래에 링크하겠다.

 

https://youtu.be/ZTs_mXwMCs8

 

안타깝게도 이 모델에 대해 많은 논란이 있었고, 이로 인해 Meta가 이 모델을 중단하게 되었다. 그러나 그들이 곧 다시 가져오기를 바란다. 이에 대한 뉴스(또는 일부 변형)에 귀를 기울여라. 분명히 강력한 모델이며 다양한 사람들에게 유용할 수 있는 모델이다.

 

 

더 많은 정보를 위한 뉴스 레터 링크: You can learn more about the newsletter here.

 

 
챗GPT, ChatGPT, 인공지능, 경쟁자들, 무료 관련기사목록
광고
광고
광고
광고
광고
광고
광고
많이 본 기사
챗GPT와 AI, 로봇 많이 본 기사
최신기사