본문 바로가기

카테고리 없음

구글의 가장 똑똑한 A.I언어 모델 Gemini(제미나이) 발표

 

 

  • 제미나이가 무엇인가?

구글이 인공지능(AI)의 기반이 되는 대규모 언어모델(LLM) ‘제미나이’(Gemini)를 6일에 공개했습니다.  
제미나이는 오픈 AI의 챗GPT 기반이 되는 ‘GPT’와 같은 AI 모델로, 오픈 AI의 최신 모델인 ‘GPT-4’보다 성능이 우수하다고 구글은 밝혔습니다.

제미나이는 이미지를 인식하고 음성으로 말하거나 들을 수 있으며 코딩을 할 수 있는 능력까지 갖춘 ‘멀티모달 AI’로 만들어졌습니다. 


멀티모달은 다양한 모드 즉 시각, 청각 등을 활용해 텍스트 뿐만 아니라 이미지, 음성, 영상 등으로 상호작용하는 것을 말합니다. 또 제미나이는 수학 문제를 풀거나 데이터를 분석하는 높은 추론 능력도 갖췄습니다.

 

  • 얼마나 똑똑한가?

"인간 전문가 점수인 89.8%를 넘은 최초의 모델"이라고 설명했다. 오픈AI의 GPT-4는 86.4%를 기록했다. 또 현재 가장 우수한 모델과 비교해 "32개 지표 중 30개에서 앞섰다"며 현재까지 성능이 가장 우수하다고 평가되는 GPT-4보다 뛰어나다고 강조했다.

자연스러운 이미지, 오디오, 비디오 이해부터 수학적 추론에 이르기까지 '제미나이 울트라'의 성능은 대규모 언어 모델(LLM) 연구 및 개발에 널리 사용되는 32개의 학술 벤치마크 중 30개에서 현재, 가장 최신의 결과를 뛰어넘었습니다.

수학, 물리학, 역사, 법률, 의학, 윤리 등 57개 과목을 조합하여 세계 지식과 문제 해결 능력을 테스트하는 MMLU(대규모 다중 작업 언어 이해)에서 90%의 점수로 Gemini는 어려운 질문에 답하기 전에 한 번 더 신중하게 생각할 수 있는 추론 기능으로 인간 전문가를 능가할 수 있는 최초의 모델로 등장했습니다.

 

또한 우수한 코딩 능력으로 Gemini의 첫 번째 버전은 파이썬(Python), 자바(Java), C++, Go 등  가장 보편적으로 사용되는 프로그래밍 언어로 어려운 코드를 이해하고 설명하며 생성할 수 있습니다. 이는 다양한 언어로 작업하고 복잡한 정보에 대해 추론할 수 있는 능력 덕분에 코딩을 위한 최고의 모델 중 하나가 되었습니다.

출처 : 인공지능신문

(https://www.aitimes.kr)

  • 종류는?

이 LLM은 머신 러닝(기계학습·인간의 학습능력과 같은 기능을 컴퓨터에서 실현하고자 하는 기술)의 규모에 따라 울트라(Ultra)프로(Pro), 나노(Nano) 등 3개 모델로 출시됩니다.

 

가장 범용으로 쓰이는 '제미나이 프로'는 이날부터 구글의 AI 챗봇 서비스인 '바드'에 탑재됩니다.  바드에는 지금까지 팜 2(PaLM2)가 탑재되어 왔습니다.

 

제미나이 프로가 적용된 바드는 170개 이상 국가 및 지역에서 영어로 제공되며 향후 서비스 확장 및 새로운 지역과 언어도 지원될 예정입니다.

 

가장 크고 고성능인 '제미나이 울트라'는 내년 초 '바드 어드밴스트'라는 이름으로 바드에 장착될 예정입니다.

 

'제미나이 나노'는 클라우드 연결 없이 디바이스 자체에서 가벼운 AI를 즉각적으로 활용하는 온디바이스 형태로 접목됩니다.  구글이 지난 10월 공개한 최신 스마트폰인 '픽셀 8 프로'에 탑재됩니다.