구글의 가장 똑똑한 A.I언어 모델 Gemini(제미나이) 발표

제미나이가 무엇인가?

구글이 인공지능(AI)의 기반이 되는 대규모 언어모델(LLM) ‘제미나이’(Gemini)를 6일에 공개했습니다.
제미나이는 오픈 AI의 챗GPT 기반이 되는 ‘GPT’와 같은 AI 모델로, 오픈 AI의 최신 모델인 ‘GPT-4’보다 성능이 우수하다고 구글은 밝혔습니다.

제미나이는 이미지를 인식하고 음성으로 말하거나 들을 수 있으며 코딩을 할 수 있는 능력까지 갖춘 ‘멀티모달 AI’로 만들어졌습니다.

멀티모달은 다양한 모드 즉 시각, 청각 등을 활용해 텍스트 뿐만 아니라 이미지, 음성, 영상 등으로 상호작용하는 것을 말합니다. 또 제미나이는 수학 문제를 풀거나 데이터를 분석하는 높은 추론 능력도 갖췄습니다.

얼마나 똑똑한가?

"인간 전문가 점수인 89.8%를 넘은 최초의 모델"이라고 설명했다. 오픈AI의 GPT-4는 86.4%를 기록했다. 또 현재 가장 우수한 모델과 비교해 "32개 지표 중 30개에서 앞섰다"며 현재까지 성능이 가장 우수하다고 평가되는 GPT-4보다 뛰어나다고 강조했다.

자연스러운 이미지, 오디오, 비디오 이해부터 수학적 추론에 이르기까지 '제미나이 울트라'의 성능은 대규모 언어 모델(LLM) 연구 및 개발에 널리 사용되는 32개의 학술 벤치마크 중 30개에서 현재, 가장 최신의 결과를 뛰어넘었습니다.

수학, 물리학, 역사, 법률, 의학, 윤리 등 57개 과목을 조합하여 세계 지식과 문제 해결 능력을 테스트하는 MMLU(대규모 다중 작업 언어 이해)에서 90%의 점수로 Gemini는 어려운 질문에 답하기 전에 한 번 더 신중하게 생각할 수 있는 추론 기능으로 인간 전문가를 능가할 수 있는 최초의 모델로 등장했습니다.

또한 우수한 코딩 능력으로 Gemini의 첫 번째 버전은 파이썬(Python), 자바(Java), C++, Go 등 가장 보편적으로 사용되는 프로그래밍 언어로 어려운 코드를 이해하고 설명하며 생성할 수 있습니다. 이는 다양한 언어로 작업하고 복잡한 정보에 대해 추론할 수 있는 능력 덕분에 코딩을 위한 최고의 모델 중 하나가 되었습니다.

출처 : 인공지능신문

(https://www.aitimes.kr)

종류는?

이 LLM은 머신 러닝(기계학습·인간의 학습능력과 같은 기능을 컴퓨터에서 실현하고자 하는 기술)의 규모에 따라 울트라(Ultra)와 프로(Pro), 나노(Nano) 등 3개 모델로 출시됩니다.

가장 범용으로 쓰이는 '제미나이 프로'는 이날부터 구글의 AI 챗봇 서비스인 '바드'에 탑재됩니다. 바드에는 지금까지 팜 2(PaLM2)가 탑재되어 왔습니다.

제미나이 프로가 적용된 바드는 170개 이상 국가 및 지역에서 영어로 제공되며 향후 서비스 확장 및 새로운 지역과 언어도 지원될 예정입니다.

가장 크고 고성능인 '제미나이 울트라'는 내년 초 '바드 어드밴스트'라는 이름으로 바드에 장착될 예정입니다.

'제미나이 나노'는 클라우드 연결 없이 디바이스 자체에서 가벼운 AI를 즉각적으로 활용하는 온디바이스 형태로 접목됩니다. 구글이 지난 10월 공개한 최신 스마트폰인 '픽셀 8 프로'에 탑재됩니다.

legacy

구글의 가장 똑똑한 A.I언어 모델 Gemini(제미나이) 발표

티스토리툴바