구글이 챗GPT에 대항하기 위해 구글 제미니 (구글 제미나이)를 일부 출시했다. 구글 제미니 사용법과 종류 등을 알아보고, 온디바이스 AI의 미래에 대해 생각해보자. 또 구글 제미나이를 사용해 바누아투 법칙을 아는지에 대해 질문하고, 이어 챗GPT 3.5와 비교해봤다.
구글 제미니 (구글 제미나이) 뜻
구글 제미니(Google Gemini)는 한글 표기법으로 볼 때 제미니가 맞다. 그러나 영어 발음으로는 제미나이이다. 현재 한국 내에서는 두 발음이 혼재되어 있어 두 표기법을 모두 사용했다. 밑에 포스팅에서는 이를 번갈아 사용하겠다.
구글 제미니는 구글 딥마인드가 만든 생성형 AI 대규모 언어 모델이다. 딥마인드는 2016년 바둑 AI 알파고를 만든 회사로 당시 인간 이세돌 9단을 눌러 충격을 준 회사이다.
필자는 당시 서양의 디지털적이며 탐구적인 ‘과학’이 동양의 아날로그적이며 초월적인 ‘정신’을 앞지르기 시작했다며 매우 충격을 받았다. 이제 동양이 서양보다 나은 게 뭐가 있을까라는 생각에 지배받았다.
생성형 AI란 무엇인가를 생산해낸다는 AI라는 얘기이다. Generative를 한국어로 생성형으로 번역한 것이다. 생성형 AI는 대화, 이야기, 이미지, 동영상, 음악 등을 학습해 사용자의 요구에 따라 이런 콘텐츠를 생성해낸다는 의미이다.
대규모 언어 모델 뜻은 LLM, 즉 Large Language Model의 한국어 표현이다. 머신 러닝 기술을 활용해 인간의 언어를 이해하고 생성하는 AI의 유형이다.
제미니(Gemini)는 하늘의 쌍둥이 별자리를 뜻한다. 5월 21일부터 6월 21일까지이다. 그러나 그것은 두음으로 말짓기(Acronym) 하는 서양의 트릭의 하나로 GEneralized Multimodal Intelligence Network의 줄임말이다. 생성형 멀티 모달 지능망이란 얘기이다.
오픈AI의 LLM인 GPT와 같은 AI 모델이다.
구글 제미니 (구글 제미나이) 사용법
구글 제미니를 사용하기 위해서는 구글에서 영어로 Google Gemini라고 검색한다. 그리고 위의 첫번째 사진처럼, 광고 밑의 Google Deepmind사의 Gemini를 클릭해서 찾아들어가면 된다.
회사 홈페이지 안에 들어가면 위의 두번째 사진과 같은 화면이 뜬다. 그때 큰 글씨 밑에 옆으로 긴 Bar 형태의 메뉴가 뜬다. 거기서 Bard를 쳐서 들어가면 구글 제미니를 만날 수 있다.
구글 제미나이 종류
구글 제미나이는 세 종류로 나온다. 구글은 이 모든 종류가 대형 데이터센터부터 소형 스마트폰에 이르기까지 모든 곳에서 효율적으로 작동한다고 설명한다.
이것이 지난해 말부터 한국 증시를 뜨겁게 달궈온 ‘온디바이스 AI 테마’와 궤를 같이 한다. 과거에는 AI가 대형 컴퓨터에서 돌려져 유의미한 자료를 생성했다면, 이제는 손 안에 휴대폰으로 들어와 우리의 일상생활을 돕는다는 개념인 것이다.
제미니 울트라(Ultra)
제미니 울트라는 가장 복잡한 일을 하도록 고안된 가장 큰 모델이다. IT업계에서는 MMLU, Big-Bench Hard와 같은 LLM 능력테스트(벤치마크)에서 GPT-4를 능가했다고 말하고 있다.
MMLU 테스트에서 제미니 울트라는 90%의 정확도를 보인 반면 GPT-4는 86.4%에 그쳤다. 참고로 MMLU는 수학, 물리학과 같은 수리과학뿐만 아니라 역사, 법률, 윤리 등 인문학까지 50여개의 주제로 테스트 받는다.
또한 MMMU, VQAv2 등의 멀티 모달 벤치마크에서도 GPT-4V를 앞섰다고 전한다. 제미니 울트라는 아직 테스트가 진행중이라 올해 출시될 예정이다.
제미니 프로(Pro)
제미니 프로는 스케일(규모)와 성능 사이에 균형을 잡으려는 모델이다. 소형인 제미니 나노 보다는 큰 일을 하고 대형인 제미니 울트라 보다는 낮은 일을 한다. 제미니 프로는 현재 매우 다양한 다른 일들을 하는데 사용된다. 예컨대 현재는 구글 바드가 복잡한 질문을 처리하는데 이용되고 있다.
독립된 테스트에서 제미니 프로는 GPT 3.5 터보 모델과의 정확성 비교에서 비슷한 성능이지만 약간은 뒤처지는 것으로 나타났다. 지난해 12월 중순부터 공개됐다.
제미니 나노(Nano)
제미니 나노는 스마트폰이나 PC 등에서 국지적으로 이용되도록 고안된 모델이다. 이론상으로는 제미니 나노를 쓰면 스마트폰이 외부 서버에 연결됐을 때보다 훨씬 빨리 글들을 요약해줘야 한다. 그러나 제미니 나노는 현재로선 구글 픽셀 8 Pro와 같은 스마트폰 기종에서만 작동한다. 현재 음성 녹음 요약 기능이 있다.
현재 생성형 AI의 성능을 보려면 패러미터(parameter)의 수가 중요한데, 구글은 제미니 최소형 모델인 제미니 나노의 패러미터에 대해서는 2개의 버전이 있다고 밝혔다. 18억개, 32.5억개, 2종류이다. 구글은 제미니 울트라와 제미니 프로의 패러미터에 대해서는 함구했다.
업계에서는 GPT-3가 1750억개의 패러미터를 갖고 있고, 메타의 Llama 2 패밀리의 경우 650억개의 패러미터를 갖고 있다는 점에서 구글의 상위 2개 모델 역시 엇비슷한 패러미터를 갖고 있을 것으로 보고 있다.
바누아투 법칙에 대한 질문: 바드와 챗GPT 3.5 비교
이 글을 쓰기 하루 전 ‘바누아투 법칙’에 대해 제미나이와 결합된 바드에게 질문했었다. “바누아투 법칙에 대해 알아?”라고. 그러나 바드는 남태평양 섬나라 바누아투의 법률체계에 대해서만 설명해줬다.
나는 원하는 답이 바누아투에서 규모 6 이상의 강진이 나면 2주 내에 대만, 일본 등에 엇비슷한 규모의 지진이 발생한다는 것이었다. 이것은 과학적으로는 입증되지 않은, 흥미 위주의 법칙이다.
이 글을 쓰면서 이번에는 챗GPT 3.5에게 같은 질문을 했더니, 같은 법률 체계 답변이 나왔다. 그래서 “바누아투 지진 법칙에 대해 알아?”라고 질문을 더 구체화했다. 그럼에도 챗GPT 3.5는 “모르겠다”고 답변했다.
이번에는 바드에게 똑같은 질문을 했다. 그런데 놀랍게도 바드가 정답을 말해줬다. 바누아투 지진 법칙은 이미 10여년 이상 인터넷에서 회자되어 있기 때문에 정보 습득 시기와는 무관한 상태였다.
나는 아직 생성현 거대 언어모델들을 신뢰하지 않는다. 여전히 ‘아무 말 대잔치’, IT 용어로 ‘Hallucination(환각)’이라고 해서 AI가 아무 꺼리낌없이 거짓말을 하는 상태를 여러 차례 봤기 때문이다.
심지어 말레이시아 페낭이 서해안에 있는데도, 챗GPT 3.5는 동해안에 있다고 우기고, 서해안으로 학습하라고 해도 말을 듣지 않았다.
문명의 이기인 AI, 잘 쓰면 좋은데, 어느 순간 검색이 사라지면, 즉 정보가 맞는지 틀린지 내가 구분할 자유가 사라지고, AI가 답만 하는 시대가 온다면, AI 상담원과 상담해야 하는 답답함을 느끼지 않을까 싶다.