AI _4차산업혁명/AI 시대_생존전략

<1인 AI 비서, AGI 시대 임박> 구글 제미나이와 오픈 AI 격돌, 프로젝트 아스트라, 영상 Veo, AI 오버뷰 검색 등 범용 인공지능 시대 진입이 멀지 않았다.

비지트_ 2024. 5. 18. 10:10
반응형

 

안녕하세요 비지트입니다.

 

현지시간 5월 13일 오픈 AI가 챗GPT 4o 버전을 공개한 소식을 공개하며 사람의 감정까지 알아채며 대화가 가능해 놀라움을 금치 못했죠. 그뿐만 아니라, 즉석에서 수학 문제 풀이를 조언하고 코드를 조언하는 등 GPT 4 유료 버전에서 평균 2.8초의 기다림이라곤 찾아볼 수 없는 거의 실시간 답변 (반응속도 0.2초에서 0.3초)과 대화로 그 성능이 놀라울 정도였습니다.

 

<오픈 AI, GPT-4o 발표> 감정 알아보는 실시간 대화 1인 비서 자비스>

https://blog.naver.com/begtalent/223446021080

 

<오픈AI,GPT-4o 발표> 감정 알아보는 실시간 대화 1인 비서 자비스, 수학 코드 외국어 실시간 조언, A

안녕하세요 비지트입니다. 오늘 (현지시간 5월 13일) 또 천지가 개벽하는 일이 일어났습니다. 오픈 AI 가...

blog.naver.com

 

그로부터 하루가 지난 현지시간 14일엔 구글이 생성형 AI 제미나이(Gemini)를 활용한 차세대 AI 비서를 선보였습니다. 구글은 14일(현지시간) 미국 캘리포니아주 마운틴뷰 쇼어라인 엠피시어터에서 '구글 연례 개발자 회의(I/O)'에서 제미나이를 통해 AI의 미래를 현실화하겠다는 비전을 발표했습니다. 이번 I/O에서는 구글의 CEO 순다르 피차이 등 경영진들이 총출동하여 발표해 눈길을 끌었습니다.

 

발표 내용 중 몇 가지를 소개하고자 합니다. 먼저 '제미나이 1.5' 시리즈를 발표하면서 일전에 공개했던 제미나이 1.5 프로를 전체 이용자에게 제공하고 더 가볍고 빠른 제미나이 1.5 플래시를 선보이겠다는 것입니다. 특히 구글은 제미나이 1.5 시리즈가 100만 개의 토큰(개발자용 200만 개)을 한 번에 지원하는 '문맥 창(Context Window)'*을 갖추고 있다고 강조했습니다.

 

*AI 모델이 명령을 처리할 때는 답변을 생성하는 동안 확인할 수 있는 정보의 양이 제한되는데, 이때 검토·확인할 수 있는 텍스트 범위의 크기를 문맥 창이라고 정의를 내림.

 

구글은 제미나이 1.5는 1500페이지에 달하는 여러 개의 대규모 문서를 한 번에 이해하거나 100개의 이메일을 한 번에 요약할 수 있는 수준의 문맥 창을 갖췄다고 밝히고 있습니다.

 

구글은 제미나이가 20억 명이 사용하는 구글 제품에 통합된다는 것을 발표하고, 새로운 검색 엔진 'AI Overveiw'(AI 오버뷰)*를 소개했습니다. 이번 주부터 미국의 모든 사용자에게 제공 후 출시 국가를 늘릴 예정이라고 밝히며 제미나이를 활용해 사용자 검색 체험을 더욱 향상시킬 것이라고 말했습니다.

 

*AI 오버뷰는 기존에 시험적으로 제공된 ‘검색 생성 경험(Search Generative Experience, SGE)’ 기능의 개량판입니다. SGE는 단어가 아닌 더 길고 복잡한 문장으로 질문하거나 사진으로 검색할 수 있는 새로운 기능인데요, 구글은 지난해부터 SGE를 연구소 밖에서도 테스트해 왔으며, 사용자 이용이 늘어났을 뿐만 아니라 만족도도 향상되었다고 피차이는 설명했습니다.

 

이번 행사의 가장 핵심이라고 할 수 있었던 게 바로 제미나이와 음성 모델을 기반으로 하는 새로운 '프로젝트 아스트라'(Project Astra)를 공개했습니다. AI가 사람처럼 보고 들을 수 있고 음성으로 대화하면서 이용자의 개인 비서 역할을 하는 말 그대로 범용 AI라고 할 수 있지 않나 싶습니다.


구글 유튜브

 

 

"일상생활에서 도움이 될 수 있는 범용 AI 비서를 만들고 싶었다"라며 "휴대전화나 안경과 같은 폼팩터를 통해 전문 비서를 곁에 둘 수 있는 미래를 쉽게 상상할 수 있다"라고 강조하며 시연을 보였는데요, 시연 영상에는 휴대전화 카메라로 주변 상황을 보여주면서 여러 질문을 던지자 AI 비서가 음성으로 답하는 모습이 담겼습니다.

 

사무실에서 "소리를 내는 무언가가 보이냐"라고 묻자 "스피커가 보인다"라고 답했고, 창밖을 보여주며 "여기가 어느 동네냐"라는 질문엔 "런던의 킹스크로스 지역"이라고 하는 등 실시간으로 화면을 인식하며 답변했습니다. 심지어 시연자가 중간에 "내 안경 어디서 봤는지 기억나냐"라는 물음에는 "책상 위 빨간 사과 근처에 있었다"라며 조금 전 스쳐 지나갔던 장면을 기억해 안경 위치를 알려주기도 했습니다.

 

그러다 테이블에 놓여진 안경을 쓰고 안경에 장착된 카메라로 대화를 시작하자 반응이 완전이 달라졌죠. 오픈 AI 가 GPT-4o을 선제적으로 발표하여 다소 김빠진 상황을 극복? 한 상황이 아니었나 싶기도 한데요, 구글은 약 10여년 전 글라스를 개발하다 실패한 사례가 있어 다시 시작하는게 아닌가 하는 생각도 들었죠. 안경을 쓰고 대화를 하는 것은 마치 드론 레이싱의 FPV 와 같은 느낌이겠 싶더군요.

구글 유튜브
 
 
 

구글은 또한 오픈 AI의 동영상 생성 AI인 Sora와 같은 영상 툴 ‘Veo’와 ‘Imagen 3’을 소개하며 하루 차이로 구글 제미나이의 일취월장한 시연과 기능들을 소개했습니다. 그야말로, 오픈 AI VS 구글의 대격돌이 본격적으로 진행되고 있음을 느낄 수 있었는데요, 그럼 이틀 사이에 펼쳐진 양사가 소개한 AI의 성능에 대한 여러분의 평가는 어떠한가요?

 

비지트는 구글의 프로젝트 아스트라가 매력적으로 다가오긴 했지만, 오픈 AI의 GPT-4o이 훨씬 더 자연스러운 거 같아 승이라고 말하고 싶네요. 앞으로의 승부 결과는 어느 AI 가 좀 더 자연스럽게 인간다운 개인 비서가 될 수 있느냐에서 결정이 날것으로 보이는데요, 현재 발표된 수준으로도 1~2년 전에 상상도 못할 자연스러운 인공지능 비서가 우리 앞에 다가왔는데 중요한 건 이 모델들이 모두 초기 단계라는 것입니다. 그렇다면 지금보다 더 좋아진다는 건 바로 일반 인공지능, 범용 인공지능이라고 하는 AGI 가 곧 우리 앞에 펼쳐지나는 것을 생각해 볼 수 밖에 없습니다.

 

우리는 여기서 근본적인 의문을 가져야 합니다. 이렇게 AI 비서가 활성화되면 우리의 생활은 훨씬 편해질까요? 우리가 진정 미래의 변화에 대해서 생각해 볼 부분은 AI의 발전으로 가져올 편익보다 위기의식을 가져야 한다는 점입니다.

 

2023년 챗GPT가 우리 일상에 들어왔을 때 AI를 이길 수 있다는 이야기를 하는 분들이 제법 있었습니다. 하지만, 1년이 조금 지난 이 시점에서 그런 분들을 찾아보기는 거의 어렵습니다. 왜 그럴까요? 그것은 AI가 우리 커뮤니티의 일원이 된다는 사실을 아직은 100% 받아들이기가 힘들었지만 받아들여만 하는 상황으로 가고 있고 또 AI 가 접목된 삶의 변화에 맞춰 나도 변화해야 한다는 걸 깨닫기 시작했기 때문입니다.

 

그러나, 한번 더 들여다 볼 것은 과연 그 변화를 따라갈 나의 변화 속도에 대해 자신이 있냐입니다. 많은 분들이 거부하기도 하고 두려워 하기도 합니다. 그러기에 오롯이 개인이 이러한 AI가 가져오는 대변화에 대해 준비하는 것은 불가능에 가깝습니다. 지금부터라도 AI에 의해 대체되는 인간의 역할과 사회적 안정 시스템(챗GPT, 질문이 돈이 되는 세상에 소개된 데이터 배당'등)에 대한 논의가 본격적으로 시작되어야 한다는 과제를 던져주고 있습니다.


【비지트는 IT 융합 공학박사이자 미래전략가로 개인과 기업의 미래 가치 향상에 힘쓰고 있습니다. '챗GPT 질문이 돈이 되는 세상'의 저자로 챗GPT 강연, 드론/자율주행차 강연, 미래생존전략 강연, 진로진학 커리어 컨설팅, 기업의 미래 전략 컨설팅 등 미래가치를 높이는 데 힘쓰고 있는 종합 컨설팅 Firm입니다】

 


반응형