AI _4차산업혁명/AI 시대_생존전략

<오픈AI,GPT 4o 발표> 감정알아보는 실시간 대화 1인비서 자비스, 수학 코드 외국어 실시간 조언, AI시대 영어 등 외국의 교사의 미래는?

비지트_ 2024. 5. 14. 07:33
반응형

안녕하세요 비지트입니다.

 

오늘 (현지시간 5월 13일) 또 천지가 개벽하는 일이 일어났습니다. 오픈 AI 가 GPT-4o를 발표했습니다. GPT-4o 는 GPT-4의 업그레이드버전이라고 보시면 되겠습니다.

 

몇 주에 걸쳐서 배포될 예정으로 한국은 아마도 2주 이상은 걸리지 않을까 싶은데요, 기대가 되네요. GPT-4o는 텍스트, 비전, 오디오 통합 멀티모달(Multi-Modal)입니다. 멀티모달은 다양한 AI 엔진, 예를 들어 언어모델, 비디오 모델, 음성 모델을 통합한 AI 에이전트(비서)입니다. GPT-4o 의 o 가 궁금하시죠? 또 '네이티브 멀티모달' 이라고 소개했습니다. GPT-4o에서 o는 “모든”이라는 뜻을 가진 ‘옴니’의 약자입니다. 즉, 이대로 해석하자면 네이티브 모든 멀티모달이라고 말할 수 있겠네요.

 

이날 발표는 샘 올트먼 CEO가 아닌 미라 무라티 오픈AI 최고기술책임자(CTO)가 무대에 올라 먼저 이런 말을 꺼냈습니다. “챗GPT는 오늘날 1억명이 사용하는 AI 솔루션입니다. 오늘날 97% 세계 시민을 커버하는 50개 언어로 제공되는데요.15개 언어를 추가했습니다. 또! GPT-4o API는 GPT-4 보다 2배 더 빠르고 가격은 2배 쌉니다.” 아울러 챗GPT의 새로워진 UI를 선보인다고 발표했습니다.

 

출처: 오픈AI 유튜브

 

 

GPT-4o의 가장 큰 핵심 기능은 음성입니다. 아시다시피, 챗GPT 에도 음성 기능이 있었죠, 하지만 그건 텍스트에서 음성으로 변화하는 형태의 음성 모드입니다. 이제 GPT-4o는 AI와 실시간 (리얼타임 - 평균 GPT-3.5가 5.4초, GPT-4가 2.8초 의 기다림 없이) 대화하는 수준으로 진화했습니다. 그야말로 챗GPT 기존의 음성 대화는 저리 가라네요.

 

마크 첸 엔지니가 무대에 올라 챗GPT와 대화를 시연 했는데요, 챗GPT와 인사를 한 후 데모에 떨리다면 후하 후하 큰 숨소리만 냈더니 챗GPT가 왜 그렇게 깊은 소리를 내냐 진정하라고 청소기가 아니라며 이야기 합니다. 그리고 천천히 숨을 고르는 소리르 듣고 바로 그거라며 이제 느낌이 어떠냐고 물어봅니다. 바로 상대의 음성을 듣고 어떤 상태인지 감정을 이해를 한거지요.

 

후~~ 하고 숨을 내밷고 있는 모습 (출처 OPEN AI 유튜브)

챗GPT 음성 기능이 버퍼링이 좀 있어도 크게 나쁘지 않았다고 생각했는데 이 데모를 보니 거의 버퍼링 없이 자연스러운

 

대화 뿐만이 아니라, 슬프거나 기쁘거나 흥분하는 등 매우 풍부한 목소리를 냈습니다. 중간 중간 기계적 느낌이 조금 있긴 했으나 거의 완벽한 사람과의 대화 수준이었네요.. 이제 외국어 공부는 챗GPT와 본격적으로 하는 시대가 펼쳐지지 않을까 하는 생각마저 들었습니다. 물론 어느정도 교정을 해줄지는 테스트를 해봐야겠네요.

 

이 정도 교정과 조언을 해 주는 실시간 음성 서비스라면 무엇보다 외국어 교육에 큰 변화가 생길거 같습니다. 지금까지도 영어 등 외국어 강사나 교사가 필요할까라는 생각이 더 강하게 들 수 밖에 없더군요. 점점 점점 AI시대에 대두되고 있는 위기의 직업들이 크게 흔들리는 시점으로 다가왔습니다.

 

가장 궁금학 중요한것 ! 바로 무료입니다! 챗GPT 3.5를 쓰시는 분들도 이용가능합니다만, 챗GPT4.0 유료 사용자는 사용량이 다섯 배 더 크다고 했습니다.

<다양한 음성 대화>

https://openai.com/index/hello-gpt-4o/

 


【비지트는 IT 융합 공학박사이자 미래전략가로 개인과 기업의 미래 가치 향상에 힘쓰고 있습니다. '챗GPT 질문이 돈이 되는 세상'의 저자로 챗GPT 강연, 드론/자율주행차 강연, 미래생존전략 강연, 진로진학 커리어 컨설팅, 기업의 미래 전략 컨설팅 등 미래가치를 높이는 데 힘쓰고 있는 종합 컨설팅 Firm입니다】


반응형