서울경제

HOME  >  산업  >  바이오&ICT

아마존, 신형 LLM '노바' 출시…6개 AI모델 골라 쓴다

■AWS 리인벤트 2024
대화형 비서·동영상 생성 등 공개
오픈AI·구글과 주도권 경쟁 격화
내년 AI칩 출시…엔비디아에 도전

  • 라스베이거스=김성태 기자
  • 2024-12-04 17:47:22
  • 바이오&ICT

아마존과 아마존웹서비스(AWS)가 새로운 생성형 인공지능(AI) ‘아마존 노바’를 공개하며 오픈AI와 구글이 주도하는 AI 패권 경쟁 판도 뒤집기에 나섰다. AWS는 내년 3㎚(나노미터·10억분의 1m) 공정으로 개발한 AI 반도체 ‘트라이니엄3’을 내놓으며 엔비디아의 아성에도 균열을 내겠다는 전략이다.





아마존, 신형 LLM '노바' 출시…6개 AI모델 골라 쓴다
앤디 재시 아마존 최고경영자(CEO)가 3일(현지시간) 미국 네바다주 라스베이거스 베네시안 호텔에서 열린 AWS 연례 기술 콘퍼런스 리인벤트(re:Invent)에서 거대 언어모델(LLM) ‘아마존 노바’를 소개하고 있다. 사진제공=AWS


앤디 재시 아마존 최고경영자(CEO)는 3일(현지 시간) 미국 네바다주 라스베이거스 베네시안 호텔에서 열린 AWS 연례 기술 콘퍼런스 ‘리인벤트’에 참석해 새로운 대규모언어모델(LLM)인 아마존 노바를 공개했다.


아마존에 따르면 노바는 6종으로 구성된다. 노바 마이크로는 텍스트 전용 경량 모델이다. 노바 라이트·프로·프리미어는 각자 사양이 다른 멀티모달(복합 정보 처리) 모델로 이용자는 목적에 따라 골라 쓰면 된다. 아마존은 이미지 생성 AI ‘노비 캔버스’와 아마존 최초의 동영상 생성 AI ‘노바 릴’도 선보였다. 특히 노바 릴은 텍스트 프롬프트와 이미지를 통해 짧은 동영상이나 마케팅, 광고·엔터테인먼트용 전문가 품질의 동영상을 생성할 수 있다.


아마존은 대화형 AI 비서 시장도 적극 공략한다. ‘노바 스피치(Speech) 투 스피치 모델’과 ‘애니(Any) 투 애니 모델’도 내년에 출시할 계획이다. 스피치 투 스피치 모델은 목소리로 질문해 목소리로 답을 얻는 모델이며 애니 투 애니는 문자를 입력해 동영상을 얻거나 영상을 입력해 이미지가 출력되는 등 모든 조합이 가능한 모델이다.


아마존은 새 브랜드 노바를 통해 오픈AI와 구글 등과 치열한 AI 경쟁을 벌이겠다는 전략이다. 재시 CEO는 “노바 라이트는 오픈AI의 ‘GPT-4o 미니’ 대비 19개 벤치마크 중 17개에서, 구글의 ‘제미나이’와 비교해서는 21개 벤치마크 중 17개에서 동등하거나 우위에 있다”며 “노바 프로는 20개 언어 이해 및 추론 능력 측면에서 GPT-4o와 동등하거나 우수하다”고 말했다. 노바는 한국어를 포함해 200여 개 언어를 지원한다. AWS AI 플랫폼 ‘베드락’에서만 독점 제공한다. 그는 “AWS는 항상 그래왔듯이 가장 뛰어난 조합을 제공할 것”이라고 자신감을 드러냈다.



아마존, 신형 LLM '노바' 출시…6개 AI모델 골라 쓴다
맷 가먼 아마존웹서비스(AWS) 최고경영자가 3일(현지 시간) 미국 네바다주 라스베이거스 베네시안호텔에서 열린 AWS 연례 기술 콘퍼런스 ‘리인벤트’에 참석해 AWS의 인공지능 전략을 소개하고 있다. 사진 제공=AWS

아마존은 AI 반도체 시장 공략에도 속도를 낸다. 맷 가먼 AWS CEO는 내년 말 AI 학습 반도체 ‘트레이니엄3’를 출시할 계획을 공개했다. AWS에 따르면 트레이니엄3 기반 울트라서버는 전작 대비 4배 더 뛰어난 성능을 확보했다. 맷 가먼 AWS CEO는 “최첨단 생성형 AI 훈련과 추론의 까다로운 작업을 위해 특별히 제작됐다”고 말했다.


AWS는 트레이니엄3를 통해 엔비디아가 지배하고 있는 AI 칩 시장의 판도를 흔들겠다는 전략이다. AWS는 대형 고객사를 다수 확보하고 있다. 애플이 트라이니엄2 등을 활용해 ‘애플 인텔리전스’를 학습시키고 있다. 전날에는 앤트로픽과 ‘트라이니엄2’ 수십만 장을 탑재한 초대형 클라우드 클러스터를 조성하는 ‘프로젝트 레이니어’도 발표됐다. 가먼 CEO의 기조연설에 찬조 출연한 브누아 뒤팽 애플 머신러닝·AI 수석디렉터는 “AWS의 서버 칩인 ‘그래비톤3’로 효율성을 40% 이상 높였고 추론용 칩 ‘인퍼런시아2’를 통해 효율성을 2배 이상 높였다”고 소개했다.


<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지> XC

시선집중

ad

이 기사를 공유하세요.

[화제집중]

ad

이메일 보내기

보내는 사람

수신 메일 주소

※ 여러명에게 보낼 경우 ‘,’로 구분하세요

메일 제목

전송 취소

메일이 정상적으로 발송되었습니다
이용해 주셔서 감사합니다.

닫기