노바 포지, 고유의 '오픈 트레이닝' 방식 통해 기업의 노바 기반 자체 프런티어 AI 모델 구축 지원
(씨넷코리아=신동민 기자) 아마존(Amazon)은 오늘 AWS 리인벤트 2025(AWS re:Invent 2025)에서 네 가지 새로운 노바(Nova) 모델, 그리고 조직이 노바를 기반으로 맞춤형 모델 변형을 구축할 수 있도록 지원하는 선구적 오픈 트레이닝(open training) 서비스인 노바 포지(Nova Forge), 높은 신뢰성의 AI 에이전트를 생성하기 위한 서비스인 노바 액트(Nova Act) 등 노바 포트폴리오의 포괄적인 확장을 발표했다.현재 수만 개의 기업이 고품질 콘텐츠 제작, 다단계 작업 자동화, AI 에이전트 개발 가속화 등 다양한 용도로 노바를 사용하고 있다. 아마존의 새로운 노바 2(Nova 2) 모델 패밀리는 여러 AI 영역에서 속도·비용·지능 간의 균형을 제공한다.노바 2 라이트(Nova 2 Lite)는 일상적인 워크로드를 위한 빠르고 비용 효율적인 추론 모델로, 텍스트, 이미지와 동영상을 입력으로 받아 처리하여 텍스트를 생성할 수 있다. 고객은 응답하기 전에 모델이 수행하는 단계별 ‘사고(thinking)’의 양을 조정함으로써 지능의 깊이와 속도·비용·간의 균형을 맞출 수 있으며, 이는 고객 서비스 챗봇, 문서 처리 및 비즈니스 자동화 등에 이상적이다. 노바 2 라이트는 해당 지능 등급(intelligence class)에서 업계 최고 수준의 가격 대비 성능을 제공한다.노바 2 라이트는 클로드 하이쿠 4.5(Claude Haiku 4.5) 대비 15개 벤치마크 중 13개에서 동등하거나 더 우수하고, GPT-5 미니(Mini) 대비 17개 벤치마크 중 11개에서 동등하거나 더 우수하며, 제미나이 2.5 플래시(Gemini 2.5 Flash) 대비 18개 벤치마크 중 14개에서 동등하거나 더 우수하다. 노바 2 라이트는 문서 처리, 동영상에서의 정보 추출, 코드 생성, 정확한 근거 기반 답변 제공, 다단계 에이전트 워크플로우 자동화 등의 영역에서 뛰어난 역량을 보여준다.노바 2 프로(Nova 2 Pro)는 텍스트, 이미지, 동영상 및 음성을 처리하여 텍스트를 생성할 수 있는 아마존의 가장 지능적인 추론 모델이다. 최고 수준의 정확도가 필수적인 에이전트 코딩, 장기 계획 수립, 정교한 문제 해결 등 매우 복잡한 작업에 이상적이다. 이 모델은 지식 증류(knowledge distillation)를 위한 ‘교사’ 역할도 수행할 수 있어, 특정 도메인 및 사용 사례를 위한 더 작고 효율적인 ‘학생’ 모델로 그 능력을 이전할 수 있다.노바 2 프로는 클로드 소넷 4.5(Claude Sonnet 4.5) 대비 16개 벤치마크 중 10개에서 동등하거나 더 우수하고, GPT-5.1 대비 16개 벤치마크 중 8개에서 동등하거나 더 우수하며, 제미나이 2.5 프로(Gemini 2.5 Pro) 대비 19개 벤치마크 중 15개에서 동등하거나 더 우수하고, 제미나이 3 프로 프리뷰(Gemini 3 Pro Preview) 대비 18개 벤치마크 중 8개에서 동등하거나 더 우수하다. 노바 2 프로는 다중 문서 분석, 동영상 추론, 복잡한 지시사항 수행, 고급 수학 문제 해결, 에이전트 및 소프트웨어 엔지니어링 작업 수행 등에의 영역에서 강점을 보여준다.노바 2 라이트와 노바 2 프로 모두 웹 그라운딩(web grounding)과 코드 실행 기능을 내장하고 있어 최신 정보를 웹에서 검색하고 코드를 직접 실행할 수 있으며, 이를 통해 응답이 훈련 데이터에만 의존하지 않고 최신 사실에 기반하도록 보장한다.노바 2 소닉(Nova 2 Sonic)은 텍스트 및 음성의 이해와 생성을 통합해 인간과 유사한 실시간 대화형 AI 구현하는 아마존의 스피치-투-스피치(speech-to-speech) 모델이다. 표현력 있는 음성으로 확장된 다국어 지원, 더 높은 정확도, 지속적인 상호작용을 위한 100만 토큰 컨텍스트 윈도우(context window)를 특징으로 하며, 음성과 텍스트 간의 원활한 전환을 지원한다.노바 2 소닉은 작업을 비동기 방식으로 처리해, 항공편 예약과 같은 작업이 백그라운드에서 진행되는 동안에도 사용자가 주제를 전환하면서 자연스러운 대화를 계속할 수 있다. 또한 아마존 커넥트(Amazon Connect), 보니지(Vonage), 트윌리오(Twilio), 오디오코드(AudioCodes)와 같은 전화 통신 서비스 제공업체 및 라이브킷(LiveKit), 파이프캣(Pipecat)과 같은 대화형 AI 프레임워크와 원활하게 통합되어 고객 서비스 애플리케이션, AI 어시스턴트, 인터랙티브 음성 경험 등에 이상적이다. 노바 2 소닉은 실시간 API를 통해 제공되는 오픈AI(OpenAI)의 GPT 리얼타임(gpt-realtime)이나 제미나이 2.5 플래시 모델 대비 업계 최고 수준의 가격 대비 성능과 품질을 제공한다.노바 2 옴니(Nova 2 Omni)는 텍스트, 이미지, 동영상, 음성 입력을 처리하면서 텍스트와 이미지를 모두 생성할 수 있는 업계 최초의 통합 멀티모달 추론·생성 모델이다. 최대 75만 단어, 수 시간 분량의 오디오, 긴 동영상, 수백 페이지의 문서를 처리할 수 있으며, 전체 제품 카탈로그, 고객 후기, 브랜드 가이드라인, 동영상 라이브러리 등을 한 번에 동시 분석할 수 있다. 이를 통해 여러 특화 모델을 연결하는 데 따르는 비용과 복잡성을 제거한다.예를 들어, 마케팅 팀은 다양한 형식의 제품 세부 정보를 분석해 헤드라인, 카피, 소셜 미디어 게시물, 시각 자료 등을 포함한 완전한 캠페인을 하나의 워크플로우에서 즉시 생성할 수 있다. 노바 2 옴니와 비교할 수 있는 모델은 없지만, 문서·이미지·동영상·오디오에 대한 멀티모달 추론의 공개 벤치마크에서 강점을 보여주며, 다른 선도적 이미지 생성 모델과 유사한 수준의 고품질 이미지를 생성할 수 있다.시스코(Cisco), 지멘스(Siemens), 수모로직(Sumo Logic), 트렐릭스(Trellix)와 같은 기업들은 에이전트 기반 위협 탐지부터 동영상 이해, 음성 AI 어시스턴트에 이르기까지 다양한 애플리케이션에 노바 2 모델을 사용하고 있다.AI 애플리케이션에 자체적(proprietary) 지식을 통합하고자 하는 조직은 세 가지 한계를 마주하게 된다. 첫째, 독점 모델 맞춤화 시 조직의 전문성을 통합하는 데 있어 표면적인 수준에 그치게 된다는 점, 둘째, 원본 훈련 데이터에 대한 접근 없이 공개 가중치(open-weight) 모델을 계속 훈련시킴으로써 지시 수행과 같은 기본 역량이 퇴보할 위험이 있다는 점, 셋째, 처음부터 모델을 구축하려면 막대한 비용 든다는 점이다. 조직이 필요로 하는 것은 프런티어 모델의 역량과 전문성을 깊이 통합할 수 있는 능력 둘 모두이다.이 같은 요구에 부응해, 노바 포지(Nova Forge)는 조직이 자체적 데이터를 노바의 최첨단 역량과 결합하여 최적화된 자체 노바 변형 모델인 노벨라(Novella)를 구축할 수 있도록 지원한다. 이 서비스는 ‘오픈 트레이닝’이라는 방식을 처음 도입해, 고객에게 사전 훈련(pre-trained), 중간 훈련(mid-trained), 사후 훈련(post-trained)된 노바 모델 체크포인트에 대한 독점적 접근을 제공한다. 고객은 모델 훈련의 모든 단계에서 아마존 노바가 큐레이션한 데이터셋과 자체적 데이터를 혼합할 수 있다. 그 결과, 노바의 지식과 추론 능력 전반에 특정 비즈니스에 대한 각 조직의 깊이 있는 이해가 결합된 맞춤형 모델이 만들어진다. 고객은 오늘부터 노바 2 라이트를 사용해 자체 노벨라를 구축할 수 있다. 또한 노바 포지 고객은 노바 2 프로 및 노바 2 옴니에 조기 접근 권한을 받아, 더욱 강력한 노바 모델로 애플리케이션과 노벨라를 구축하는 데 있어 앞서 나갈 수 있다. 모델 체크포인트 및 데이터 혼합 기능 외에도 노바 포지는 세 가지 추가적인 강력한 기능을 제공한다. 첫째는 조직 고유의 환경에서 AI를 훈련할 수 있는 강화 학습 ‘짐(gyms)’ 기능이다. 이 짐은 모델이 실제 사용 사례를 반영한 시뮬레이션 시나리오에서 학습하는 합성 환경을 의미한다. 둘째는 더 작고 빠른 모델을 생성할 수 있는 옵션으로, 더 큰 모델의 AI가 생성한 예제로 훈련시키는 합성 데이터 기반 증류(synthetic data-based distillation)라는 과정을 통해 더 낮은 비용으로 지능을 유지할 수 있다. 셋째는 안전 제어 기능을 구현할 수 있는 책임 있는 AI 툴킷이다.부킹닷컴(Booking.com), 코사인 AI(Cosine AI), 님버스테라퓨틱스(Nimbus Therapeutics), 노무라종합연구소(Nomura Research Institute), 오픈바빌론(OpenBabylon), 레딧(Reddit), 소니(Sony)와 같은 기업들이 노바 포지를 사용해 자체 모델을 구축하고 조직 고유의 요구사항을 충족하고 있다.크리스 슬로우(Chris Slowe) 레딧 최고기술책임자(CTO)는 "노바 포지를 사용해 레딧의 콘텐츠 모더레이션(moderation) 시스템을 더욱 통합된 형태로 개선하고 있으며, 이미 인상적인 성과를 내고 있다"며, "레딧은 여러 개의 다른 모델을 더 정확한 단일 솔루션으로 대체하여 모더레이션 효율성을 높이고 있다. 여러 전문 머신러닝 워크플로우를 하나의 통합된 접근 방식으로 대체할 수 있다는 점은 레딧 전반에 걸쳐 AI를 구현하고 확장하는 방식의 전환을 의미한다. 안전성 영역에서 이러한 초기 성과를 확인했고, 앞으로 노바 포지가 비즈니스의 다른 영역에서 어떻게 도움이 될 수 있을지 기대하고 있다"고 말했다. 고객이 노바 포지로 생성한 자체 프런티어 모델은 다른 모든 베드록(Bedrock) 모델과 동일한 엔터프라이즈급 보안, 확장성, 데이터 프라이버시 보호를 바탕으로 아마존 베드록(Amazon Bedrock)에 배포할 수 있다. 자체 프런티어 모델 구축부터 프로덕션 배포에 이르는 이 완전한 솔루션은 기업이 자사의 비즈니스 요구에 최적화된 성능의 AI를 확보하고, 이를 AWS 상에서 안전하게 단독으로 사용할 수 있게 지원한다.노바 액트(Nova Act)는 웹 브라우저에서 작업을 수행할 수 있는 높은 신뢰성의 AI 에이전트를 구축하고 배포하기 위한 신규 AWS 서비스다. 맞춤형 노바 2 라이트 모델을 기반으로 하는 노바 액트는 브라우저 기반 작업을 자동화하는 에이전트 플릿(fleet)을 구축하고 관리하는 가장 빠르고 쉬운 방법을 제공한다. 노바 액트는 초기 고객 워크플로우에서 90%의 신뢰성을 달성했으며, 관련 벤치마크에서 경쟁 모델을 능가하는 성능을 보여준다.노바 액트는 수백 개의 시뮬레이션된 웹 환경에서 수천 개의 작업을 수행하는 강화 학습을 통해 맞춤형 노바 2 라이트 모델을 훈련함으로써 이처럼 높은 신뢰성을 실현한다. 이러한 훈련 방식을 통해 노바 액트는 고객관계관리(CRM) 시스템의 데이터 업데이트나 웹사이트 기능 테스트, 건강보험 청구 제출과 같은 UI 기반 워크플로우에서 뛰어난 성능을 발휘한다.개발자는 노바 액트를 사용해 자연어 프롬프트를 사용하는 노코드(no-code) 플레이그라운드에서 몇 분 만에 에이전트 프로토타입을 만들고, VS 코드(VS Code)와 같은 익숙한 IDE(통합 개발 환경)에서 해당 노바 액트 에이전트를 정교화한 뒤 AWS에 배포할 수 있다. 고객이 로컬에서 구축하고 테스트한 것은 그대로 프로덕션 환경으로 확장될 수 있으며, 노바 액트 AWS 콘솔을 통한 포괄적인 관리 도구와 모니터링을 제공받을 수 있다.