엔비디아의 혁신적인 AI 기술의 최신 발전을 소개합니다. 라떼 3D를 통해 텍스트로부터 현실적인 3D 그래픽을 만들어내는 새로운 기술에 대해 알아보겠습니다. 이번 포스팅에서는 엔비디아의 A100 텐서 코어를 활용한 훈련과 챗GPT를 활용한 다양한 텍스트 프롬프트의 활용에 대해 살펴보겠습니다.

목차

    텍스트로부터 3D 그래픽으로의 혁신

    엔비디아가 최근에 발표한 라떼3D(Large-scale Amortized Text-To-Enhanced3 D Synthesis)는 텍스트를 3D 그래픽으로 신속하게 변환하는 생성형 AI 모델입니다. 이 모델은 단 몇 초만에 텍스트 입력을 받아 현실적이고 고품질의 3D 그래픽을 생성할 수 있습니다. 이러한 기술은 텍스트 설명만으로도 다양한 3D 모델을 만들어낼 수 있어, 창의적이고 혁신적인 디자인 및 시각화 작업에 매우 유용할 것으로 기대됩니다. 엔비디아의 라떼3D는 인공지능과 그래픽 기술이 만나 탄생한 혁신적인 도구로, 이를 통해 더욱 다채로운 시각적 경험을 제공할 수 있게 될 것입니다.

     

    텍스트로부터 3D 그래픽으로의 빠른 변환

    라떼3D는 가상 3D 프린터처럼, 단 몇 초 안에 텍스트 프롬프트를 사물과 동물의 현실적인 3D 그래픽으로 변환할 수 있는 기술을 제공합니다. 이 프로젝트에서는 라떼3D가 표준 렌더링 애플리케이션에서 널리 사용되는 포맷으로 제작되었습니다. 이는 비디오 게임, 광고 캠페인, 디자인 프로젝트, 로보틱스용 가상 훈련장 개발 등 다양한 분야에서 가상 환경을 쉽게 구현할 수 있음을 의미합니다. 엔비디아의 AI 리서치 부사장인 산자 피들러(Sanja Fidler)는 토론토에 위치한 AI 연구소에서 라떼3D를 개발했습니다. 이러한 연구는 AI 기술과 그래픽 처리 능력을 결합하여 혁신적이고 유용한 도구를 제공하는 데 있어 중요한 발전을 이루고 있습니다.

    획기적인 성능으로 실시간 제작 가능

    산자 피들러는 "1년 전까지만 해도 AI 모델이 이 정도 품질의 3D 비주얼을 생성하는 데 1시간이 걸렸지만, 이제는 10~12초 정도면 충분하다. 훨씬 더 빠른 속도로 결과를 생성할 수 있게 되면서 업계 전반의 크리에이터들이 거의 실시간으로 텍스트를 3D로 생성할 수 있게 됐다"고 설명했습니다. 이러한 발전으로 라떼3D는 엔비디아 리서치 데모에 사용된 엔비디아 RTX A6000과 같은 단일 GPU에서 추론을 실행할 때 거의 즉각적으로 3D 형상을 생성할 수 있게 되었습니다. 이는 엔비디아의 최신 기술을 활용하여 효율적이고 뛰어난 성능을 제공함을 보여줍니다.

    크리에이터들의 창의력을 높이는 도구

    크리에이터들은 처음부터 디자인을 시작하거나 3D 에셋 라이브러리를 일일이 찾아보는 대신 라떼3D를 활용하여 아이디어가 떠오르는 즉시 세부적인 개체를 생성할 수 있습니다. 이 모델은 각 텍스트 프롬프트에 따라 몇 가지 다른 3D 모양 옵션을 생성하며, 크리에이터에게 선택권을 제공합니다. 선택된 개체는 몇 분 내에 더 높은 품질로 최적화됩니다. 그 후 사용자는 해당 그래픽을 그래픽 소프트웨어 애플리케이션 또는 엔비디아의 옴니버스(Omniverse)와 같은 플랫폼으로 전송할 수 있습니다. 이를 통해 오픈USD(Universal Scene Description, OpenUSD) 기반 3D 워크플로우와 애플리케이션을 활용할 수 있습니다.

    A100 텐서 코어를 활용한 획기적인 훈련

    라떼3D의 훈련에는 엔비디아 A100 텐서 코어(Tensor Core) GPU가 사용되었습니다. 이를 통해 모델의 학습 속도와 효율성이 높아지면서 혁신적인 결과물을 얻을 수 있었습니다.

    다양한 텍스트 프롬프트의 활용

    라떼3D의 훈련에는 챗GPT(ChatGPT)를 통해 생성된 다양한 텍스트 프롬프트가 사용되었습니다. 이를 통해 모델은 다양한 문구를 처리하고 사용자가 원하는 특정 3D 개체를 생성하는 능력을 향상시켰습니다. 예를 들어, 여러 종류의 개를 묘사하는 프롬프트를 사용하여 모델은 다양한 개 모양을 생성하는 방법을 학습했습니다.

    엔비디아 리서치의 다학제적 연구

    엔비디아 리서치는 전 세계 수백 명의 과학자와 엔지니어로 구성되어 있으며, AI, 컴퓨터 그래픽, 컴퓨터 비전, 자율 주행 자동차, 로보틱스 등 다양한 분야에 대해 연구하고 있습니다. 이러한 연구는 엔비디아의 기술적 혁신을 이끌어내고 새로운 기술을 개발하는 데 중요한 역할을 합니다.


    연구원들은 엔비디아 GTC에서 확산 모델 훈련을 위한 최신 기술을 발전시키는 연구 결과를 공유하였습니다. 또한, 엔비디아 테크니컬 블로그에서도 이에 대한 자세한 내용을 확인할 수 있습니다.

    최신 엔비디아 AI 뉴스는 엔비디아 창립자 겸 CEO인 젠슨 황(Jensen Huang)의 GTC 기조연설 다시 보기를 통해 확인할 수 있습니다. 이를 통해 엔비디아의 최신 기술과 비전을 살펴볼 수 있습니다.

    • 네이버 블러그 공유하기
    • 네이버 밴드에 공유하기
    • 페이스북 공유하기
    • 카카오스토리 공유하기