엔비디아(NVIDIA)가 AI 이미지 생성의 효율성과 품질을 극대화하기 위해 블랙 포레스트 랩스(Black Forest Labs)와 손잡고 ‘플럭스.1 콘텍스트(FLUX.1 Kontext)’ 모델을 RTX GPU에 최적화했다.
이미지 생성 워크플로우 간소화, 고품질 비주얼·실시간 편집 환경 가능
엔비디아(NVIDIA)가 AI 이미지 생성의 효율성과 품질을 극대화하기 위해 블랙 포레스트 랩스(Black Forest Labs)와 손잡고 ‘플럭스.1 콘텍스트(FLUX.1 Kontext)’ 모델을 RTX GPU에 최적화했다.
이번 협업은 이미지 생성 워크플로우를 간소화하면서도 고품질 비주얼과 실시간 편집 환경을 가능하게 하는 핵심 기술로 주목받고 있다.
플럭스.1 콘텍스트는 텍스트 및 이미지 프롬프트를 모두 지원하는 맥락 기반의 오픈 웨이트 모델로, 직관적인 자연어 입력만으로 이미지 생성과 편집이 가능하다.
복잡한 마스크, 뎁스 맵, 엣지 맵 없이도 참조 이미지 기반의 유연한 스타일 변화와 정밀한 디테일 조정이 가능한 것이 특징이다.
엔비디아는 텐서RT(TensorRT)와 양자화 기술을 통해 모델을 최적화하여 VRAM 요구 사항을 대폭 줄였다.
이를 통해 RTX GPU 기반 디바이스에서 빠른 추론과 반복적인 편집을 안정적으로 구현할 수 있으며, ComfyUI와 Playground에서 즉시 사용할 수 있다.
또한 8월에는 엔비디아 NIM 마이크로서비스 버전도 공개될 예정이다.
모델의 유연성과 제어력은 다음과 같은 기능을 중심으로 돋보인다.
캐릭터 일관성은 다양한 장면과 각도에서도 고유 특성을 유지하고, 맞춤 편집은 이미지의 일부 요소만 선택적으로 수정할 수 있다. 스타일 전환은 참조 이미지의 분위기를 새로운 장면에 적용할 수 있으며, 실시간 수행으로 짧은 지연을 통해 빠른 피드백과 반복 생성을 지원한다.
모델 가중치와 텐서RT 변형은 허깅페이스(Hugging Face)를 통해 무료로 다운로드 가능하며, Ada 기반 FP8은 12GB, Blackwell 기반 FP4는 7GB 수준으로 줄여 로컬 환경에서도 실행할 수 있는 접근성을 확보했다.
특히 엔비디아 지포스 RTX 40/50 시리즈에 최적화된 SVD퀀트(SVDQuant) 기술이 고화질을 유지하면서도 효율적인 처리 속도를 제공한다.
AI 이미지 생성 외에도 구글이 최근 공개한 소형 언어모델 ‘젬마 3n(Gemma 3n)’도 엔비디아 RTX 및 젯슨(Jetson) 플랫폼에서 최적의 성능을 구현한다.
젬마 3n은 올라마(Ollama), Llama.cpp 기반 애플리케이션과 연동해 RTX로 가속된 자연어 처리 기능을 제공하며, AI 애호가 및 개발자들에게 폭넓은 활용 기회를 제공한다.
이와 함께 엔비디아는 7월17일까지 ‘프로젝트 G-어시스트 플러그인 해커톤’을 온라인으로 개최해 개발자들에게 맞춤형 AI 플러그인 제작의 기회를 제공한다.
오는 7월10일에는 G-어시스트 웨비나도 예정돼 있으며, 실시간 Q&A를 통해 다양한 정보를 교류할 수 있다.
엔비디아는 디스코드 서버 및 RTX AI 개러지 블로그 시리즈를 통해 커뮤니티 중심의 기술 공유와 콘텐츠 제작 지원에 박차를 가하고 있으며, AI PC와 워크스테이션을 통한 차세대 크리에이티브 혁신을 위한 정보도 지속적으로 제공하고 있다.
플럭스.1 콘텍스트를 비롯해 엔비디아의 최신 AI 기술은 엔비디아 공식 블로그 및 소셜 미디어 채널, 허깅페이스를 통해 확인 가능하며, 관련 뉴스레터를 통해 최신 소식도 받아볼 수 있다.