소식

팬시테크의 비밀을 밝힌다: '강한 감소'와 '초융합'의 알고리즘 혁신

2024-08-25

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

최근 기술 변화의 물결 속에서 AIGC(인공지능 생성 콘텐츠)는 사람들의 자기 표현과 창작을 위한 중요한 도구로 자리잡고 있습니다. 이러한 기술 혁신의 물결을 이끄는 원동력은 단지 거대한 알고리즘 모델이 아니라 특정 분야의 요구 사항에 초점을 맞춘 심층적인 맞춤형 솔루션입니다. 지난 2년 동안 AIGC는 예상보다 빠르게 발전했으며, AIGC의 응용 프로그램은 텍스트 생성에서 전체 범위의 이미지 및 비디오로 확장되었습니다.
최근 '하트 오브 더 머신'은 팬시테크(FancyTech)라는 중국 스타트업과 단독 인터뷰를 진행했다. 회사는 표준화된 상업용 영상 콘텐츠 생성 제품을 제공하여 시장을 빠르게 확장했을 뿐만 아니라, 실제 응용 분야에서 수직 모델의 장점을 최초로 입증했습니다.
"Heart of the Machine"에서는 또한 FancyTech의 최신 비디오 수직 모델인 DeepVideo를 자세히 소개합니다. DeepVideo는 비디오 속 제품을 정확하게 복원하고 자연스럽게 통합하는 방법에 대한 과제를 성공적으로 충족하여 제품이 계속 움직이도록 보장합니다.
FancyTech의 수직 모델은 오픈 소스 기본 알고리즘 프레임워크를 기반으로 하며 자체 데이터 주석이 추가되고 재교육되며 좋은 생성 결과를 얻기 위해 지속적인 교육 반복을 위해 수백 개의 GPU만 필요합니다. 대조적으로, "제품 데이터"와 "훈련 방법"이라는 두 가지 요소는 최종 구현 효과에 더 중요합니다.
팬시테크는 대량의 3D 훈련 데이터 축적을 바탕으로 모델의 2D 콘텐츠 생성을 안내하는 공간지능 아이디어를 도입했다. 이미지 콘텐츠 생성 측면에서는 상품의 복원을 보장하기 위한 '멀티모달 기능 장치'를 제안하고, 특별한 데이터 수집을 통해 상품과 배경의 자연스러운 통합을 보장했습니다. 영상 콘텐츠 생성 측면에서 팀은 영상 생성, 방향성 디자인 프레임워크, 데이터 엔지니어링의 기본 링크를 재구축하여 제품 중심의 영상을 생성했습니다.
또한 "Heart of the Machine"에서는 FancyTech이 공간 지능 연구 아이디어를 시각적 생성 모델에 적용하는 방법을 심층적으로 보여줍니다. 기존 생성 모델과 달리 공간 지능은 대량의 센서 데이터를 분석하고 정밀한 보정을 수행하여 모델이 실제 세계를 인식하고 이해할 수 있도록 합니다.
FancyTech은 기존 스튜디오 촬영 대신 LiDAR 스캐닝을 사용하고, 대량의 고품질 3D 데이터를 축적했습니다. 이러한 데이터는 2D 데이터와 결합되어 모델 교육 데이터로 사용되어 모델의 실제 세계에 대한 이해를 크게 향상시킵니다.
시각적 콘텐츠 생성에서 빛과 그림자 효과를 형성하는 까다로운 작업을 위해 FancyTech는 각 환경에 밝기와 색온도를 조정할 수 있는 여러 개의 조명을 배치하여 가능한 한 많은 자연광과 그림자 데이터를 수집하여 생성된 이미지의 공간적 레이어링을 개선했습니다.
이 고강도 데이터 수집은 실제 촬영 장면의 조명을 시뮬레이션하여 전자상거래 장면의 특성에 더욱 부합하도록 만듭니다. FancyTech은 고품질 3D 데이터 축적을 결합하여 알고리즘 프레임워크에서 일련의 혁신을 이루었습니다. 공간 알고리즘과 이미지 및 비디오 알고리즘을 유기적으로 결합하여 모델이 핵심 개체와 환경 간의 상호 작용을 더 잘 이해할 수 있도록 했습니다.
AIGC 분야에서는 상용화 탐색이 멈추지 않았다. 공감대가 있지만 발전 방향도 다르다. '강한 환원'과 '초융합'을 뒷받침하는 FancyTech의 알고리즘 혁신 기사에서 공개된 '기계의 심장'.
FancyTech의 "다중 모드 기능 생성기"는 제품 기능을 다차원으로 추출한 다음 이러한 기능을 사용하여 장면에 혼합되는 이미지를 생성합니다. 특징 추출은 전역 특징과 지역 특징으로 나누어지며, 전역 특징은 제품의 윤곽선, 색상 등의 기본 요소를 포함하며 VAE 인코더를 사용하여 추출되며, 로컬 특징은 제품의 세부 사항에 중점을 두고 그래프 신경망을 통해 추출됩니다. 이 방법을 사용하면 제품 내부의 특징을 세부적으로 캡처할 수 있으며, 이를 통해 제품 세부 정보 복원의 정확도가 향상됩니다.
상용화 과정에서 일반 모델을 채택하든, 수직형 모델을 채택하든 최종 목표는 상업적 성공이다. FancyTech는 풍부한 고유 데이터와 업계 전문성을 활용하여 국내외 시장에서 폭넓은 인지도를 얻었으며 삼성, LG 및 동남아시아의 미국 Lazada 전자상거래 플랫폼과 같은 국제 파트너와 협력 관계를 구축했습니다. 케이트 서머빌(Kate Somerville)과 솔라웨이브(Solawave) 등 유럽 현지 브랜드의 사랑을 받아 LVMH 혁신상을 수상하며 유럽 고객과 긴밀한 협력 관계를 맺고 있다.
또한 팬시테크는 AI 단편 영상의 풀링크 자동 퍼블리싱과 데이터 피드백 기능도 제공해 지속적인 제품 매출 성장을 효과적으로 견인하고 있다.
수직형 모델의 성공적인 적용은 상업 시장의 발전을 촉진할 뿐만 아니라 일반 대중이 AIGC 기술을 보다 쉽게 ​​활용하여 생산성을 향상시킬 수 있게 해줍니다.
기술의 확산으로 이제 거의 모든 사람이 휴대폰을 통해 비디오를 촬영하고, 음악을 녹음하고, 자신의 창작물을 전 세계와 공유할 수 있습니다. 우리는 AIGC 기술이 다시 한 번 개인의 창의성을 발휘하여 일반 사람들도 쉽게 전문적인 문턱을 넘고 아이디어를 현실로 전환할 수 있게 하여 각계각층에서 생산성 도약을 촉진하고 더 많은 신흥 산업을 탄생시키는 미래를 기대합니다.
Text/AI에 중점을 둔 Lin Ke
보고/피드백