소식

데이터가 부족하면 어떻게 해야 할까요? 푸단대학교의 xiao yanghua 교수는 두 가지 해결책을 제안했습니다.

2024-09-07

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

레드스타캐피털뷰로(red star capital bureau)는 빅데이터 시대에 데이터의 가치가 아직 충분히 탐구되지 않았다고 보고했다. 데이터 기술이 핫한 분야입니다. 연구기관 에포크ai(epoch ai)가 지난 6월 발표한 보고서에 따르면, 2026년부터는 인간이 생성하는 새로운 데이터의 양이 모델이 학습하는 새로운 데이터의 양보다 적어질 것으로 추정된다. 2028년까지 데이터.
데이터는 지능의 상한선을 어느 정도 결정하므로 대형 모델 기술이 더 많이 혁신될수록 더 많은 데이터 기술이 데이터에 "조율"되어야 합니다.
2024년 bund 회의에서 푸단대학교 교수이자 상하이 핵심 데이터 과학 연구소 소장인 xiao yanghua는 red star capital bureau 및 기타 언론과의 인터뷰에서 데이터 고갈 문제를 해결하는 데 두 가지 경로가 있을 수 있다고 말했습니다. 미래에. 첫 번째는 합성 데이터이고, 다른 하나는 개인 도메인으로 이동합니다.
샤오양화
"많은 사람들이 사서오경에 주석을 달았습니다. 주석 과정은 데이터 합성 과정과 같습니다. 원본 데이터를 지속적으로 생각하고 연관시키고 통합하여 더 많은 데이터를 생성할 수 있습니다. 이것이 합성 데이터입니다." , 합성 데이터는 매우 중요한 아이디어입니다. 이는 데이터 고갈 문제를 완화할 뿐만 아니라 매우 중요한 의미를 갖습니다.
“합성된 데이터의 대부분은 우리의 사고 과정에 대한 데이터입니다. 합성 데이터를 통해 암묵적이고, 기록되지 않고, 표현되지 않고, 사고에 초점을 맞춘 많은 양의 데이터가 iq를 자극하거나 이성적으로 표현됩니다. 대형 모델의 능력.”
xiao yanghua는 현재의 대형 모델이 "지능만 있고 합리성은 없다"고 언급했지만 더 많은 사실을 기억할 뿐 더 "똑똑하다"는 의미는 아니며 합리적인 능력이 향상되지 않았습니다. 합성 데이터는 합리적 능력을 향상시키는 데 매우 중요한 아이디어입니다.
"사고 과정을 시뮬레이션하는 합성 데이터를 사용하여 대형 모델을 훈련하여 문제에 대해 어떻게 생각하는지 알 수 있습니다. 따라서 합성 데이터는 데이터 '기근'을 완화할 뿐만 아니라 대형 모델의 합리적 능력을 향상시키는 역할도 합니다. ."
xiao yanghua가 언급한 또 다른 매우 중요한 아이디어는 개인 영역으로 들어가는 것입니다. "보다 고품질, 고가치 데이터는 개인 영역, 수직 산업, 수천 개의 산업에 있으며 더 나아가서는 개인 데이터입니다. 따라서 개인 영역과 개인은 여전히 ​​귀중하고 매우 독창적이며 독창적인 데이터를 많이 보유하고 있습니다. 그러나 우리는 이 데이터를 활성화하지 않았으며 아직 대형 모델에 주입하지 않았습니다. 대형 모델은 아직 이 지식을 학습하지 않았습니다. 개인 도메인 속성을 사용하여 대형 모델의 잠재력을 활성화하는 방법도 매우 중요합니다. 앞으로의 일."
xiao yanghua는 개인 도메인 데이터가 모두 데이터베이스 시스템에 있다고 말했습니다. 이러한 데이터베이스에는 다양한 형태의 고품질 개인 도메인 데이터와 업계 데이터가 포함되어 있습니다. 프라이빗 도메인 데이터를 사용하여 대형 모델을 교육할 수 있다면 대형 모델을 업계 전문가로 전환하는 것이 가능합니다.
"오늘날의 대형 모델은 일반적인 지식만 있고 전문적인 작업을 수행할 자격이 없습니다. 이를 달성하려면 개인 도메인 데이터를 잘 활용하는 것이 핵심일 수 있으므로 활용될 데이터의 잠재력은 여전히 ​​매우 큽니다."
xiao yanghua는 또한 '개인 데이터'를 기대했습니다. 그는 개인 데이터를 사용하여 대형 모델을 훈련하기 시작했다고 지적했습니다. 그는 다음 단계는 개인 데이터를 대형 모델과 결합하는 것이라고 생각합니다. 개인 데이터를 대형 모델과 결합하여 개인에게 서비스를 제공하는 방법에는 여전히 큰 잠재력이 있습니다. 아직 갈 길이 멀다.
레드 스타 뉴스 기자 왕 티안
편집자 덩링야오
(레드스타 뉴스를 다운로드하고 보고서를 제출하면 상품을 받을 수 있습니다!)
보고/피드백