2024-08-20
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
8월 19일, 2024년 베이징 인공지능 생태계 회의에서 고부가가치 코퍼스를 위한 신뢰할 수 있는 순환 인프라 구축이 공식적으로 시작되었습니다. 블록체인, 프라이버시 컴퓨팅 등 첨단 정보기술의 호위를 받아 대형 인공지능 모델의 질적 성장을 뒷받침하는 코퍼스 데이터는 무질서한 순환을 끝내고 표준화된 운영의 '고속도로'로 탈바꿈할 것이다. 이는 인공지능을 위한 대규모 모델 훈련 고지 형성을 가속화하고 우리나라 인공지능의 추월과 도약 발전을 촉진하는 데 큰 의미가 있습니다.
최근 몇 년 동안 인공지능 기술은 급속도로 발전하여 국가 경제의 핵심 분야에서 점점 더 중요한 역할을 하고 있습니다. 대규모 모델 학습에 사용되는 고가치 코퍼스 데이터는 대규모 인공지능 모델 개발에 있어서 중요한 '연료'와 같습니다. 그러나 고가치 코퍼스 데이터는 단위, 산업, 지역에 걸쳐 분산되어 있으며 충분한 개인 정보 보호 및 효과적인 순환 인센티브 메커니즘이 부족하여 결과적으로 고가치 코퍼스 데이터 소유자는 "감히 공유하지 않거나" "공유를 꺼리는 경우가 많습니다." 공유합니다." . 대량의 고가치 코퍼스 데이터는 “공급, 유통, 활용이 어렵다”며 우리나라 인공지능의 발전에 걸림돌이 되고 있다.
고부가가치 말뭉치의 신뢰할 수 있는 유통 인프라는 국가 블록체인 기술 혁신 센터와 베이징 에너지 그룹이 주도하고 있으며, 신화통신 국가 중점 연구소, 인민일보 온라인, 고등 교육 출판부(Higher Education Press)와 우리나라의 일반 기술 그룹(General Technology Group)이 주요 데이터 단위로 공동 창설되었습니다. 블록체인과 개인 정보 보호 컴퓨팅으로 대표되는 차세대 정보 기술은 신뢰할 수 있는 인증서 저장, 변조 방지, 손쉬운 권리 확인, 데이터의 완전한 보호 등의 특성으로 인해 말뭉치 데이터의 신뢰할 수 있고 안전한 유통, 사용 및 관리를 보장할 수 있습니다. 개인 정보 보호 및 보안은 위의 문제를 효과적으로 해결합니다.
국가 블록체인 기술 혁신 센터 담당자에 따르면 고부가가치 코퍼스 신뢰 순환 인프라는 우리나라의 독립적으로 제어 가능하고 성능이 뛰어난 블록체인 소프트웨어 및 하드웨어 기술을 사용하여 전국적인 분산 코퍼스 데이터 연결 코퍼스를 구축할 것입니다. 공급자, 처리자 및 수요자는 전국적으로 분산된 말뭉치 데이터에 대한 신뢰할 수 있는 접근을 달성하고, 이를 통해 지역 전반에 걸쳐 검색 및 액세스할 수 있도록 하며, 동시에 혁신적인 개인 정보 보호 컴퓨팅 기술을 사용하여 "데이터가 유출되지 않음"을 통해 고품질 말뭉치 데이터 세트를 형성합니다. "도메인, 사용 가능 및 보이지 않음" 접근 방식은 대규모 모델의 고가치 코퍼스 데이터가 처리 및 모델 교육 중에 승인 없이 전파될 수 없도록 보장합니다. 또한 이 인프라는 코퍼스를 제공하기 위해 스마트 계약을 통해 온체인 인센티브도 수행합니다. 자원과 순환은 지속 가능한 내생적 힘을 제공합니다.
고가치 코퍼스 데이터의 신뢰할 수 있는 순환 인프라 지원을 통해 국가 주요 코퍼스 데이터 단위도 블록체인 및 프라이버시 컴퓨팅을 기반으로 신뢰할 수 있고 안전한 코퍼스 데이터 순환 사양을 개발하여 코퍼스 데이터의 순환 및 부가가치를 위한 지속 가능한 시스템을 형성할 것입니다. 가치가 높은 코퍼스 데이터.
출처: 베이징 데일리 클라이언트
기자: 손치루