2024-08-16
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
(이미지 출처: 언스플래시)
8월 16일 티타늄 미디어 앱 소식국내 AI 스타트업 '상하이 미타 네트워크 테크놀로지 주식회사'(이하 '미타 테크놀로지')는 CNKI가 최근 AI 검색 스타트업 미타 테크놀로지에 AI 검색 결과에 학술 정보를 게재한 것에 대해 경고 서한을 보냈다고 밝혔다. 문서의 제목, 목차, 요약은 심각한 침해에 해당하며 침해 통지서는 28페이지에 달합니다.
시크릿타워기술이 강조하는 것은,이러한 행동을 이해하지 못하더라도 회사는 CNKI의 선택을 존중합니다. 이제부터 Secret Tower AI Search에는 더 이상 CNKI 문서의 서지 및 초록 데이터가 포함되지 않으며, 대신 다른 권위 있는 중국어 및 영어 지식 기반의 서지 및 초록 데이터가 포함됩니다. 다른 데이터베이스도 협력하고 논의할 수 있습니다.
MiTa Technology는 2018년에 설립된 것으로 알려졌습니다. 이 회사의 CEO인 Min Kerui는 이전에 Cheetah Mobile의 수석 과학자였으며 현재 북경 대학교 법률 인공 지능 연구소의 수석 지능형 과학자입니다.
2018년에는 법률 AI 번역 제품인 'MiTa Translation', 오류 정정 및 교정 제품인 'MiTa Writing Cat'을 잇달아 출시했고, 2022년에는 기사 생성 제품인 'Quantum Sketch'를 출시해 일주일 만에 일일 사용자가 10,000명을 돌파했습니다. 온라인에 접속하는 것.
올해 3월부터 미타테크놀로지가 만든 '미타 AI 검색'이 돌연 인기를 끌며 한 달간 홈페이지 방문자 수는 700만 건을 넘었다. 웹사이트 접속 데이터 모니터링 플랫폼인 유사 웹(Similar Web)에 따르면 3월 미타 검색(MiTa Search) 방문 건수는 중국 AI 제품 그룹 중 바이두 원신 이옌허(Baidu Wenxin Yiyanhe)에 이어 2위를 차지했다.달의 어두운 면키미;이달의 성장률은 550%에 도달했습니다.
올해 8월, MiTa Technology는 Ant Group이 주도하여 1억 5천만 달러(약 10억 7700만 위안)의 사후 가치 평가를 통해 1억 위안 이상의 시리즈 A 자금 조달을 완료했다고 발표했습니다. Secret Tower의 이전 주주로는 Mingshi Capital, Cheetah Mobile 및 Fengyuan Capital이 있습니다.
제품 측면에서는 기존 검색 엔진에 비해 AI 검색은 사용자에게 질문에 대한 답변을 직접 제공하고 소스 링크를 첨부합니다. MiTa AI 검색 공식 웹사이트는 '간결', '심층', '연구'의 세 가지 답변 모드를 제공하며 검색 범위는 '전체 네트워크', '도서관', '학술', '팟캐스트' 및 '팟캐스트'로 설정할 수 있습니다. 다른 소스.
Southern Metropolis Daily에 따르면 통지서에 대한 후속 조치와 관련하여 Mita Technology의 최고 운영 책임자인 Wang Yiwei는 CNKI가 통지서에서 어떤 권리와 이익이 침해되었는지 구체적으로 명시하지 않았다고 밝혔습니다. CNKI의 "학술" 섹션에 대한 MiTa AI 검색은 CNKI로 트래픽을 가져올 수도 있습니다. 일부 사용자는 MiTA AI 검색을 통해 CNKI 계정을 활성화하고 CNKI 비용을 지불하는데, 이는 그 자체로 CNKI에 이익이 됩니다. CNKI의 연결 끊기 요구 사항을 고려하여 "우리는 어떤 교차로도 강요하지 않을 것입니다."
Wang Yiwei에 따르면 이전 AI 검색 결과는 CNKI에 연결되었을 뿐만 아니라 다른 권위 있는 중국어 및 영어 데이터베이스에서는 아직 연결 해제를 요청하지 않았습니다.그러나 CNKI 링크를 끊어도 MiTa 제품의 경험에는 영향을 미치지 않습니다.
Titanium Media App은 다음과 같은 사실을 알게 되었습니다.CNKI의 모회사인 Tongfang CNKI(Beijing) Technology Co., Ltd.는 최근 Huawei와 협력하여 지식 서비스, 과학 연구, 탐구 학습, 생산 및 운영, 보조 진단 및 치료, 스마트 사법 등 분야의 시나리오.
Tongfang CNKI의 총책임자인 Zhang Hongwei는 올해 7월 CNKI가 교육, 과학 연구, 싱크 탱크, 정부, 기업을 포함하여 전 세계 90개 이상의 국가에 사용자를 보유하고 있는 업계 최고의 디지털 출판 및 지식 서비스 회사라고 밝혔습니다. , 과학 연구 기관, 특히 국내 교육 연구 기관은 기본적으로 100% 시장 점유율을 가지고 있습니다. 현재 Tongfang CNKI는 중국 국가 원자력 공사(China National Nuclear Corporation)에 소속되어 있으며, 전 세계 70여 개국의 20,000개 이상의 출판 기관과 협력 관계를 구축해 왔습니다. 시스템을 구축하고 세계 최대 규모의 중국어 지식자원 도서관을 운영하고 있습니다.
Zhang Hongwei는 Huazhi 대형 모델을 기반으로 회사가 처리 및 주석부터 다양한 산업을 위한 서비스 플랫폼에 이 도구를 추가하는 것까지 CNKI 제품 전체 라인에 대한 심층적인 변화를 수행했다고 지적했습니다. 올해 5월 중순 공식 오픈한 이후 화지 이용자 수가 급격히 늘어나 현재 개인 이용자 수가 1000만명을 넘어섰다.
그러나 CNKI는 여러 차례 벌금을 부과받았고, 업계에서는 개발 모델에 대해 다소 의구심을 품고 있다. 2022년 12월 26일, 국가시장감독관리총국은 법에 따라 CNKI에 불법 활동을 중단하라고 명령하는 행정처벌 결정을 내렸고, 2021년 CNKI의 중국 국내 매출의 5%에 해당하는 17억 5200만 위안의 벌금을 부과했습니다. 2023년 9월 중국 사이버공간관리국은 법에 따라 CNKI의 네트워크 보안 검토와 관련된 행정처벌 결정을 내리고 개인정보 불법 처리를 중단하라는 명령을 내리며 50위안의 벌금을 부과했습니다. CNKI가 운영하는 모바일 CNKI와 CNKI 운영을 인용해 14개 앱 모두 필요의 원칙을 위반해 개인정보를 수집하고, 동의 없이 개인정보를 수집하고, 수집 및 이용 규정을 공개하지 않거나 명시하지 않는 등 관련 문제가 있다는 혐의를 받았다. , 계정 해지 기능을 제공하지 않으며, 사용자가 계정을 해지한 후 사용자의 개인정보를 적시에 삭제하지 않습니다.
중국 정법대학 비교법 연구소의 Liu Wenjie 교수는 초록은 논문 내용, 특히 인터넷 사용자에게 검색 서비스가 제공되는 경우 생각과 아이디어를 집중적으로 요약한 것이라고 믿습니다. 논문 초록을 제공하기 위해 인터넷에서 공개 데이터를 크롤링하는 것은 저작권법에 따라 공정 사용으로 간주되어야 하며 일반적으로 저작권 침해를 구성하지 않습니다.
최근 국제적으로 유명한 저널 Nature의 편집자인 Elizabeth Gibney는 점점 더 많은 학술 출판사가 AI 모델 훈련을 위해 연구 논문을 기술 회사에 라이선스하고 있다는 기사를 발표했습니다. 한 학술 출판사는 이를 통해 2,300만 달러를 벌었지만 저자는 0달러를 벌었습니다. 많은 경우 저자와 상의하지 않은 이러한 거래는 일부 연구자들 사이에서 강한 불만을 불러일으켰습니다.
"귀하의 논문이 AI 훈련 데이터로 사용되지 않았다면 곧 훈련의 일부가 될 가능성이 높습니다." Elizabeth Jipney는 기사에서 현재 학술 논문의 저자가 저작권이 있는 저작물을 판매하는 출판사와 마주할 때 거의 선택의 여지가 없다고 지적했습니다. 간섭. 공개적으로 게재된 기사의 경우 해당 콘텐츠가 AI 훈련 데이터로 사용되는지 확인할 수 있는 메커니즘이 기존에 없습니다. 대규모 언어 모델을 사용함에 있어 창작자의 권리와 이익을 보호하기 위한 보다 공정한 메커니즘을 구축하는 방법은 학계와 저작권계에서 광범위한 논의가 필요합니다.
대규모 언어 모델(법학 석사) 일반적으로 훈련을 위해 인터넷에서 스크랩한 대량의 데이터에 의존합니다. 이 데이터에는 수십억 개의 언어 정보("토큰"이라고 함)가 포함되어 있으며, 이러한 토큰 간의 패턴을 분석하여 모델은 유창한 텍스트를 생성할 수 있습니다. 학술 논문은 풍부한 콘텐츠와 높은 정보 밀도로 인해 대량의 일반 데이터보다 가치가 높으며 AI 훈련에 있어서 중요한 데이터 소스입니다. Mozilla 재단의 데이터 분석가인 Stefan Baack은 과학 논문이 특히 과학 주제에 대한 추론 능력 측면에서 대규모 언어 모델 훈련에 매우 유용하다고 분석했습니다. 주요 기술 기업이 데이터 세트를 구매하는 데 막대한 돈을 지출하는 것은 바로 데이터의 높은 가치 때문입니다.
상하이 다방 법률 사무소의 수석 파트너이자 변호사인 유 윤팅(You Yunting)은 MiTa AI 검색의 '학문' 섹션의 가장 큰 문제점은 기사의 내용을 완전히 표시할 수 있다는 점이라고 말했습니다. 연구 결과는 다운로드할 수 없으나 결과 페이지에서 확인할 수 있다.” PDF 링크를 클릭하면 해당 논문의 전문을 볼 수 있는데, 이는 해당 논문의 온라인 정보 유포 권리를 침해하는 행위이다.” AI가 기사의 본질을 흡수하여 자신의 방식으로 사용자에게 전달하는 경우, 저작권법에 따라 특정 문제를 설명하기 위해 저작물의 일부를 합리적으로 인용하는 것은 공정 사용으로 간주됩니다.
대형 모델 훈련을 위해 종이 데이터를 사용하는 것과 관련하여 You Yunting은 이러한 행위가 중국 국가 지식 인프라를 침해하지 않는다고 말했습니다. 저작권법에 따르면 교육 과정은 복사 및 학습입니다. 복사는 학습을 위해 인터넷에서 기사를 서버로 복사하는 것입니다. 학습이 침해에 해당하는지 여부를 판단하는 명확한 법적 판단은 현재 없습니다. 그러나 그것이 복제권, 연구권, 기타 저작권과 관련된 권리라면 CNKI는 논문의 권리자가 아닙니다.
Zhang Hongwei는 대규모 AI 모델 시대에 CNKI가 생태계를 구축하고 협력해야 한다고 솔직하게 말했습니다.
“업스트림도 없고, 출판산업도 없고, 데이터산업에서 양질의 데이터가 지속적으로 공급되지 않는다면 우리 인공지능 산업이 고품질의 발전을 지속하기는 사실상 어려울 것입니다. 이러한 문제를 해결하기 위해 우리는 실제로 지혜를 시험해 보려면 업계 전체가 함께 노력해야 합니다.AIGC시대의 좋은 생태는 이 산업의 고품질 발전을 공동으로 촉진할 것입니다. 저희 CNKI는 업계의 지속 가능하고 고품질 발전을 촉진하기 위해 이러한 측면에서 모든 사람들과 기꺼이 협력할 것입니다. "라고 장훙웨이가 말했다.