미쓰에이와 세르주 벨롱지의 대화: 위조 가능한 '총알'을 주세요|지아쯔광년

미쓰에이와 세르주 벨롱지의 대화: 위조 가능한 '총알'을 주세요 Jiazi Guangnian |

2024-07-31

위조 가능성은 천사이자 악마이며, 궁극적으로 위조 가능성은 세상을 일치시키는 악수입니다.

저자 | 장이지아 수호이‍‍

10년 전, 유럽의 한 학자가 나에게 이렇게 말했습니다.인공지능에는 세분화된 트랙이 백 개가 넘는데, 미국에서는 인기 있는 트랙을 한두 개 정의하게 됩니다. , 그리고 글로벌 기업가와 투자자들은 이 두 트랙을 따라잡기 위해 달려들었습니다. "

이후 10년 동안 인공지능의 추세는 순환하며 인공지능은 비합의에서 작은 합의로, 작은 합의에서 큰 합의로 바뀌었지만 이 문장은 한 번도 튀어나온 적이 없다.

Serge와의 이 대화는 그가 2년 전에 공동 집필한 논문에 대한 리뷰로 시작되었습니다."위조할 수 없는 주장의 구조 탐색" 의 관심. 이 글이 지금까지 거의 주목을 받지 못한게 아쉽네요, 구글 학술검색2번만 인용。

이것은 놀라운 일이다.

"Jiazi Guangnian"은 다음과 같이 믿습니다.이 에세이심하게 과소평가됨。

이유 1: 이 기사가 직면한 문제는 매우 중요합니다(소셜 미디어에서 위조할 수 없는 데이터에 대한 근본적인 설명).

두 번째 이유, 이 기사는 중요한 이론적 혁신(3항 주석 방법 및 SNaCK 세트)을 제공합니다.

세 번째 이유: 이 기사는 실용적인 엔지니어링 결과(데이터 세트 구성 및 자세한 실험 비교)를 제공합니다.

논문의 저자 Peter Ebert Christensen, Frederik Warburg, Menglin Jia 및 Serge Belongie ARXIV2022

이 논문은 이해하기 어렵지 않습니다.위조 가능성개념이 소개되기 시작합니다.

위조 가능성은 반박 가능성이라고도 합니다.과학철학에서는 종종 엄격한 용어를 사용한다.위조방법이론이 과학적인지 여부를 결정하는 것은"이러한 결론은 다음을 허용해야 합니다.논리에 대한 반례의 존재。

칼 포퍼(Karl Popper)는 1934년에 이론이나 가설이 기존 기술에 대한 경험적 테스트를 통해 논리적으로 모순될 수 있다면 다음과 같이 제안했습니다.위조 가능 의. 그리고 표현이 너무 흠잡을 데가 없어 세상에 논평의 여지가 없다면, 그것은 종종 모든 사람을 멀리하게 할 뿐이며, 이는 과학적 진보를 촉진하는 데 도움이 되지 않습니다.

과학자들이 연구할 수 있거나 연구해야 하는 문제는 다소 제한되어 다른 사람들이 문제를 공격하거나 심지어 뒤집을 수 있는 기회를 허용해야 합니다. 반증 가능성의 목적은 이론을 예측하고 테스트 가능하게 만드는 것입니다.그래서 실무에 유용하다。

세르게이의 논문"위조할 수 없는 주장의 구조 탐색"논의됨소셜 미디어에서 위조할 수 없는 주장을 해석하는 과정의 복잡성。

논문의 주요 아이디어:

소셜 미디어 플랫폼에는 게시물과 댓글이 넘쳐나고 있으며 많은 주장이 반박될 수 없습니다. 하지만,사실 확인 도구 부족, 소셜 네트워크 토론의 구조 부족, 내러티브 식별의 어려움, 공개 토론의 품질 부족등등 많은 고민을 하게 됩니다.

소셜 미디어에서 사람들을 식별하고 이해하는 방법을 조사한 논문위조할 수 없는 주장, 이러한 주장을 다음과 같이 요약합니다.한정된 수의 이야기, 소셜 미디어에서 토론과 논쟁을 더 쉽게 촉진하기 위해.

흥미롭게도 저자는 다음과 같은 도구를 만들었습니다.종이온라인 토론에서 지배적인 내러티브를 이해하고 발견하기 위한 공중화장실의 손 건조 방법(종이 타월 대 공기 건조기)에 대한 논쟁, 600개의 짧은 텍스트 발췌, 31개의 내러티브, 4개의 상위 카테고리가 포함된 데이터세트입니다.

이 논문에서는 다음과 같은 내용을 소개합니다.기존 팩트체크 기술의 역량을 뛰어넘는 새로운 접근방식는 디지털 커뮤니케이션 환경에서 위조할 수 없는 주장의 영향을 관리하고 이해하는 데 중요한 기여를 합니다. 이 프로세스를 사용하여 지배적인 내러티브를 발견하고 이 프로세스가 최근의 대규모 변환 모델과 최첨단 비지도 대상 모델을 능가한다는 것을 보여줍니다. .

실험을 통해,저자가 발견한현대 문장 변환기 사용(예: T5 모델)초기 문장 임베딩열쇠이다 .그들은 또한 샘플링 전략이 특히 고품질 임베딩을 생성하는 데 중요하다는 것을 발견했습니다."거리-Rnd" 전략최고의 성능.

실험 결과에 따르면 인간 주석을 결합하면세 쌍둥이준수 여부를 밝힐 수 있음결정화된 내러티브흥미로운 클러스터링.

인용은 2개뿐

"Jiazi Guangnian"은 이 논문이 지금까지 업계에서 관심을 받지 못한 이유는 다음을 포함하지만 이에 국한되지는 않는다고 생각합니다.

(1) 이론적 분석은 상대적으로 약하고 실험 결과 분석은 여전히 정성적입니다(11페이지 분량의 텍스트에는 공식이 절반 페이지만 포함되어 있습니다).

(2) 비교에 사용되는 여러 알고리즘에 대한 소개는 거의 없습니다.

(3) 이 분야의 학계에는 아직 통일된 데이터 세트가 없어 학계 내에서 "외부" 현상이 발생하지 않을 수 있습니다.

(4) 저자는 T5의 중요성을 강조했지만, 알고리즘의 우수성을 명확하게 설명하지 않았습니다.

CVPR2024에서 Serge Belongie의 학술 공유, 출처: 사진 촬영: "Jiazi Guangnian"

위에서 언급한 논문은 거의 알려지지 않았지만 Serge 자신은 컴퓨터 비전 및 기계 학습 분야에서 매우 영향력 있는 과학자입니다. 그는 주로 객체 인식 및 이미지 분할을 연구합니다. 그의 다양한 논문은 총 1,78971만 회 인용되었습니다.

Serge Belongie는 코펜하겐 대학교 컴퓨터 과학 교수이자 덴마크 인공 지능 개척 센터 소장입니다. 이전에는 Cornell Tech의 컴퓨터 과학 부학장이자 Andrew H. 및 Ann R. Tisch 교수를 역임했습니다.

가장 소개할만한 가치가 있는 것은Serge는 MSCOCO의 주요 저자입니다.。

MSCOCO 데이터세트는 컴퓨터 비전 분야에서 가장 유명한 대규모 데이터세트 중 하나입니다.2000년 Serge와 Jitendra Malik(현 캘리포니아 버클리대학교 컴퓨터과학과 교수이자 컴퓨터 비전 분야의 유명 학자)“Shape Context” 개념을 공동 제안했으며,컴퓨터 비전 및 객체 인식 분야에서 널리 사용되는 모양 특징 설명 방법입니다.

2004년 Serge는 2007년 MIT Technology Review에서 35세 미만의 젊은 기술 혁신가로 선정되었습니다. 그와 Jitendra Malik은 2015년에 Marr 상을 수상했습니다. Serge는 ICCV Helmholtz 상을 수상했습니다. 이 상은 주로 작가에게 수여됩니다. 컴퓨터 비전 분야에 근본적인 기여를 한 논문의 목록입니다.

Serge는 또한 Digital Persona(2014년 CrossMatch와 합병), CarCode(Transport Data Systems에서 인수), Anchovi Labs(2012년 Dropbox에서 인수) 및 Orpix를 포함한 여러 회사의 공동 창립자이기도 합니다.

현재 Serge 팀은소셜 네트워크 분석의 새로운 차원을 열다——기존에 주목받지 못했던, 전통적인 팩트체크에 적합하지 않은 수많은 사소한 발언들부터 시작하여,이슈 설정을 분석하고“서술적 조작”。

이는 현재 특히 중요합니다.

세계 반파시스트 전쟁 이후 기술의 발전이나 병목 현상이 번갈아 나타나더라도 그들은 모두 시간이 지나면서 역사적 그림의 부침을 경험했습니다. 시공간 좌표계에서 펼쳐지는 "청명제 강변"처럼 고대와 현대 존재의 수천 가지 장면과 모습이 가득합니다.

다음은 A씨와 Serge의 대화 내용이다.

공개 계정 'Jiazi Guangnian'을 팔로우하고 백그라운드에서 '위조될 수 있음'이라고 답하면 기사에 언급된 정보를 얻을 수 있습니다."위조할 수 없는 주장의 구조 탐색"그리고MSCOCO 데이터 세트두 개의 논문.

1. 위조 가능성에 대한 문제가 제기되고 있습니다.

실제로 연구자들은 자신이 좋아하거나 싫어하는 이야기의 영향을 받는 경우가 많습니다. 이는 Instagram의 인기 주제와 다소 유사합니다.

미스에이: “반증할 수 없으면 과학적일 수 없다”는 것이 과학계의 일반적인 합의가 되었습니다. 그러나 많은 철학자들은 반증 가능성의 원칙이 끝없는 과학적 논쟁으로 이어질 수 있다고 주장하면서 이에 대해 의문을 제기해 왔습니다.반증가능성은 과학적 진보를 위한 필수 조건인가?

서지：대중의 의견에 따르면, 과학 이론은 반증 가능해야 합니다.

미스에이:이것이 대중적인 관점이지만, 반증 가능성이 지배적인 패러다임입니까?

서지: 머신러닝 관련 문헌은 지난 15년 동안 매일 수많은 논문이 출판되고 인용되면서 폭발적으로 증가했습니다. 이들 논문에서 관련 작업 섹션은 종종 다른 문헌을 인용하지만, 인용된 내용이 반드시 해당 작업과 가장 관련성이 높은 문헌은 아닙니다. 이는 문학의 양이 엄청나기 때문입니다.연구자들은 실제로 해당 분야의 지배적인 내러티브에 반응하고 있습니다.

우리는 종종 우리 자신을 위조 가능한 주장에만 종속되는 칼 포퍼(Karl Popper) 전통을 따르는 과학자라고 생각합니다. 그러나 생성적 적대 생성 네트워크 및 트랜스포머와 같은 기술과 같은 과학 연구에도 추세가 있습니다. 이 논문들은 과학적 전통을 따르는 것을 목표로 하고 있지만,연구자들은 자신이 좋아하거나 싫어하는 이야기에 의해 실제로 영향을 받는 경우가 많습니다.——인스타그램의 인기 주제와 비슷합니다.。

미스에이:머신러닝 이후 과학자들이 반증 가능성의 표준에서 벗어나기 시작했다는 뜻인가요?

서지:과학자들은 종종 이러한 영향에 영향을 받지 않는다고 주장하고 스스로 객관적이라고 생각하지만, 결국 그들은 인간이고 이러한 대중적 의견에 좌우될 것입니다.이것은 우리가 비과학적이고 직감과 의견에 가깝다고 생각하는 것입니다.

미스에이:소셜 미디어에서 위조할 수 없는 주장을 어떻게 정의하나요?

서지: 먼저 팩트체킹에 관한 문헌을 논의할 필요가 있다. 예를 들어, 코펜하겐 대학의 Isabelle Augenstein 교수는 진술의 검증 가치를 결정하는 것부터 시작하는 방법을 개발했습니다. 명세서를 확인해 보겠습니다.0~1 범위의 검증값을 결정합니다.。

예를 들어, 캘리포니아의 수도가 새크라멘토라는 진술은 구조화된 여러 지식 기반에서 찾을 수 있으므로 문법 및 구문 검사에 이상적입니다. "캘리포니아의 수도는 새크라멘토입니다"와 같은 진술을 조사하고 아마도 0.99에 가까운 테스트 가능성 점수를 부여할 수 있습니다. 그런 다음 답변을 확인하기 위해 구조화된 지식 기반에 제출합니다. 이 딥러닝 기반 테스트 가능성 시스템은 다양한 주장의 검증 가치를 평가하기 위해 대량의 주장과 교육 데이터를 처리합니다.

그러나 일부 진술은예를 들어, "캘리포니아로 이민하는 것은 나쁘다"라는 표현은 개인적인 의견이 더 많이 반영되어 사실 확인에 적합하지 않습니다.반면, “2020년 이후 캘리포니아 이민자 수가 계속해서 증가하고 있다” 등의 진술은 검증가치가 높다.

그래서우리는 확인하기 어려운 주장에 특히 주의를 기울입니다.——이러한 주장은 직접적으로 검증될 수는 없지만 소셜 미디어에서 촉발된 논의는 상당합니다.。여러 번 확인하면 더 나은 판단을 내리는 데 도움이 될 수 있습니다.

미스에이:귀하의 연구에서 위조할 수 없는 주장을 식별하고 분석하기 위해 어떤 특정 기술이나 도구가 사용됩니까?

서지:우리는 자연어 처리(NLP) 기술, 클러스터링 및 그룹화 알고리즘, 기계 학습 방법을 사용합니다.

우리의 목표는GNIF(글로벌 서사 정보 시설) 구축, 소셜 미디어 콘텐츠를 조사하고 정리하기 위해。

이러한 기술과 도구의 결합을 통해 우리는 많은 양의 내러티브 콘텐츠를 더 잘 이해하고 처리할 수 있습니다.위조할 수 없는 주장을 식별하는 데 간접적으로 도움이 됩니다.。

다양한 형태의 텍스트를 분석할 수 있습니다.트윗이든 Reddit 댓글이든, 우리는 NLP 기술을 사용하여 이 콘텐츠의 내러티브와 주제를 추출하고 이해합니다.

둘째, 우리가 사용한클러스터링 및 그룹화 알고리즘 . 이러한 알고리즘은 많은 양의 소셜 미디어 콘텐츠를 다양한 테마나 내러티브로 구성하는 데 도움이 됩니다.

예를 들어,수백만 개의 트윗 중에서 매우 유사한 수천 개의 트윗을 찾을 수 있습니다. 왜냐하면 모두 동일한 기본 내러티브를 다루기 때문입니다.

통과하다내러티브 클러스터링 및 어설션 그룹화 , 우리는 많은 양의 콘텐츠를 더 작은 클러스터로 구성하여 사실 확인 담당자가 각 항목을 개별적으로 확인할 필요 없이 더 효율적으로 처리할 수 있도록 합니다. 이러한 방식으로 위조할 수 없는 주장이라도 클러스터링 및 그룹화를 통해 식별하고 분류하여 추가 분석 및 처리를 용이하게 할 수 있습니다.

우리는 두 개의 트윗, 즉 두 개의 입력을 고려하고 서로 다른 서술적 측면을 기반으로 유사성을 측정합니다.여기에는 원자력과 녹색 에너지 논쟁, 유아용 조제분유와 우유에 대한 토론과 같은 주제가 포함될 수 있습니다.

온라인에는 뜨거운 논쟁이 벌어지는 주제가 많이 있으며, 이는 종종 허위 정보 캠페인의 결과입니다.。 이러한 활동은 매우 모호할 수 있습니다. 우리가 이해하려고 하는 것은 이러한 다양한 진술이 이미지, 텍스트, 오디오 진술 등을 포함할 수 있는 언어나 밈의 형태로 어떻게 나타나는지입니다.전혀 다른 내용인 것 같네요 . 소셜 미디어 플랫폼에서 특정 주제에 관한 수백만 개의 토론을 수집할 수 있지만 모든 데이터는 단지 수십 개의 의견만을 나타낼 수 있습니다. 우리는 대규모 언어 모델, 심층 메트릭 학습과 같은 기술을 통해 이러한 현상을 이해하려고 노력합니다.

사람이 주석을 단 쌍의 시각화, 하위 그림(a)는 긍정적인 쌍, 즉 사람이 주석을 단 유사하거나 일관된 서술 쌍을 보여줍니다. 하위 그림 (b)는 음수 쌍, 즉 인간이 라벨을 붙인 서로 다르거나 일관성이 없는 서술 쌍을 보여줍니다. 출처: "위조할 수 없는 주장의 구조 검색"

2. '참과 거짓'을 넘어서

모든 주장이 사실 확인을 받을 자격이 있는 것은 아니며, 모든 사실 확인이 참 또는 거짓 결과를 낳는 것은 아닙니다.

미스에이: 귀하가 생성한 MSCOCO 데이터세트는 가장 유명한 대규모 컴퓨터 비전 데이터세트 중 하나입니다. 어떻게 시작됐나요?

서지: 우리는 15년 전에 200종 이상의 조류가 포함된 작은 데이터세트 CUB200으로 시작하여 물체 감지 연구를 시작했습니다. COCO 데이터 세트는 원래 Microsoft Research의 박사 과정 학생인 Tsung-Yi Lin의 여름 인턴십 프로젝트였습니다. 당시 그의 멘토는 저의 또 다른 박사 과정 학생인 Piotr Dollá였습니다. 이 프로젝트는 학계와 산업체 연구자들의 컨소시엄으로 발전했습니다. 그들은 자연 환경에 있는 일상적인 물체를 자세히 설명하고 해당 물체의 이름과 공간 위치에 정확하게 주석을 추가하는 데이터세트를 만들고 싶어합니다.

미스에이: 데이터세트 이름을 MSCOCO로 지정했습니다. 저는 "코코"를 아주 좋아하는데, 영어 이름도 코코예요.

서지:예, 우리 모두는 "COCO"라는 이름을 좋아합니다. 재미있고 기억하기 쉽습니다.

미스에이:MSCOCO 데이터 세트가 등장한 이후 컴퓨터 비전 분야의 발전은 로켓을 타는 것과 같았습니다.

서지:글쎄요, 우리는 이를 중심으로 점점 더 많은 지식 커뮤니티를 조직했으며 수백만 명의 사람들이 COCO를 사용했습니다.우리는 작게 시작하여 결국 엄청난 영향을 미치는 연구 분야를 개발했습니다.

내가 참석한 첫 번째 컴퓨터 비전 컨퍼런스는 역시 시애틀에서 열린 CVPR 1994였습니다. 30년 전의 일인데 참석자 수는 약 300명 정도였습니다. 이제 2024년 시애틀 CVPR에는 12,000명이 컨퍼런스에 참석하고 있습니다.

미스에이:30년이 지났는데, 컴퓨터 비전과 인공지능 연구에 대한 변함없는 열정을 불러일으키는 원동력은 무엇입니까?

서지: 제가 기억하는 한, 저는 패턴과 사물 분류에 관심을 가져왔습니다. 중학교 때 나사, 볼트 및 기타 고정 장치를 분류하는 수업 프로젝트를 진행했습니다. 대학에 다니는 동안 나는 오디오 패턴, 특히 새나 고래의 소리와 같은 생체 음향학에 관심을 갖게 되었습니다.이미지적인 면에서 제 마음을 사로잡은 것은 지문과 얼굴이었습니다.

영상에서 입술을 읽는 방법을 연구했습니다. 이 문제의 모든 측면, 즉 오디오와 시각의 융합, 서로 다른 스피커 간의 차이, 계산상의 어려움 등이 저를 매료시켰습니다. 1990년대 초, 디지털 카메라가 막 출시되기 시작했지만 아직 컴퓨터를 이해하는 어떤 형태도 없었습니다. 요즘에는 뷰파인더에 얼굴 인식 프레임이 있거나 가족 전체의 사진을 지능적으로 정리하는 사진 앨범 소프트웨어가 있다는 것을 당연하게 여길 수도 있지만 당시에는 그런 것이 없었습니다.

당시 이 기술에 대한 수요가 매우 클 것이라고 느꼈고, 동시에나는 또한 기술 뒤에 숨은 수학을 좋아합니다. . 나는 이 분야에 사용되는 기술을 좋아했지만 수학이나 물리학을 전공하고 싶지 않았습니다. 예를 들어 복잡한 수학적 방법을 사용하여 사운드, 비디오 및 이미지 처리 문제를 해결합니다.

나는 이 세상에서 나의 사명이 이런 일을 하는 것이라고 늘 느낀다.

미스에이:올해 CVPR에서는 어떤 학문적 나눔을 하셨나요?

서지: 우리 팀은 주요 CVPR 컨퍼런스에서 여러 개의 논문을 제출했고, 두 번의 세미나에서도 이를 공유했습니다. 보고서 중 하나는 컴퓨터 비전 연구의 역사에 관한 것인데, 주로 젊은 학자들이 고전적인 컴퓨터 비전 기술, 즉 딥러닝과 전환 이전의 기술을 이해하도록 돕기 위한 것입니다. 2011년 CUB200 데이터세트의 확장 버전 출시로 시작된 비시피디아(Visipedia) 프로젝트도 소개했습니다. 현재 Visipedia의 연구 콘텐츠는 수만 종의 식물, 동물, 균류로 확장되어 자연의 물체 인식을 위한 중요한 연구 기반을 제공하고 있습니다.

또 다른 보도는 오늘 인터뷰에서 제가 중점적으로 공유하고 싶은 내용인데, 특히 소셜 미디어의 발전과 관련된 내러티브, 여론, 허위 정보에 관한 것입니다.

미스에이:당신의 작업이 현장에 어떤 혁신을 가져왔나요?

Serge: 허위 정보와 소셜 미디어 세계의 고전적인 문제는 사실 확인입니다.。 예를 들어 코펜하겐 대학교에는 관련 연구가 많이 있습니다. 일반적인 접근 방식은 확인이 필요한 특정 발언에 대해 인공 지능 시스템을 사용하여 관련 사실을 검색하고 사실을 기반으로 0에서 1 사이의 진위성 점수를 예측하는 것입니다.

미스에이:이 접근 방식의 문제점은 무엇입니까?

서지:이 방법 자체에는 큰 문제가 없으며 문제 자체에서 문제가 발생합니다.모든 주장이 사실 확인을 받을 자격이 있는 것은 아니며, 모든 사실 확인이 참 또는 거짓 결과를 낳는 것은 아닙니다. 예를 들어 "판다는 중국의 국보이다"라는 문장은 구조화된 지식 기반과 대량의 데이터를 통해 모델을 훈련하고 진위 여부를 검증하는 데 사용할 수 있는 진술이다. "캘리포니아로 이사한다"는 문장에서는 그렇지 않습니다.

미스에이:그렇다면 후자와 같은 진술에서 연구 잠재력이 있다고 보시나요?

Serge: 이 후자 유형의 진술은 광범위하게 연구되지 않았지만 똑같이 중요한 문제입니다. 이러한 진술은 참/거짓에 대한 엄격한 정의가 없을 수 있지만 소셜 미디어에서 많은 토론을 불러일으킵니다. 팩트체크만 하면 되는 시대에는 이런 도전이 존재하지 않았다. 그러나 오늘날 고도로 발전한 소셜 미디어에서는 과학적으로 특성화하기 어렵거나, 위조할 수 없는 주제가 열띤 토론을 촉발하는 유형이 되었다. 연구할 가치가 있다.

미스에이:실제 영향을 미쳤거나 심각한 갈등을 야기한 사례를 알려주실 수 있나요?

서지: 이 질문을 해주셔서 기쁘네요. 흥미로운 예를 들어보겠습니다. 공중화장실에서 손을 씻은 후 건조시키는 방법에는 두 가지가 있습니다. 중국에서는 어떤 방법이 일반적으로 사용되는지 잘 모르겠습니다. 유럽에서는 종이 타월을 꺼내거나 열풍 건조기를 사용할 수 있습니다.

미스에이:이 두 가지 방법은 중국에서도 가장 일반적입니다.

서지: 건조기와 종이 타월 제조업체는 호텔 체인과 계약을 체결하여 많은 돈을 벌 수 있으며 전체 시장은 아마도 수십억 달러의 수익을 창출할 것입니다. 그러나 현재 유럽의 많은 사람들은 두 방법의 차이점에 대해 매우 강한 견해를 가지고 있습니다. 많은 사람들은 이러한 방법 중 하나가 질병을 퍼뜨릴 수 있다고 말하고, 다른 사람들은 많은 전기를 사용하거나 종이를 만드는 것이 나무를 낭비하여 환경을 파괴할 것이라고 말합니다. 이러한 견해를 갖고 있는 대부분의 사람들은 공중 보건이나 환경 전문가가 아닙니다.

미스에이:주장 자체가 사실인가요?

Serge: 소셜 미디어의 많은 주제는 엄격하게 입증되거나 위조될 수 없기 때문에 사실 우리는 우리 진술의 진위 여부에 관심이 없습니다. 그러나 이 주제가 제기된 이유는 소수의 사람들이 한 가지 방법이 다른 방법보다 낫다는 것을 대중에게 확신시키기를 원하기 때문입니다. 그들은 아마도 수십만 개의 봇 생성 콘텐츠를 만들었을 것입니다. 요즘 소셜 네트워크에서 종이 타월과 공기 건조기에 대한 토론을 검색하면 수백만 개의 댓글을 찾을 수 있습니다. 우리의 연구는 두 접근 방식의 장단점을 엄격하게 비교하고 사실 확인 결과를 제시하는 데 중점을 두지 않습니다.우리는 이러한 설계된 문제를 탐지하는 데 더 관심을 갖고 있습니다.

3. 소셜 미디어에 설정된 “COCO” 데이터

성급한 결정을 내리지 마십시오.

A씨: 귀하의 연구는 또 다른 차원을 열어 주었습니다.전통적인 사실 확인은 의미론의 진실성에 초점을 맞추는 반면, 연구는 진술이나 주장의 진실성에 중점을 둡니다.분명한화용론——예측의 목표는 그것이 사실인지 아닌지에 국한되지 않고 특정 목적을 달성하기 위해 일부 사용자 또는 소셜 네트워크의 수많은 로봇이 만든 주제 토론으로 확장됩니다.이 연구가 무엇을 의미하는지 아시나요?

서지: 그렇습니다. 우리는 완전히 새로운 것을 창조하고 있습니다. 우리가 알고 있는 대부분의 관련 연구는 사실 확인에만 초점을 맞추고 있습니다. 그러나 우리는 개인, 기업 및 전략 입안자가 소셜 미디어에서 무슨 일이 일어나고 있는지 이해할 수 있도록 주제 관련 자연어 기술을 사용하여 소셜 미디어에 대한 토론을 그룹화하고 클러스터링하려고 노력하고 있습니다.우리는 이러한 주제와 논의 내용에 대해 가치판단을 내리지 않으며, 각 이슈가 제기되는 형태만을 객관적으로 표현합니다.

미스에이: 이 목표를 달성하려면 먼저 데이터세트가 필요합니다. 이 데이터 세트를 구축하는 것은 큰 도전이 될 것입니다. 컴퓨터 비전 연구를 개척하면서 작은 새 데이터 세트에서 COCO로 확장했습니다. 이번에는 어떻게 접근하셨나요?

서지: 이러한 유형의 소셜 네트워킹 행동은 종종 한 가지 특징으로 특징지어집니다. 한 주제에 대해 백만 개의 트윗이 있을 수 있으며 토론에 참여하는 계정은 수천 개로 보입니다.그러나 분석을 통해 우리는 수십만 개의 트윗이 실제로 매우 유사하거나 심지어 동일한 서술로 정확히 동일한 내용을 게시했음을 알 수 있습니다. 하지만 이것이 이러한 논의가 옳고 그름을 의미하는 것은 아니라는 점을 명심하세요. 우리는 사용자가 다양한 진술의 클러스터와 그룹화를 볼 수 있도록 하여 사실 확인 담당자와 소셜 네트워크 분석가가 갑자기 쏟아지는 수백만 개의 트윗을 처리할 필요 없이 대량의 콘텐츠를 더 쉽게 처리하고 이해할 수 있도록 해줍니다.

미스에이:이 시스템으로 소셜미디어에서 논란이 되는 다양한 주제를 실시간으로 처리할 수 있을까요?

서지:나는 그럴 수 있다고 생각하고, 그러기를 바란다. 지중해에서 러시아 선박과 미국 선박 두 척이 만난다고 가정해 보겠습니다. 소셜 네트워크에서 토론이 시작되고 이야기가 탄생합니다. 선장의 진술이나 휴대폰 녹음을 포함하여 몇 시간마다 새로운 정보가 나타납니다. 이 경우 일부 내러티브와 문제는 주목을 받는 반면 다른 이야기와 문제는 관련성이 없게 될 수 있습니다.

미쓰에이: 그랬으면 좋겠다실시간문제를 잡아？

서지:및 기타 정보.전문 외교관을 돕기 위해 우리는대시보드(계기반) , 포괄적인 관련 정보를 제공하고 이러한 이벤트를 세계적 맥락에 배치합니다.이 시스템은사람들이 성급한 결정을 내리지 않도록 하세요. . 시스템 자체가 어느 쪽이 옳은지를 결정하는 것이 아니라, 오히려 정보를 종합적으로 정리한다는 점을 강조하고 싶습니다.

미스에이:안정적인 기능을 달성하려면 어떤 문제점을 해결해야 합니까?

Serge: 전통적인 과제와 새로운 과제가 모두 있습니다. . 전통적인 문제에는 언어, 문화 및 정서적 편견의 영향이 포함됩니다.

예를 들어, "인어공주"와 "미운 오리새끼"는 모두 덴마크 작가의 작품이지만 디즈니 영화 버전의 이야기는 미국 문화에 맞게 조정되었습니다. 소셜 네트워크에서 덴마크 이야기보다 미국 이야기가 더 많이 지배하기 때문에 Andersen 이야기의 원본 버전은 다른 많은 국가의 인터넷 사용자들 사이에서 거의 알려지지 않았습니다.

데이터 주석 처리 과정에서, 특히 소셜 네트워크 데이터의 주석 처리는 언어와 문화의 영향을 받습니다. 또 다른 예는 감정 분석이 이미 사실 확인의 중요한 부분이고, 감정 예측 모델 자체가 훈련에 많은 편견과 고정관념을 가질 수 있다는 것입니다.AI 모델 훈련은 가비지 인(garbage in)과 가비지 아웃(garbage out) 과정으로, 훈련 데이터로 인해 발생하는 문제를 해결하기 어렵습니다. 따라서 모델이 어떤 훈련 데이터를 사용하는지 이해해야 합니다.사람의 개입 없이 사실을 확인하는 것은 존재하지 않는다(신뢰할 수 없다)고 말할 수 있습니다.

미스에이:새로운 도전은 무엇입니까?

Serge: 언어 모델에 의해 생성된 잘못된 콘텐츠는 우리가 직면한 새로운 과제입니다. 이전의 가짜 소셜 미디어 계정에는 따라야 할 매우 간단한 패턴이 있는 경우가 많았습니다. 그러나 GPT 및 이미지 생성 모델을 사용하면 가짜 계정 생성자가 더 복잡하고 자연스러운 가짜 프로필을 생성한 다음 실제처럼 보이는 가짜 소셜 미디어 계정을 생성할 수 있습니다. 이러한 계정은 기존의 가짜 계정 식별 모델로는 쉽게 찾을 수 없습니다. 이러한 생성적 AI 모델은 기존 사실 확인 작업에도 상응하는 과제를 안겨줍니다. 그러므로,제너레이티브 AI는 허위 정보를 생성하고 식별하는 것이 이 시대의 고양이와 쥐 게임이 될 것입니다.

4.AI 미래

그들(OpenAI)은 아직 우리의 계획을 알지 못할 수도 있습니다.

미스에이:이러한 과제는 단순히 모델을 통해서 해결될 수 있는 것이 아니라, AI와 인간의 협력 차원으로까지 올라갈 수 있을 것으로 보입니다.너~인 것 같다항상 새로운 차원에서 새로운 문제를 발견하고 단순한 관점에서 해결하십시오.

서지:예.우리의 새로운 아이디어는 Wikipedia와 비교할 수 있습니다. 사람들은 한때 동일한 Wikipedia 노드에는 동일한 의미를 가진 다른 언어의 페이지만 필요하다고 생각했습니다. 현실은 언어만 다른 것이 아니라는 것입니다.

언어, 문화, 가치관, 전통 등 모든 요소가 동일한 항목의 여러 페이지에 함께 혼합되어 있습니다. 예를 들어, 원자력과 화석 연료는 언어와 세계 지역에 따라 매우 다르게 다루어집니다. 따라서 이는 우리가 구축하려는 AI 시스템이 완전히 자동화된 것도 아니고 독립형 모델도 아니라는 점을 상기시켜 줍니다. 이는 인간이 관여하는 시스템입니다. 즉, 데이터에 라벨을 지정하고 구성하고 다양한 부분을 설명하려면 전 세계의 다양한 인간 커뮤니티가 필요합니다.편견은 항상 존재하기 때문에 이것은 크고 심오한 문제입니다.

미스에이:따라서 MSCOCO와 마찬가지로 데이터를 최대한 포괄적이고 공정하게 구성하는 것 자체가 이 연구의 목표입니다.

서지: 이는 다양한 유형의 커뮤니티를 조직하는 과정입니다. 세계 각지에서는 다양한 연령층의 사람들이 문학, 역사, 과학 등 다양한 전공을 공부하며 각 분야마다 고유한 이야기가 있습니다. 제가 설명하는 연구가 성공하려면,다양한 주제를 이해하는 주석이 많이 필요합니다.에 의해。 전문가일 필요는 없지만, 내러티브와 이슈의 유사점을 알기 위해서는 원자력, 기업가 정신, 암호화폐 등 태그할 콘텐츠에 대한 지식이 필요합니다. 따라서 가장 큰 과제는 기본적인 AI 컴퓨팅 및 저장 시설이 아닌 커뮤니티 구성입니다.

미스에이:Sam Altman이나 Yann Lecun이 당신의 생각에 대해 논평했습니까?

Serge: 그들은 아직 우리의 계획을 알지 못할 수도 있습니다.

미스에이:나는 이니셔티브의 첫 번째 단계를 목격하고 있는 것 같습니다.더 높은 차원의 문제를 발견하고 가장 직접적인 진입점을 찾으세요.

Serge: 많은 기술처럼 문제 감지를 위해 이 인프라를 개발하면 좋은 쪽으로 사용될 수도 있고 나쁜 쪽으로 사용될 수도 있습니다.따라서 많은 상용 AI와는 달리우리는 개방적이고 투명하며 감사 가능한 관리 시스템을 개발하려고 노력합니다. . 따라서 우리는 완전히 투명한 지식 기반을 갖게 되며 사용자는 데이터가 포함된 시기와 주석을 달았던 주석자를 포함하여 데이터의 편집 기록을 볼 수 있습니다.

미스에이:데이터의 정확성과 객관성을 어떻게 보장할 수 있나요?

서지:간단한 대답은,우리는 보장할 수 없습니다。

그러나 우리가 할 수 있는 최선은 다양한 토론 영역에 관심이 있는 수만 명의 사람들을 끌어들이고 시스템에 주석을 달 수 있는 시스템을 만드는 것입니다. 가능한 한 많은 주석자를 확보하면 통계적 객관성을 확보하는 데 도움이 됩니다. Wikipedia에도 투명성과 책임성을 위해 설계된 메커니즘이 있으며 우리도 그렇게 할 것입니다.

미스에이:이 연구가 정책 입안자, 교육자 및 기술자에게 어떤 영향을 미칠까요?

Serge: 논리적이거나 사실적인 추론을 보완하기 위해 우리가 하고 있는 일을 생각해 보세요.

어떤 회사가 다양성, 형평성, 포용성을 개선하기를 원한다고 가정해 보겠습니다. 그래서 이사회는 여성이나 소수자를 더 많이 고용하는 것을 논의하기 위해 회의를 열었습니다. 이러한 유형의 논의는 많은 회사에서 흔히 볼 수 있으며, 예를 들어 한 대학에서는 전기 공학을 전공하는 여성이 많지 않을 수 있으며 학과에서는 이를 변화시키기 위한 조치를 취하고 싶어합니다. 이러한 회의에서는 지식이나 정보가 뒷받침되지 않는 많은 토론이 있을 수 있습니다.

어떤 사람들은 여자가 수학을 잘 못한다는 편견을 표현하기도 합니다. 이러한 토론을 주도해야 하는 학과장, CEO 또는 교사를 도울 수 있고 시스템에서 일련의 내러티브를 추출하여 토론을 구조화할 수 있는 시스템이 필요합니다. 또한 시스템이 작동하기 시작하면 진술을 기존 내러티브로 색인화하고 구문 분석합니다. 이렇게 하면 CEO, 교사 또는 회의 진행자는 품질이 낮거나 혼란스러운 대화를 피할 수 있으며 토론을 안내하고 중복 대화를 방지하는 효과적인 구조 및 분류 시스템을 가질 수 있습니다.

미스에이:미래 소셜 미디어 내러티브와 이슈 분석을 위해 기술 발전을 위한 잠재적인 연구 방향은 무엇이라고 생각하시나요?

서지: 다양한 분야에는 고유한 과제가 있습니다. 그 중 일부는 대량의 데이터 처리 및 레이블 지정 방법, 편견 완화 방법 등과 같은 고전적인 문제입니다. 하지만 우리는 시각화에 관해서도 큰 어려움에 직면해 있습니다.

우리는 서로 다른 언어와 문화가 직면하는 차이점을 언급했습니다. 각각의 특정 주제에는 다양한 관점이 있으며, 다양한 주석 작성자는 각자의 편견으로 인해 다양한 주석을 제공합니다. 정보 이론의 관점에서 이러한 다양한 계정을 압축하려고 시도하면 정보가 손실되거나 손상될 수 있습니다. 이러한 유형의 질문은 프로젝트 전반에 걸쳐 발생하며 자주 접하게 됩니다.

미스에이: 당신의 생각에는 시각 기술의 어떤 최신 발전이 미래에 지대한 영향을 미칠 것이라고 생각하시나요?

서지: 이제 점점 더 많은 연구자들이 하나의 모델에서 이미지, 텍스트, 오디오와 같은 여러 데이터 유형을 동시에 처리하는 다중 모드 데이터에 주목하기 시작했습니다. 이 방법은 일반적으로 Transformer와 같은 모델 아키텍처를 사용하여 복잡한 실제 문제를 해결합니다. . 이러한 추세는 앞으로도 계속될 것이며, 앞으로 인공지능 분야에 입문하는 사람들은 자연어 처리나 컴퓨터 비전과 같이 한 분야만 탐구하는 것보다 여러 전문 기술을 동시에 습득하는 것이 더 자연스럽다는 것을 알게 될 것입니다.

개인적으로 인공지능이 의사를 완전히 대체할 것이라고 주장하는 사람들도 있지만 이 말은 과장된 것이라고 생각합니다. 하지만 저는 방사선과, 피부과, 조직병리학과 같은 분야에서 AI 지원 시스템이 널리 보급되어 모든 사람에게 도움이 될 것이라고 확신합니다.

자율주행차에 대해서는 과거에도 비전 기술과 인공지능의 발전으로 자율주행차가 널리 보급될 것이라는 예측이 있었지만, 그럴 가능성은 낮다고 봅니다. 정부가 기존 자동차의 특정 차선 운행을 제한하거나 전면 금지하는 조치를 취하지 않는 한 미국에서 자율주행차가 표준이 될 가능성은 거의 없습니다.

미스에이 : 나는 당신의 논문을 좋아해요. 내 생각도 비슷해요.기술 발전은 동시에 새로운 인지 차원을 열어줍니다. 가장 가치 있는 방법론은 최소한의 진입점을 가지면서도 전반적인 상황을 전달할 수 있는 방법입니다.

서지:어떤 방법론에 가장 관심이 있나요?

미스에이:작은 예를 들어보세요.반증 가능성의 길을 따라, 과학은 부정의 부정의 반복적인 길을 시작하게 될 것입니다...우리 모두에게 친숙한 과학 혁명의 구조로 돌아가는 것입니다.

*Hang Zhou도 이 기사에 참여했습니다.

이 글은 학문적 논의를 포함하고 있으므로, 저자에 대한 간략한 소개는 다음과 같습니다.

Jiazi Guangnian의 창립자인 Zhang Yijia는 2013년 북경대학교 수리과학과를 졸업하고 국립발전연구소에서 경제학 학위를 이중 취득했으며 중국 수학 올림피아드에서 금메달을 획득했습니다. 국가 훈련 팀, 그의 연구 관심 분야는 금융 수학과 게임 이론이며 북경 대학교 수리 과학 학교의 책임자로 재직하고 있습니다.
Jiazi Brain 책임자인 Zhou Hang은 2019년 북경대학교 수리과학대학을 졸업했습니다. 그의 연구 방향은 희소 최적화와 비볼록 최적화입니다.

*참고자료

반증 불가능한 주장에서 구조 찾기.pdf
978-3-319-10602-1_48.pdf "Microsoft COCO: 컨텍스트 내 공통 개체" MSCOCO 데이터 세트: Serge의 가장 많이 인용된 논문.
토마스 사무엘 쿤 <과학혁명의 구조>

|미스에이대화 시리즈 검토|

소식

미쓰에이와 세르주 벨롱지의 대화: 위조 가능한 '총알'을 주세요 Jiazi Guangnian |

소개

내 연락처 정보