ChatGPT загрязняют академический круг

2024-08-01

умные вещи
Составил Чэнь Джунда
РедактироватьПанкен

Согласно вчерашнему отчету ведущего академического журнала Nature, использование генеративного ИИ в академических текстах привело к взрывному росту. Соответствующие исследования показывают, что 10% рефератов статей в PubMed, крупнейшей базе данных в области биомедицины, подозреваются в написании ИИ, что эквивалентно участию ИИ в 150 000 статей ежегодно.

Исследования Берлинского университета прикладных наук в Германии показывают, что средняя точность основных инструментов обнаружения AIGC составляет всего 50%, и легко определить, что текст, написанный человеком, генерируется искусственным интеллектом. Однако многие статьи, созданные ИИ, можно легко скрыть путем перефразирования, замены синонимов и т. д. Кроме того, труднее обнаружить использование инструментов искусственного интеллекта носителями английского языка.

Хотя инструменты искусственного интеллекта и раньше широко использовались в академических кругах, использование генеративного искусственного интеллекта для прямого вывода статей или написания текстов до сих пор остается спорным. Инструменты искусственного интеллекта облегчают плагиат и могут привести к неправомерному использованию контента, защищенного авторским правом.

Письмо с помощью ИИ не лишено своих достоинств. Многие ученые используют генеративное письмо с помощью ИИ, чтобы избежать проблем с публикацией статей на незнакомых языках и могут сосредоточиться на самих научных исследованиях. Многие журналы разрешают использование генеративных инструментов искусственного интеллекта, но требуют от авторов подробно раскрывать их использование в своих статьях.

1. ИИ может быть задействован в написании 150 000 тезисов, и вероятность того, что английский язык не является носителем языка, будет обнаружена с большей вероятностью

С момента выпуска ChatGPT в конце 2022 года использование ИИ в академических текстах резко возросло. Исследования Тюбингенского университета в Германии показывают, что в первой половине 2024 года не менее 10% рефератов биомедицинских статей будут написаны с использованием ИИ, что составляет примерно 150 000 статей в год на ежегодной основе.

Эта исследовательская группа проанализировала рефераты 14 миллионов статей в биомедицинской базе данных PubMed с 2010 по 2024 год. Они обнаружили, что после появления инструментов генеративного искусственного интеллекта, представленных ChatGPT, использование определенных модифицирующих стилистических слов резко возросло. Исследовательская группа использовала частоту употребления этих слов, чтобы оценить долю тезисов, написанных с использованием ИИ.

Исследователи также обнаружили, что использование письменных инструментов искусственного интеллекта также различается в разных странах. Их данные показывают, что в газетах из таких стран, как Китай и Южная Корея, инструменты письма с использованием искусственного интеллекта используются чаще, чем в газетах из англоязычных стран.

▲Выросло использование стилистической лексики в академическом письме (Источник: «Природа»)

Согласно анализу исследовательской группы, частота использования ИИ авторами в англоязычных странах может быть такой же, как и в других странах, но то, как они его используют, выявить сложнее.

Фактически, до того, как возникла эта волна генеративного ИИ, ИИ уже использовался в таких областях, как открытие лекарств и предсказание структуры белков. Эти применения не вызывали особых споров. Причина этого может заключаться в том, что в таких приложениях ИИ явно играет роль. роль. Это все-таки второстепенная роль.

Применение генеративного ИИ в академических текстах порождает две основные проблемы. С одной стороны, плагиат упрощается благодаря генеративному ИИ. Плагиаторы могут использовать генеративный искусственный интеллект, чтобы перефразировать исследования других людей в стиле академических журналов. Перефразированный текст, как правило, менее похож на исходный текст, поэтому его трудно расценить как плагиат.

Кроме того, модель ИИ потребляет большое количество защищенного авторским правом контента в процессе обучения, и с большой вероятностью модель будет выводить пользователю защищенный авторским правом контент без каких-либо подсказок. The New York Times однажды обнаружила, что чат-бот OpenAI ChatGPT с искусственным интеллектом напрямую выводил оригинальные слова отчета New York Times, не указывая источник. Они также подали в суд на OpenAI за нарушение прав.

2. Инструменты обнаружения терпят неудачу в игре в кошки-мышки. Их можно легко обойти и легко оценить.

В ответ на растущее использование инструментов искусственного интеллекта многие компании запустили инструменты обнаружения контента AIGC, но эти инструменты потерпели неудачу в «игре в кошки-мышки» с генеративным искусственным интеллектом.

В конце прошлого года несколько ученых из Берлинского университета прикладных наук в Германии опубликовали исследование. Они обнаружили, что только 5 из 14 инструментов обнаружения искусственного интеллекта, обычно используемых в научных кругах, достигли точности более 70%. Средняя точность распознавания составляет всего 50%-60%.

▲Основные средства обнаружения AIGC, представленные на рынке, работают плохо (Источник: Вебер-Вульф и др.)

Эти инструменты обнаружения AIGC работают еще хуже, когда сталкиваются с контентом, созданным искусственным интеллектом, отредактированным людьми и расшифрованным машинами. При выполнении всего лишь простых операций, таких как замена синонимов и корректировка порядка слов, точность инструмента обнаружения AIGC снизится до менее чем 50%. Исследования показали, что точность комплексного распознавания средств обнаружения AIGC составляет всего 50%.

▲05 и 06 на рисунке — это соответственно текст после редактирования человеком и машинного перефразирования, сгенерированный ИИ. Инструмент обнаружения AIGC очень плохо работает с этими двумя типами текста (Источник: Вебер-Вульф и др.).

Данные показывают, что имеющиеся на рынке инструменты распознавания AIGC обладают высокой точностью идентификации рукописных документов. Однако если автор сначала пишет оригинальную статью на языке, с которым он знаком, а затем просит программу перевода перевести ее на другой язык, инструмент идентификации может ошибочно принять ее за AIGC. Это может оказать крайне негативное влияние на академическую репутацию преподавателей и студентов.

3. Границы между письменным сопровождением и академическими нарушениями размыты, и инструменты письма с искусственным интеллектом также имеют свою ценность.

Однако использование генеративных инструментов искусственного интеллекта действительно приносит удобство некоторым исследователям. Хенд Аль-Халифа, исследователь информационных технологий из Университета короля Сауда в Эр-Рияде, рассказал, что до появления инструментов генеративного искусственного интеллекта многие коллеги, не владевшие английским языком, сталкивались с большими трудностями при написании статей, и теперь эти ученые могут сосредоточиться. на самом исследовании вместо того, чтобы тратить слишком много времени на написание.

Грань между письмом с помощью ИИ и академическими нарушениями провести сложно. Сохейл Фейзи, ученый-компьютерщик из Университета Мэриленда, считает, что использование генеративного ИИ для перефразирования содержания существующей статьи является явным плагиатом.

Но использование инструментов ИИ для выражения мнений не должно наказываться. При условии упреждающего раскрытия информации об использовании инструментов ИИ исследователи могут использовать подробные слова-подсказки для создания текста или использовать инструменты ИИ для редактирования черновиков.

Многие журналы также стандартизировали использование инструментов ИИ в академических текстах, не запрещая это напрямую. Ведущий академический журнал «Наука» оговаривает, что ИИ не может быть указан в качестве соавтора, а автор должен раскрыть систему ИИ и подсказать использованные слова, а также нести ответственность за достоверность содержания и отсутствие подозрений на плагиат.

▲Соответствующие положения об использовании ИИ в научном журнале «Наука» (Источник: Официальный сайт академического журнала «Наука»)

Академический журнал Nature требует, чтобы исследователи фиксировали использование генеративных инструментов искусственного интеллекта в разделе «Методы исследования». Статистика показывает, что по состоянию на октябрь 2023 года 87 из 100 ведущих журналов разработали рекомендации по использованию инструментов генеративного ИИ.

Вывод: инструменты искусственного интеллекта — это не беда, только изменение академической ориентации может устранить основную причину.

В прошедшем выпускном сезоне многие отечественные университеты также внедрили инструменты тестирования AIGC в процессе защиты и рассмотрения дипломных работ. Однако введение этого показателя не привело к эффективному пресечению академических нарушений, связанных с инструментами ИИ. На рынке также существуют различные сервисы, специализирующиеся на снижении уровня ИИ. Многие студенческие работы были ошибочно приняты за сгенерированные ИИ и были изменены до неузнаваемости из-за снижения уровня ИИ.

Принятие состязательного подхода к инструментам генеративного ИИ в академических исследованиях, возможно, не сможет решить эту проблему. Ученые из Берлинского университета прикладных наук в Германии также подчеркнули, подводя итоги исследования, что проблему злоупотреблений ИИ в академических текстах трудно решить только с помощью обнаружения AIGC. Ключом к решению проблемы является корректировка академической атмосферы, ориентированной на бумагу и результат. решение этой проблемы.

Источник: «Природа»

Новости

ChatGPT загрязняют академический круг

Введение

моя контактная информация