Моя контактная информация
Почта[email protected]
2024-08-15
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Отчет о сердце машины
Редакция «Машинное сердце»
Бить тревогу или двигаться к закрытию?
«ACL — это не конференция по искусственному интеллекту (ACL — это не конференция по искусственному интеллекту)», — на конференции ACL 2024, проходившей в Бангкоке, Таиланд, председатель ACL в этом году Эмили М. Бендер пришла к очень противоречивому выводу.
Конференция ACL — ведущая международная конференция в области компьютерной лингвистики и обработки естественного языка. Она организуется Международной ассоциацией компьютерной лингвистики и проводится ежегодно. Конференция ACL всегда занимала первое место по академическому влиянию в области НЛП, а также рекомендована конференцией CCF-A.
В последние годы, когда глубокое обучение и другие методы стали основным направлением исследований НЛП, все больше и больше людей рассматривают эту конференцию как конференцию по ИИ, и большинство представленных материалов связано с ИИ. Эмили М. Бендер, кажется, видит некоторые недостатки этой тенденции.
В своем выступлении она подчеркнула, что ACL — это ежегодное собрание Ассоциации компьютерной лингвистики. Его ядро — не искусственный интеллект, а больше ориентировано на языковые технологии и компьютерную лингвистику.
Бендер дала понять, что она не использует ИИ (искусственный интеллект) как синоним МО (машинного обучения). Она считает, что машинное обучение (включая глубокое обучение) предоставляет множество полезных методов для языковых технологий и компьютерной лингвистики, но проблемы возникают, когда фокус смещается на ИИ.
Компьютерная лингвистика и обработка естественного языка (CL/NLP) фокусируются на языковых сходствах/различиях, том, как информация представлена на языке, как создать технологию, помогающую транскрипции, переводу, обобщению, получению информации и т. д. на разных языках, а также как оценить эти методы, какие промежуточные представления полезны для этих методов, насколько эффективны различные методы ML для разных задач и как языковые методы взаимодействуют с существующими системами питания.
Проблемы в области ИИ включают в себя то, как создать думающие машины, способные рассуждать подобно людям, как заставить эти машины превзойти людей в когнитивных задачах, как автоматизировать научные методы и как автоматизировать творческие задачи.
В области ИИ также возникают некоторые идеи, например, что судьба человечества — слиться с машинами и стать сверхчеловеческими, что наступление сингулярности неизбежно и что ИИ (фактически синтетические текстовые машины) может заменить услуги, которые мы должны предоставлять каждому. другое (образование, медицина, юридическое представительство).
В сфере искусственного интеллекта существует множество проблем, в том числе повышенный интерес со стороны венчурного капитала и миллиардеров.
Бендер также раскритиковал некоторые плохие исследовательские практики в области искусственного интеллекта, такие как ненадлежащее использование тестов, требования сравнительной оценки с закрытыми моделями SOTA и чрезмерно большие наборы данных, приводящие к отсутствию сохраняемых данных. Бендер сказал, что если ваш исследовательский вопрос сфокусирован на «Как мне доказать, что моя машина умна?», то этот фокус может исказить исследовательскую практику.
Она также отметила, что акцент на искусственном интеллекте привел к плохой практике рецензирования, так что статьи, в которых не используются большие языковые модели (LLM) или не предоставляют результаты LLM размера SOTA, могут считаться неинтересными.
В отличие от плохих практик в области искусственного интеллекта, лучшие практики исследований в области CL/NLP включают применимость технологий, понимание человеческого языкового поведения, четко определенные оценки, внутренние и внешние оценки, надежные исходные данные, сохраненные тестовые данные и подробные анализ ошибок.
Бендер сказал, что исследования CL/NLP построены на понимании данных, включая знание того, как работает язык (т.е. лингвистика) и документации наборов данных.
Что касается тиражируемости и воспроизводимости, Бендер подчеркнул, что наука опирается на предыдущие исследования, а не просто пытается их достичь.
Что касается социального воздействия, исследования CL/NLP фокусируются на влиянии технологии на общество, включая этику и историю исследований НЛП, а также на понимании того, кто, для кого и для кого будет использовать язык и технологию. которые могут быть исключены или включены и которым может быть причинен вред.
Бендер считает, что ACL должен быть местом, которое фокусируется на языковых технологиях, сообществом, которое продвигает междисциплинарные исследования, областью исследований, которая заботится о языковых группах, и пространством, где мы можем рационально обсуждать влияние наших исследований и технологий на общество.
Эта точка зрения вызвала большие споры в социальных сетях.
Некоторые утверждают, что это признак недостаточной инклюзивности. «Лучшие моменты в истории НЛП произошли, когда люди были открыты идеям из других дисциплин: изучая статистические методы у исследователей языка, обучаясь мышлению у ученых-социологов. Эти слайды заставляют меня думать, что некоторые люди хотят, чтобы мы закрылись».
Другие полагают, что в этом разделении нет никакой необходимости, поскольку они органично интегрированы.
Однако некоторые люди выразили свое понимание: в конце концов, ИИ слишком популярен. Как только конференция будет «связана» статьями по ИИ, исследования в других областях неизбежно останутся без внимания, что приведет к потере первоначального интереса к конференции.
Что касается сигнала, посланного этой речью, все начали размышлять: означает ли это, что ACL не приветствует статьи об ИИ?
Что вы думаете об этом?
Справочная ссылка: https://faculty.washington.edu/ebender/papers/ACL_2024_Presidential_Address.pdf.