nouvelles

Président de l'ACL : L'ACL n'est pas une conférence sur l'IA

2024-08-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Rapport sur le cœur de la machine

Département éditorial de Machine Heart

Tirer la sonnette d’alarme ou s’orienter vers la fermeture ?

"ACL n'est pas une conférence sur l'IA (ACL n'est pas une conférence sur l'IA)", lors de l'ACL 2024 qui s'est tenue à Bangkok, en Thaïlande, la présidente de l'ACL de cette année, Emily M. Bender, est arrivée à une conclusion très controversée.



La conférence ACL est la plus grande conférence internationale dans le domaine de la linguistique informatique et du traitement du langage naturel. Elle est organisée par l'Association internationale pour la linguistique informatique et a lieu chaque année. La conférence ACL a toujours été classée première en termes d'influence académique dans le domaine de la PNL, et c'est également une conférence recommandée par le CCF-A.

Ces dernières années, alors que l'apprentissage profond et d'autres méthodes sont devenus le courant dominant de la recherche en PNL, de plus en plus de personnes considèrent cette conférence comme une conférence sur l'IA, et la plupart des soumissions sont liées à l'IA. Emily M. Bender semble voir certains inconvénients à cette tendance.

Dans son discours, elle a souligné que l'ACL est la réunion annuelle de l'Association pour la linguistique informatique. Son cœur n'est pas l'intelligence artificielle, mais est davantage axé sur la technologie linguistique et la linguistique informatique.



Bender a clairement indiqué qu'elle n'utilisait pas l'IA (intelligence artificielle) comme synonyme de ML (apprentissage automatique). Elle estime que l’apprentissage automatique (y compris l’apprentissage profond) fournit de nombreuses techniques utiles pour la technologie linguistique et la linguistique informatique, mais des problèmes surviennent lorsque l’accent est mis sur l’IA.



La linguistique informatique et le traitement du langage naturel (CL/NLP) se concentrent sur les similitudes/différences linguistiques, la façon dont l'information est représentée dans la langue, la façon de créer une technologie pour faciliter la transcription, la traduction, le résumé, l'acquisition d'informations, etc. dans différentes langues, et comment évaluer ces techniques, quelles représentations intermédiaires sont utiles pour ces techniques, quelle est l'efficacité des différentes techniques de ML pour différentes tâches et comment les techniques de langage interagissent avec les systèmes de pouvoir existants.



Les problèmes dans le domaine de l’IA comprennent comment construire des machines pensantes capables d’effectuer un raisonnement semblable à celui des humains, comment faire en sorte que ces machines surpassent les humains dans les tâches cognitives, comment automatiser les méthodes scientifiques et comment automatiser les tâches créatives.



Le domaine de l'IA soulève également certaines idées, comme celle que le destin de l'humanité est de fusionner avec les machines pour devenir surhumaine, que l'arrivée de la singularité est inévitable et que l'IA (en fait des machines à texte synthétique) peut remplacer les services que nous devrions fournir à chacun. autre (éducation, médecine, représentation légale).



Le domaine de l’IA pose de nombreux problèmes, notamment l’intérêt intense du capital-risque et des milliardaires.



Bender a également critiqué certaines mauvaises pratiques de recherche dans le domaine de l'IA, telles que l'utilisation inappropriée de critères de référence, les exigences d'évaluation comparative avec les modèles fermés de SOTA et les ensembles de données trop volumineux entraînant un manque de données conservées. Bender a déclaré que si votre question de recherche se concentre sur « Comment puis-je prouver que ma machine est intelligente », alors cette orientation peut fausser la pratique de la recherche.



Elle a également noté que l'accent mis sur l'IA a conduit à de mauvaises pratiques d'évaluation, de sorte que les articles qui n'utilisent pas de grands modèles de langage (LLM) ou ne fournissent pas de résultats LLM de taille SOTA peuvent être jugés inintéressants.



Contrairement aux mauvaises pratiques dans le domaine de l'IA, les meilleures pratiques de recherche dans le domaine CL/NLP incluent l'applicabilité de la technologie, la compréhension du comportement du langage humain, des évaluations bien définies, des évaluations intrinsèques et extrinsèques, des lignes de base solides, des données de test conservées et détaillées. analyse des erreurs.





Bender a déclaré que la recherche CL/NLP repose sur une compréhension des données, y compris la connaissance du fonctionnement du langage (c'est-à-dire la linguistique) et la documentation des ensembles de données.



En termes de réplicabilité et de reproductibilité, Bender a souligné que la science consiste à s'appuyer sur des recherches antérieures, et non seulement à essayer d'y parvenir.



En termes d'impact social, la recherche CL/NLP se concentre sur l'impact de sa technologie sur la société, y compris l'éthique et l'histoire de la recherche en PNL, ainsi que sur la compréhension par qui le langage et la technologie seront utilisés par, pour qui et pour qui, et qui peut être exclu ou Y compris et être lésé.



Bender estime que l'ACL devrait être un lieu axé sur la technologie linguistique, une communauté qui promeut la recherche interdisciplinaire, un domaine de recherche soucieux des communautés linguistiques et un espace où nous pouvons discuter rationnellement de l'impact de notre recherche et de notre technologie sur la société.



Ce point de vue a suscité une grande controverse sur les plateformes sociales.

Certains soutiennent que c’est le signe d’un manque d’inclusion. « Les meilleurs moments de l’histoire de la PNL se sont produits lorsque les gens étaient ouverts aux idées d’autres disciplines : apprendre les méthodes statistiques auprès des chercheurs en langues, apprendre à penser auprès des spécialistes des sciences sociales. Ces diapositives me font penser que certaines personnes veulent que nous fermions."





D’autres estiment que cette séparation est totalement inutile car les deux ont été organiquement intégrés.



Cependant, certaines personnes ont exprimé leur compréhension : après tout, l'IA est trop populaire. Une fois qu'une conférence est « contractée » par des articles sur l'IA, la recherche dans d'autres domaines sera inévitablement laissée de côté, ce qui fera perdre à la conférence son intérêt initial.





Concernant le signal envoyé par ce discours, tout le monde s’est mis à spéculer : cela signifie-t-il que l’ACL n’accepte pas les articles sur l’IA ?



Qu'en pensez-vous ?

Lien de référence : https://faculty.washington.edu/ebender/papers/ACL_2024_Presidential_Address.pdf