nouvelles

Apple réagit à l'utilisation de ressources YouTube controversées pour former l'IA : le modèle OpenELM est uniquement destiné à la recherche

2024-07-18

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

IT House a rapporté le 18 juillet qu'Apple avait publié une déclaration via le média technologique 9to5Mac concernant l'utilisation de ressources YouTube controversées pour la formation de son modèle d'IA open source OpenELM. OpenELM n'est utilisé dans aucun autre projet d'IA ou d'apprentissage automatique (y compris Apple Intelligence).

Le studio d'information à but non lucratif ProofNews a publié un rapport d'enquête indiquant qu'Apple avait utilisé un ensemble de données appelé YouTube Subtitles d'une taille de 5,7 Go (489 millions de mots) lors de la formation du modèle d'IA OpenELM.

Cet ensemble de données a été créé par EleutherAI et a été publié pour la première fois en 2020. Il implique le contenu des sous-titres de 173 536 vidéos YouTube de plus de 48 000 chaînes, et contient également le contenu des sous-titres de plus de 12 000 vidéos qui ont été supprimées par la plateforme.

Apple a déclaré dans sa dernière déclaration qu'OpenELM Le but du modèle est de contribuer à la communauté de recherche et de faire progresser le développement de grands modèles de langage open source.

Les chercheurs d'Apple ont décrit OpenELM comme « le modèle de langage ouvert le plus avancé ».

Apple souligne qu'OpenELM est uniquement destiné à des fins de recherche.Non utilisé dans les fonctionnalités commerciales d'Apple Intelligence, le modèle est publié en open source et peut être obtenu librement par les développeurs.

Apple a également déclaré qu'il n'avait pas l'intention de créer une nouvelle version du modèle OpenELM à ce stade.