Посещение новой производительности в Пекине · За пределами лаборатории｜Невидимая большая модель, видимая производительность

Посещение нового производства в Пекине · За пределами лаборатории｜Невидимая большая модель, видимая производительность

2024-08-05

В 2017 году искусственный интеллект был впервые включен в отчет о работе правительства Китая и стал национальной стратегией. В 2018 году Пекинский научно-исследовательский институт искусственного интеллекта Чжиюань (далее «Чжиюань») родился в небольшом офисе в ведущем районе. инновационное пространство. В то время модель GPT первого поколения, представленная OpenAI, еще не попала в заголовки СМИ.

В 2023 году Чжиюань обновил первую сверхкрупномасштабную интеллектуальную модель моей страны «Wudao» до версии 3.0, став одним из трех самых передовых институтов искусственного интеллекта в мире, по мнению президента Microsoft Брэда Смита. В области больших моделей Чжиюань является единственным в мире некоммерческим исследовательским учреждением, которое не поддерживается крупным производителем. Это также первое новое исследовательское учреждение в Китае, которое систематически проводит открытые исследования и разработки в области технологий больших моделей. исходное экологическое строительство, обучение талантов и развитие предпринимательства.

«В прошлом равные права в науке и технологиях всегда открывали большие возможности для промышленности». . Определение искусственного интеллекта в стране также более конкретное: искусственный интеллект является важным двигателем развития новых производительных сил.

Работайте усердно, чтобы опередить бурю

Один или два раза генеральный директор «Темной стороны Луны» Ян Чжилинь был окружен участниками как минимум трижды на Пекинской конференции Чжиюань в 2024 году. Когда год назад основатель OpenAI Сэм Альтман выступил с видеоречевой на конференции Чжиюань, беспокойство было столь же очевидным. .

С 2023 по 2024 год ученые в области искусственного интеллекта, руководители крупных технологических компаний и основатели звездных стартапов соберутся в различных местах, чтобы проповедовать о больших моделях. Независимо от того, являются ли они техническими экспертами или нет, о них более или менее слышали все на сцене. имя Чиюань. Многие из них в то время принимали непосредственное участие в крупномасштабных модельных исследовательских проектах Чиюаня. Технический директор Baidu Ван Хайфэн когда-то был директором Zhiyuan, Тан Цзе, основатель Zhipu AI, был вице-президентом Zhiyuan, а Ян Чжилинь участвовал в исследованиях и разработках Wu Dao.

Эти законодатели моды в области ИИ не связались с Чжиюань только сейчас, а Чжиюань не стал заниматься большими моделями только после того, как они стали популярными.

В 2019 году компания Zhiyuan начала разрабатывать крупные модели. В 2020 году она создала исследовательскую группу Wudao и начала исследования и разработки крупных моделей. В марте 2021 года была впервые запущена большая модель Wu Dao 1.0, а в июне Wu Dao 2.0 использовала 1,75 триллиона параметров, чтобы создать рекорд «самой большой» большой модели в мире на тот момент. Самая совершенная на тот момент большая модель OpenAI GPT-3, в 10 раз превышающая количество параметров.

Научные исследования уделяют внимание соматосенсорике, задаванию вопросов и вынесению суждений. Суждение о том, что «наступает эра больших моделей искусственного интеллекта», придало Чжиюаню безоговорочную смелость. Даже китайский термин «большая модель» был впервые предложен Чжиюанем.

Что такое большая модель? Хуан Тецзюнь, председатель Научно-исследовательского института Чжиюань, считает, что должны быть соблюдены три условия: крупномасштабный, с параметрами, превышающими десятки миллиардов, способный создавать неожиданные новые возможности, не ограничиваясь специализированными проблемами или областями, способными справиться; Много разных задач.

В 2023 году большие модели станут доступны публике. Модели серии Wudao были обновлены до версии 3.0, охватывающей базовые большие модели, такие как язык, зрение и мультимодальность, и имеют полностью открытый исходный код. В то время в Стэнфордском университете при обсуждении базовых моделей компания Intelligent Source была поставлена в один ряд с такими технологическими гигантами, как Google, Microsoft и Facebook (теперь Meta), став репрезентативным учреждением для крупных модельных исследований в мире.

«Появление большинства результатов исследований в истории было случайным, и никто не мог это спланировать. Все усилия направлены на повышение вероятности – собрать вместе выдающихся исследователей и предоставить им среду сообщества, где они могут сталкиваться идеями, обнаруживать проблемы и найти партнеров для сотрудничества. «Предисловие, написанное Чжаном Хунцзяном, председателем-основателем Исследовательского института Чжиюань, к автобиографии лауреата премии Тьюринга Янна Лекуна, больше похоже на причину, по которой Чжиюань занял первое место.

Займитесь системным проектированием

В начале 2018 года Пекин опубликовал «Пекинские меры по поддержке строительства новых научно-исследовательских институтов мирового уровня», направленные на проведение радикальной реформы научно-технической системы. В декабре под руководством и при поддержке Министерства науки и технологий, Пекинского муниципального партийного комитета и правительства была официально основана Чжиюань.

Раньше процесс управления научными исследованиями был сложным, с длительными циклами от предложения проекта до его выпуска до подачи заявки на финансирование и рассмотрения, что затрудняло адаптацию к постоянно меняющимся потребностям научных исследований в условиях жесткой конкуренции. Согласно этой системе, исследовательское учреждение выдвинуло проектные предложения в октябре 2020 года, а крупномасштабные модельные исследования не могут быть официально начаты не раньше 2022 года. Модель Zhiyuan прошла менее 5 месяцев от создания проекта до запуска крупных моделей.

Это новый тип научно-исследовательского учреждения между университетами и предприятиями. Xin Zai не использует статьи в качестве окончательного показателя оценки и не использует продукты в качестве показателя оценки, а для создания инновационных систем Xin Zai объединяет ученых из разных учреждений и компаний, таких как Университет Цинхуа, Пекинский университет, Лаборатория искусственного интеллекта Facebook, Baidu и т. д. Большие дела; новое — ставить перед собой большие задачи, внимательно следить за важными научными вопросами и строить дальновидные планы.

«Университетская модель действует уже несколько десятилетий. Трудно проводить систематические НИОКР организованно, масштабно и совместными усилиями. Предприятия также будут инвестировать в НИОКР, но они более склонны к НИОКР, которые тесно связаны с Бизнес Чжиюань выполнит исследовательский проект «3 к А», который займет 5 или более лет, чтобы увидеть результаты», — заявил Ван Чжунъюань в эксклюзивном интервью репортеру Beijing Business Daily.

В настоящее время уверенность Чжиюаня по-прежнему заключается в решимости страны в области искусственного интеллекта. В марте 2024 года член Постоянного комитета Политбюро ЦК КПК и премьер Госсовета Ли Цян в ходе расследования в Пекине дал понять: искусственный интеллект — важный двигатель развития новых производительных сил. .

Новое качество производительности - это передовое качество производительности, которое играет ведущую роль в инновациях, отходит от традиционного режима экономического роста и пути развития производительности, обладает характеристиками высоких технологий, высокой эффективности и высокого качества и соответствует новой концепции развития. Он родился в результате революционных технологических прорывов, инновационного распределения факторов производства, а также глубоких промышленных преобразований и модернизации. «Равные права в науке и технологиях каждый раз в прошлом создавали крупные промышленные возможности, а крупные модели могут принести новое равенство в науке и технологиях», — твердо убежден Ван Чжунюань.

Например, крупные модели являются носителями «интеллекта», волна, ориентированная на ИИ, — это разведывательные операции, нижний уровень — это технические программные и аппаратные системы, верхний уровень — приложения ИИ, а большие модели находятся посередине между ними. играющий роль «хобота». Значение большой модели состоит в том, чтобы превратить «разведку» в общественные услуги, такие как водоснабжение, электричество и Интернет, а также предоставить услуги ИИ большому количеству предприятий или частных лиц посредством облачных вычислений.

Это системный проект. «Он требует концентрированных инвестиций ресурсов и рабочей силы. Это не может быть выполнено многими людьми, каждый делает это отдельно, но необходимо сформировать техническую систему», — Хуан Тецзюнь привел пример: «Развитие искусственного интеллекта — это задача». например, производство стали и производство электроэнергии, необходим полный набор технических систем, чтобы обеспечить производство высококачественной стали и стабильное производство электроэнергии при относительно низких затратах», — сказал Хуан Тецзюнь.

Идите дальше, чем индустрия

Техническая система, созданная Zhiyuan, включает в себя: сегмент семейства больших моделей, операционную систему больших моделей, набор данных, структуру обучения, библиотеку операторов и т. д. Эти достижения висят на стене на первом этаже здания Чиюань вместе с видением и целями Чиюаня.

Видение и цели разделены на пять основных секторов, включая механизмы и промышленное развитие, которые можно охарактеризовать как инновации. «Чжиюань хочет разработать самую передовую технологию искусственного интеллекта, возглавить и предсказать развитие искусственного интеллекта и пойти дальше, чем отрасль». Ван Чжунюань подробно объяснил: «Чжиюань будет делать то, что университеты не могут сделать, а компании не хотят». Исследования и разработки, исследовательские проекты, которые требуют от 3 до 5 лет или даже больше, чтобы увидеть результаты».

По его мнению, когда технические возможности крупных моделей достигнут определенного уровня, появятся два основных направления: «Одно из направлений — интеграция с продуктами, продвижение приложений и получение коммерческой ценности. С другой стороны, их немного. учреждений, которые продолжают выполнять итерации и оптимизацию лучших крупных моделей. Будь то предприятия или исследовательские институты, они должны продолжать заниматься ключевыми технологиями».

Например, при мультимодальности большинство отечественных компаний выбирают архитектуру DiT для исследований и разработок. «Это потому, что DiT — проверенный путь. Чжиюань надеется с самого начала объединить различные виды информации, такие как текст, изображения, видео и голоса, в одну модель для обучения». «Эта мультимодальная большая модель может видеть, понимать и рассуждать о мире. В будущем большие модели в сочетании с аппаратным обеспечением, то есть воплощенным интеллектом, смогут войти в физический мир, чтобы служить людям».

Предприятия остаются близко к рынку и ищут сценарии развития, в то время как научно-исследовательские учреждения сосредотачиваются на основных технологических прорывах и обеспечивают поддержку вниз. Wisdom Source принадлежит ко второму типу, который далек от приложений и сценариев, но использует открытый исходный код в качестве поддержки. индустрия.

«Искусственный интеллект не эквивалентен большим моделям, это просто разновидность искусственного интеллекта», — объяснил Ван Чжунъюань репортеру Beijing Business Daily. Сегодняшний Intelligent Source также активно работает над другими технологиями искусственного интеллекта, такими как исследования мозга и цифровое сердце, а это означает, что нет верхнего предела воображению искусственного интеллекта в других отраслях.

Репортер Beijing Business Daily Вэй Вэй

Новости

Посещение нового производства в Пекине · За пределами лаборатории｜Невидимая большая модель, видимая производительность

Введение

моя контактная информация