Как ведутся споры об открытом и закрытом исходном коде больших моделей?
2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Споры не могут отрицать рыночную ценность друг друга. Эти две рыночные потребности будут сосуществовать еще долгое время.
Текст | У Цзюньюй Сюй Вэньпу
С этого года предприниматели, инвесторы и предприниматели индустрии искусственного интеллекта в Китае и США одновременно начали дискуссию: должны ли крупные модели быть с открытым или закрытым исходным кодом.В Китае фигурой в центре спора является основатель Baidu Робин Ли. В апреле этого года он публично заявил: «Все раньше использовали открытый исходный код и думали, что открытый исходный код дешев. На самом деле, в сценариях крупномасштабных моделей открытый исходный код является самым дорогим. Модель с открытым исходным кодом будет становиться все более и более отсталой. Этой точке зрения нет недостатка в оппозиции. В число противников входят технический директор Alibaba Cloud (технический директор) Чжоу Цзинжэнь,Байчуаньская разведкаГенеральный директор Ван Сяочуань и генеральный директор Cheetah Mobile Фу Шэн. В мае этого года Чжоу Цзинжэнь прямо заявил в интервью средствам массовой информации: «Нет никаких сомнений в том, что открытый исходный код способствует глобальным технологиям и экологии. Это было доказано много раз по всему миру, и нет необходимости больше это обсуждать».В Соединенных Штатах дебаты еще более жаркие. Основатель Tesla Маск однажды подал в суд на стартапы в области искусственного интеллектаOpenAI. Маск был одним из главных основателей и инвесторов OpenAI в 2015 году. Он считает, что OpenAI, возглавляемая нынешним генеральным директором Альтманом, нарушила свое обязательство «действовать как некоммерческая организация и сделать ИИ открытым и открытым исходным кодом». Два известных инвестора Кремниевой долины, Андриссен, основатель a16z, и Косла, основатель Kleiner Perkins Caufield & Byers, неоднократно конфликтовали в социальных сетях. Первый считает, что модель закрытого исходного кода приведет к монополии гигантов и подорвет академические исследования. Последний считает, что крупные модели являются экономическим оружием и не должны иметь открытый исходный код.
Открытый исходный код — это модель разработки программного обеспечения: исходный код распространяется бесплатно и сохраняется за счет пожертвований сообщества. Разработчики могут свободно загружать, изменять, распространять, сообщать об ошибках программного обеспечения (дефектах или ошибках программного обеспечения) и вносить предложения по оптимизации. Эта коллективная инновация ускорит итерацию программного обеспечения.Модели с открытым исходным кодом относятся к моделям, которые можно использовать бесплатно и имеют опубликованные технические подробности, такие как параметры модели. Модели с закрытым исходным кодом относятся к моделям, которые требуют оплаты и не публикуют технические подробности;Просто поймите: открытый исходный код — это бесплатно, но вам придется покупать и готовить еду самостоятельно; закрытый исходный код — это плата, что эквивалентно походу в ресторан, и вы можете получить более качественные услуги;Должны ли большие модели иметь открытый или закрытый исходный код? Коммерческие интересы, технические мнения и другие факторы были перемешаны, так что многие факты были перепутаны, но за этими дебатами стоит несколько определенных фактов.Во-первых, разные бизнес-стратегии позволяют компаниям выбирать разные технические пути.Такие компании, как Baidu и OpenAI, которые надеются быстро коммерциализировать крупный модельный бизнес, выбрали облако с закрытым исходным кодом, Meta и другие компании полагаются на него;облачные вычисленияИли компании с прибыльным рекламным бизнесом выбирают открытый исходный код, чтобы увеличить пирог.Во-вторых, требования рынка к открытому и закрытому исходному коду еще долго будут сосуществовать, и невозможно просто судить, какой из них лучше.Модели с открытым и закрытым исходным кодом имеют свои собственные сценарии применения, и выбор модели зависит от рыночного спроса. Это не меняется по желанию производителя модели.В-третьих, существуют существенные различия между моделями с открытым исходным кодом и программным обеспечением с открытым исходным кодом.Программное обеспечение с открытым исходным кодом публикует исходный код и большинство технических подробностей. Модель с открытым исходным кодом больше похожа на бесплатный технический черный ящик — параметры модели открыты, но исходный код, данные обучения, процесс обучения и другие технические подробности открываются редко.Кроме того, битва между открытыми и закрытыми источниками в китайской индустрии искусственного интеллекта больше связана с коммерческой конкуренцией.Открытый исходный код не имеет границ, эта концепция получила всеобщее признание. Однако в условиях обостряющейся конкуренции между Китаем и США в индустрии искусственного интеллекта сопротивление индустрии США открытому исходному коду становится все громче и громче.
Кто является открытым исходным кодом, а кто — закрытым?Разработка больших моделей все еще находится на ранних стадиях и требует проб и ошибок.Открытый и закрытый исходный код не отличаются друг от друга. Когда компании сталкиваются с вопросом с несколькими вариантами ответов: открытый или закрытый исходный код, они выбирают три разных пути.Самый крайний вариант — делать только модели с открытым исходным кодом. По этому пути идет сравнительно немного компаний, и Meta — одна из немногих. Преимущество в том, что это привлечет больше пользователей. Проблема в том, что модели получения прибыли нет, и ее могут себе позволить только крупные компании.Llama 3, принадлежащая Meta, представляет собой модель с открытым исходным кодом, пользующуюся наибольшим количеством пользователей в мире. Основной бизнес Meta — социальные сети (такие как Facebook, Instagram), чистая прибыль которого в 2023 году достигнет 39 миллиардов долларов США. У Меты есть стремление исследовать новый бизнес, но нет необходимости зарабатывать деньги с помощью моделей. Поэтому он может пока использовать только модель с открытым исходным кодом и не рассматривать вопросы рентабельности.Средний путь — это параллельный открытый и закрытый исходный код, что очень гибко. Предприятия могут не только получать пользователей с помощью открытого исходного кода, но и получать доход с помощью закрытого исходного кода. Это не только дает разработчикам свободу выбора, но и позволяет самим предприятиям иметь право на ошибку.В число компаний, выбравших этот путь, входят Microsoft, Google, Alibaba Cloud, Tencent Cloud, а также стартапы в области искусственного интеллекта, такие как Mistral Al, Zhipu AI и Baichuan Intelligence. Распространенной практикой распараллеливания открытого и закрытого исходного кода является использование бесплатных моделей с открытым исходным кодом, чтобы привлечь пользователей и побудить пользователей использовать модели с закрытым исходным кодом, которые больше по размеру и имеют более высокую производительность. Например, основной коммерческой моделью Microsoft является серия GPT-4 от OpenAI, но она также открыла исходный код небольшой модели Phi-3 Mini. Alibaba Cloud предоставила открытый исходный код более десяти моделей с параметрами от 500 миллионов до 110 миллиардов, а также предоставила закрытый вариант; Основа исходного кода, отраслевые модели; Google открыла исходный код серии небольших моделей Gemma, а также предоставляет серию базовых крупных моделей Gemini с закрытым исходным кодом. Такие стартапы, как Mistral Al, имеют модели с открытым исходным кодом с обратной производительностью в предыдущем поколении; и посоветовали пользователям платить за использование моделей с более высокой производительностью в этом поколении.Проблема с открытым и закрытым исходным кодом заключается в том, что коммерциализация иногда предполагает конкурирующие усилия. Некоторые клиенты использовали бесплатные модели с открытым исходным кодом и больше не будут использовать платные модели с закрытым исходным кодом. В результате производители моделей потеряют часть своих доходов.В июле этого года технический специалист китайского поставщика программного обеспечения для искусственного интеллекта рассказал Caijing, что недавно они использовали модель с открытым исходным кодом Tongyi Qianwen (Qwen2) от Alibaba Cloud для вторичного обучения и тонкой настройки для обслуживания местного городского туристического бюро. Сумма этого заказа превышает 10 миллионов юаней, и они являются бенефициарами, но у Alibaba Cloud нет дохода. «Caijing» поинтересовался лицензионным соглашением Qwen2 на Github (крупнейшая в мире платформа для размещения кода). В соглашении говорится: «Запрос на коммерческое использование не требуется». Другими словами, после обучения и настройки Qwen2 не нужно платить за коммерческое использование.Долгосрочная ценность открытого исходного кода состоит в том, чтобы увеличить рынок моделей. Сотрудник Alibaba Cloud рассказал Caijing, что пользователи могут модифицировать модели с открытым исходным кодом для коммерческого использования — это нормально, и вы должны быть к этому готовы, когда работаете с открытым исходным кодом. Хотя Alibaba Cloud еще не съела весь пирог, оно сделало отраслевой пирог еще больше. В конечном итоге это принесет пользу. Химические реакции будут происходить только тогда, когда большие модели будут широко использоваться различными клиентами, такими как правительства, крупные и средние предприятия и разработчики. Крупным модельным отраслям необходимо наладить экологию и сформировать маховик роста. Эту тенденцию можно увидеть в ModelScope, сообществе искусственного интеллекта с открытым исходным кодом, принадлежащем Alibaba Cloud. По состоянию на июль этого года сообщество Moda насчитывает более 5,6 миллионов разработчиков, более 5500 высококачественных моделей и тысячи наборов данных, что делает его крупнейшим сообществом моделей с открытым исходным кодом в Китае.Более оптимистичная точка зрения заключается в том, что открытый и закрытый исходный код могут даже образовывать взаимосвязи между исходным и нисходящим кодами. Открытый исходный код находится в авангарде технологий, отвечает за участие сообщества, внедрение технологий, привлечение клиентов и обеспечение того, чтобы технологии опережали конкурентов. Закрытый исходный код находится ниже по течению и отвечает за коммерческую реализацию.Lanzhou Technology — крупная модельная стартап-компания в Китае. Ли Цзинмей, партнер и со-генеральный директор Lanzhou Technology, рассказал Caijing, что открытый исходный код — это одновременно техническая стратегия и бизнес-стратегия. Это может повлиять на сообщество разработчиков, а также на психологию технической команды потенциальных клиентов. Открытый и закрытый исходный код не противоречат друг другу. Цикл обратной связи с клиентами для моделей с закрытым исходным кодом относительно длинный, но разработчики моделей с открытым исходным кодом сообщества дадут обратную связь быстро. Это может помочь компаниям быстро обновлять продукты.Специалист по стратегическому планированию искусственного интеллекта в ведущей китайской технологической компании считает, что для ведущих поставщиков облачных технологий, таких как Alibaba Cloud, лучше одновременно иметь открытый и закрытый исходный код, чем иметь только закрытый исходный код. Доходы Alibaba Cloud в основном поступают от четырех основных компонентов общедоступного облака (вычисления, хранилище, сеть и база данных). Бесплатная модель с открытым исходным кодом будет способствовать потреблению бизнес-данных клиентов, тем самым стимулируя продажи вышеупомянутых базовых облачных продуктов.Создание моделей с закрытым исходным кодом — это простой, прямой и логичный подход. Крупные компании, идущие по этому пути, считают, что для коммерциализации крупных моделей они должны иметь закрытый исходный код, иначе коммерческий цикл невозможно замкнуть.Это выбрали AI-стартапы OpenAI (его модели серии GPT-4), Amazon (инвестировал в AI-стартап Anthropic, включающий модели серии Claude 3.5), Huawei (большая модель Pangu), Baidu (большая модель Wenxin) и другие компании. дорога. Предприятия, использующие большие модели, часто платят за вызов API (интерфейса прикладного программирования), что похоже на оплату воды, электричества и газа в зависимости от использования. Бизнес-модель с закрытым исходным кодом теоретически является самой здоровой. Темпы роста доходов Microsoft Azure, Amazon AWS и Google Cloud за последний год увеличились примерно на 5 процентных пунктов, а уровень их прибыли также немного увеличился. Считается, что это результат большого притяжения моделей.Но в Китае модели с закрытым исходным кодом трудно быть по-настоящему прибыльными в краткосрочной перспективе. В мае этого года на китайском модельном рынке началась ценовая война. Целью снижения цен является стимулирование потребительского спроса и расширение размера рынка. Облачные сервисы ByteDance Volcano Engine, Alibaba Cloud, Tencent Cloud и Baidu Smart Cloud последовательно снизили стоимость звонков крупных моделей более чем на 90%. Валовая прибыль от вызовов крупных моделей упала с более чем 60% до менее 0%.Человек, отвечающий за крупный модельный бизнес китайского поставщика облачных технологий, считает, что вызовы крупных моделей вступили в «эру отрицательной валовой прибыли». Чем больше вы его используете, тем больше будут ваши потери. Разница в том, что крупные компании, такие как Alibaba, ByteDance и Baidu, могут позволить себе потерять деньги, а малые и средние предприятия и стартапы — не могут.Он и руководитель крупного модельного стартапа выразили схожую точку зрения: разные компании имеют разные гены и разные стратегии модельного бизнеса. Облако — это основной бизнес Alibaba Cloud, и конечная цель моделей с открытым исходным кодом — продавать больше облаков. Volcano Engine поддерживается ByteDance, и рекламный бизнес материнской компании может быть передан. Доля рынка облачных вычислений Volcano Engine намного ниже, чем у Alibaba Cloud: «Он босиком и не боится носить обувь», и он надеется захватить большую долю рынка посредством ценовых войн. Искусственный интеллект — это основной бизнес Baidu. Baidu надеется зарабатывать деньги на больших моделях, поэтому подчеркивает ценность моделей с закрытым исходным кодом.
Какой аргумент? Каков консенсус?В китайских дебатах по поводу больших моделей с открытым и закрытым исходным кодом есть несколько направлений: во-первых, есть ли разница между моделями с открытым исходным кодом и программным обеспечением с открытым исходным кодом? Во-вторых, какая из них сильнее: модель с открытым исходным кодом или модель с закрытым исходным кодом? В-третьих, какой из них дороже: модель с открытым исходным кодом или модель с закрытым исходным кодом?Первый спор заключается в том, есть ли разница между моделями с открытым исходным кодом и программным обеспечением с открытым исходным кодом? Ответ: есть большая разница. Подавляющее большинство моделей с открытым исходным кодом не являются полностью открытыми. Они больше похожи на черные ящики, которые можно использовать бесплатно, а не на прозрачный ящик, подобный программному обеспечению с открытым исходным кодом.Программное обеспечение с открытым исходным кодом публикует исходный код, и разработчики могут освоить большую часть технических деталей программного обеспечения через исходный код. Основная логика бесплатного программного обеспечения с открытым исходным кодом заключается в том, что разработчики со всего общества могут помогать производителям программного обеспечения находить ошибки в продуктах и предлагать предложения по оптимизации. Социальное развитие может не только снизить затраты на исследования и разработки программного обеспечения, но и ускорить его внедрение. Мобильная операционная система Android и программное обеспечение баз данных MySQL добились успеха на этом пути.Сложность моделей с открытым исходным кодом намного превышает сложность программного обеспечения с открытым исходным кодом. Проекты с открытым исходным кодом включают исходный код, веса параметров, структуру модели, данные обучения, процесс обучения и т. д. Два ученых из Университета Радбауд в Нидерландах, Лизенфельд и Дингеманс, опубликовали в марте этого года статью, в которой сравнивают степень открытого исходного кода в моделях с открытым исходным кодом. В статье показано, что наиболее эффективные модели с открытым исходным кодом обычно имеют только веса параметров с открытым исходным кодом. Одно из объяснений заключается в том, что для обеспечения лучших характеристик модели производители моделей не могут раскрыть все «рецепты». Возьмем в качестве примера самую мощную в мире модель с открытым исходным кодом Llama3. Она лишь частично открыла исходный код своих параметров и структуру модели. Исходный код, данные обучения и процесс обучения не были открыты.
Нет сомнений в ценности концепции открытого исходного кода для промышленной экологии.Синь Чжоу, генеральный менеджер Baidu Smart Cloud AI и платформы больших моделей, сказал Caijing в июле этого года, что модели с открытым исходным кодом сделают модельные приложения и отраслевые модели богаче. Но он возражает против объединения модели открытого исходного кода с программным обеспечением с открытым исходным кодом.Потому что между ними есть существенная разница: модель с открытым исходным кодом не может полагаться на участие социальных разработчиков для улучшения производительности продукта и снижения затрат на исследования и разработки, как это происходит с программным обеспечением с открытым исходным кодом. Базовая модель может быть улучшена только путем собственного обучения производителя модели. Точная настройка и оптимизация модели с открытым исходным кодом не так хороши, как коммерческая модель. Она предъявляет высокие технические требования к разработчикам, а фактическая стоимость использования невелика. низкий.Второй спор: какая из них сильнее: модель с открытым исходным кодом или модель с закрытым исходным кодом? Дело в том, что модели с закрытым исходным кодом обычно работают лучше, чем модели с открытым исходным кодом, но разрыв в производительности между моделями с открытым и закрытым исходным кодом сокращается.
Центр исследований фундаментальных моделей (CRFM) Стэнфордского университета уже давно проводит глобальные рейтинги тестирования больших моделей. По состоянию на 24 июля опубликованные рейтинги крупномасштабных тестов на понимание многозадачного языка (MMLU) показывают, что среди десяти лучших моделей производительности только Llama3.1 является моделью с открытым исходным кодом, включая Claude3.5 (инвестированный Amazon), GPT -4o (инвестировано Microsoft), Gemini1 5 Pro (собственная разработка Google) и другие модели с закрытым исходным кодом.Ли Цзинмей считает, что модель с закрытым исходным кодом той же компании должна иметь лучшую производительность, чем модель с открытым исходным кодом. Однако при горизонтальном сравнении в отрасли модели с закрытым исходным кодом не обязательно лучше моделей с открытым исходным кодом. Поскольку крупные модели повторяются каждые 6–12 месяцев, некоторые модели с открытым исходным кодом могут развиваться быстрее.
Рейтинги обзорных организаций иллюстрируют эту тенденцию. Организация LMSYS (Организация по исследованию больших модельных систем) была инициирована Калифорнийским университетом в Беркли. Организация также будет оценивать и ранжировать эффективность глобальных моделей в течение длительного времени. Llama3.1 от Meta и Qwen2 от Alibaba Cloud быстро улучшают позиции в этом рейтинге. Llama3.1 даже превосходит большинство моделей с закрытым исходным кодом.Человек, отвечающий за крупный модельный бизнес китайского поставщика облачных технологий, проанализировал, что существует две причины, по которым разрыв в производительности между моделями с открытым исходным кодом и моделями с закрытым исходным кодом сократился. В прошлом году базовые большие модели, как правило, вступили в период «узких мест». улучшение производительности. Модель с открытым исходным кодом привлекает большое количество разработчиков. Хотя они не могут напрямую улучшить производительность модели за счет обратной связи по коду, они повышают общий уровень исследования модели, что косвенно помогает моделям с открытым исходным кодом улучшить производительность модели.Третий спор: модель с открытым исходным кодом или модель с закрытым исходным кодом, какая из них дороже? Вывод таков: производительность является решающим фактором. Затраты на использование модели напрямую связаны с производительностью модели. Чем выше производительность, тем ниже долгосрочная стоимость использования, поскольку для выполнения задачи требуется меньше вызовов.Модели с открытым исходным кодом бесплатны и часто создают впечатление, что они дешевле и дешевле. Синь Чжоу пояснил, что приложение большой модели представляет собой комплексное решение, включающее «технологию + сервис», и предприятию необходимо рассчитать «главную книгу». Помимо предоставления полных моделей и наборов инструментов, производители моделей с закрытым исходным кодом также предоставляют обучение и технические услуги, чтобы помочь компаниям быстро приступить к работе. Модель с открытым исходным кодом кажется бесплатной, но для достижения того же эффекта, что и с закрытым исходным кодом, она требует больших последующих инвестиций в рабочую силу, деньги и время, а общая стоимость еще выше.В долгосрочной перспективе решающим фактором стоимости применения моделей с открытым и закрытым исходным кодом является стоимость вывода. Модели с закрытым исходным кодом с одинаковой величиной параметра обычно работают лучше, чем модели с открытым исходным кодом, и имеют меньшие совокупные затраты. Синь Чжоу подсчитал, что если компания бесплатно развертывает модель с открытым исходным кодом, развертывание модели с закрытым исходным кодом будет стоить 500 000 юаней. На начальном этапе инвестиций модель с открытым исходным кодом обходится дешевле. На более позднем этапе использования, если комплексная производительность модели с закрытым исходным кодом на 20% выше, чем у модели с открытым исходным кодом, модель с закрытым исходным кодом может сэкономить десятки тысяч юаней в день на некоторых крупных предприятиях. . В конечном счете, долгосрочная стоимость использования должна быть намного ниже, чем у модели с открытым исходным кодом.
Кто использует модель с открытым исходным кодом? Кто использует модель с закрытым исходным кодом?Модель с открытым исходным кодом лучше или модель с закрытым исходным кодом? Этот вопрос решают не производители моделей со стороны предложения, а предприятия-заказчики со стороны спроса.На публике корпоративные словесные войны продолжаются. Однако многие технические специалисты поставщиков облачных услуг заявили Caijing, что эти аргументы не могут отрицать рыночную ценность друг друга. Эти две потребности будут сосуществовать еще долгое время. Если посмотреть на это с другой точки зрения, война слов облегчает совместное повышение видимости рынка.Фактически, большинство корпоративных клиентов не волнует, должна ли модель быть с открытым исходным кодом. Синь Чжоу пришел к выводу, что после общения со многими крупными корпоративными клиентами он обнаружил, что следует ли главе ИТ-отдела использовать ту или иную модель, зависит от многих факторов. Обычно в порядке приоритета располагаются: эффект, производительность, цена и безопасность. Открытый или закрытый исходный код не является решающим фактором.В «наборе инструментов» большинства компаний модели с открытым и закрытым исходным кодом дополняют друг друга. Внедрение крупных моделей крупными предприятиями обычно делится на разные этапы.На раннем этапе ИТ-отдел определит производительность и характеристики моделей с открытым и закрытым исходным кодом, представленных на рынке. Различные модели имеют разные преимущества. Некоторые из них обладают мощными возможностями языкового произношения, а некоторые — мощными возможностями статистики данных. Бесплатное тестирование POC (доказательство концепции) модели с открытым исходным кодом на ранней стадии для проверки бизнес-эффектов.В среднесрочной перспективе мы начнем с первой фазы проектов в бизнес-сценариях с низкой сложностью и быстрыми результатами, таких как маркетинг, обслуживание клиентов и база знаний. Вам нужно не только приобрести модель с закрытым исходным кодом, но вам также необходимо обучить и настроить собственную модель с открытым исходным кодом. Позвольте внутренним и внешним моделям «скачать лошадей», сравнивайте эффекты и стоимость различных моделей и меняйте использование в любое время.На более позднем этапе, основываясь на результатах реализации, мы будем постепенно планировать проекты второй и третьей фазы в бизнес-сценариях, которые сложны и медленно приносят результаты. В настоящее время зачастую даже необходимо потратить десятки миллионов юаней на создание набора независимых и контролируемых базовых крупных моделей или крупных отраслевых моделей.Модель с открытым исходным кодом бесплатна, но ее нельзя использовать «из коробки», она требует времени и усилий, и за детали никто не несет ответственности. Модель с закрытым исходным кодом позволяет напрямую получать готовые продукты и предоставлять полный спектр услуг до, во время и после продажи. Проще говоря, модель с открытым исходным кодом похожа на покупку еды и приготовление пищи для себя, а модель с закрытым исходным кодом — на трату денег на еду в ресторане.Точка зрения Синь Чжоу заключается в том, что модель с открытым исходным кодом подходит для академических исследований, для некоторых малых и средних предприятий с крайне ограниченными ИТ-бюджетами, а также для некоторых крупных предприятий для независимых и контролируемых внутренних самоисследовательских проектов, но это не так. подходит для крупномасштабных внешних коммерческих проектов. В некоторых серьезных коммерческих проектах стоимостью в миллионы или десятки миллионов долларов модель с закрытым исходным кодом по-прежнему остается лучшим выбором.Модель с открытым исходным кодом — это не бесплатный обед. Крупные предприятия, использующие модель с открытым исходным кодом, несут множество скрытых затрат. Например, покупка вычислительной мощности, адаптация программного обеспечения и т. д. Технический директор китайского зарубежного поставщика интеллектуальных маркетинговых услуг рассказал Caijing в июле этого года, что его компания в значительной степени полагается на облачные сервисы и ежегодно тратит более 80 миллионов юаней на исследования и разработки. За последние два года компания использовала одновременно более десяти моделей с закрытым исходным кодом, но среди них нет моделей с открытым исходным кодом. По его мнению, модель с открытым исходным кодом требует времени и рабочей силы для работы. Большинство моделей с открытым исходным кодом невозможно использовать «из коробки», никто не знает подробностей и их можно рассматривать только как «игрушки». Он склонен управлять более чем дюжиной моделей с закрытым исходным кодом и переключаться между ними в любое время в зависимости от цены и производительности. Это наиболее экономически выгодно.ИТ-директор крупного акционерно-коммерческого банка считает, что то, что модель с открытым исходным кодом невозможно использовать «из коробки», не является большой проблемой. В декабре 2023 года он рассказал Caijing, что его команда также использовала Alibaba (модель с открытым исходным кодом Tongyi), Meta (модель с открытым исходным кодом Llama), Baidu (серия Wenxin) и Zhipu (серия GLM) для приложений самообслуживания по аудиту отчетов о соответствии требованиям Research. Модель с открытым исходным кодом подходит для таких небольших проектов, поскольку позволяет проводить бесплатное POC-тестирование и может быть изменена по мере необходимости. В его ИТ-команде работают десятки человек, а также компания, предоставляющая ИТ-услуги на аутсорсинге, обладающая достаточным количеством рабочей силы для решения этих проблем. Но он также считает, что для масштабных проектов стоимостью в один или десять миллионов юаней модель с закрытым исходным кодом более подходит. Поскольку модель с закрытым исходным кодом стабильна и надежна, вы также можете найти модельную компанию, которая позаботится о ней.Полное обучение набора отраслевых моделей с использованием моделей с открытым исходным кодом стоит десятки миллионов юаней, а также требует приобретения чипов искусственного интеллекта для создания собственного компьютерного зала. Вышеупомянутые технические специалисты поставщика программного обеспечения для искусственного интеллекта пришли к выводу, что модель с открытым исходным кодом подходит для некоторых центральных государственных предприятий, которые предъявляют высокие требования к безопасности данных, автономности и контролю и не столь чувствительны к затратам. Они будут использовать модели с открытым исходным кодом для обучения своих собственных отраслевых моделей. Потому что «модель с открытым исходным кодом + частное облако» отвечает требованиям безопасности данных и независимой управляемости многих центральных и государственных предприятий.
Спор между открытыми и закрытыми источниками крупных моделей на китайском рынке является чисто коммерческим вопросом. Однако на международном рынке спор между крупными моделями открытых и закрытых источников включает в себя больше факторов, таких как антимонопольное законодательство и национальные интересы.После ценовой войны в мае этого года крупные модели Китая вступили в «эру отрицательной валовой прибыли». И модели с открытым исходным кодом, и модели с закрытым исходным кодом сталкиваются с проблемой: большие модели не могут приносить прямую прибыль.«Конкуренция на выбывание на рынке крупных моделей началась». Человек, отвечающий за бизнес крупных моделей китайского поставщика облачных услуг, проанализировал, что отрицательная валовая прибыль от вызовов крупных моделей означает, что чем больше вызовов будет сделано в краткосрочной перспективе, тем больше потери для поставщиков облачных услуг. Китайские поставщики облачных технологий делают ставку на то, что после того, как стоимость вызовов крупных моделей снизится на 90%, количество вызовов крупных моделей увеличится в геометрической прогрессии в течение следующих одного-двух лет. В долгосрочной перспективе затраты на вычислительную мощность поставщиков облачных услуг будут снижаться по мере роста потребительского спроса, и в конечном итоге они все равно смогут получать положительную прибыль. Даже если эта ставка не оправдается, группа производителей моделей погибнет в ценовой войне, а выжившие производители подберут себе осколки.Многие инсайдеры отрасли выразили Caijing такое же мнение. Этот раунд ликвидации продлится от 1 до 2 лет, и только 3-5 компаний базовой модели смогут продолжать выживать.Ань Сяопэн, член исполнительного комитета China Informatization Baihui и директор исследовательского центра облачных интеллектуальных технологий Alibaba, заявил Caijing в июле этого года, что в Китае нет войны сотен моделей или даже войны десяти моделей. Большие модели требуют постоянных инвестиций, имеют емкость 10 000 или даже 100 000 карт и требуют коммерческой отдачи. Многие компании не имеют таких возможностей. В будущем на китайском рынке останется всего три-пять производителей базовых моделей.Кому выгодна ценовая война? Кто будет смеяться последним? Вышеупомянутые специалисты по стратегическому планированию искусственного интеллекта ведущих технологических компаний Китая считают, что в этом раунде ценовой войны наибольшая кровь принадлежит Volcano Engine Alibaba Cloud и ByteDance. Alibaba Cloud может зарабатывать деньги на облаке, а Volcano Engine занимается рекламным бизнесом ByteDance в виде переливания крови. В ценовой войне Baidu не так хороша, как Alibaba и ByteDance. Однако большая модель Wenxin от Baidu имеет мощные технологии и будет иметь группу клиентов, готовых платить за эту технологию. Это поможет Baidu пережить ценовую войну. Он также пояснил, что эти крупные модельные стартапы на китайском рынке столкнутся с серьезными испытаниями в ближайшие один-два года. Крупные модельные стартапы могут либо стать компаниями по разработке моделей на основе проектов, либо перейти к вертикальным отраслевым моделям.Общая конкуренция на рынке крупных моделей Китая гораздо важнее местной конкуренции между моделями с открытым и закрытым исходным кодом. Направление глобальной конкуренции напрямую определит исход местной конкуренции.Представитель Alibaba Cloud прямо сказал, что модели с открытым и закрытым исходным кодом имеют свои преимущества, и Alibaba Cloud надеется сделать ИИ более инклюзивным. Независимо от того, открытый исходный код или закрытый, основная цель — предоставить разработчикам больше выбора. Alibaba Cloud выбрала два пути: с открытым исходным кодом и с закрытым исходным кодом. У него есть как полноразмерные, полномодальные модели с открытым исходным кодом, так и модели с закрытым исходным кодом. Другой человек, отвечающий за крупный модельный бизнес китайского поставщика облачных технологий, считает, что у открытого исходного кода нет бизнес-модели. На китайском модельном рынке только ведущие компании или очень небольшое количество стартапов, которые могут устойчиво привлекать средства, могут настаивать на открытом исходном коде. В конце концов, на китайском рынке может остаться всего 1-2 модели с открытым исходным кодом.Производители моделей обучают новое поколение моделей чуть ли не каждые 6-12 месяцев. На китайском рынке моделей, поскольку потребность в получении прибыли возрастает, модели с открытым исходным кодом могут становиться все более и более «стратегическими» — компании будут стремиться к моделям с открытым исходным кодом с отсталой технологией и меньшими параметрами в предыдущем поколении и побуждать пользователей платить за использовать технологические обновления и параметры. Более крупная модель с закрытым исходным кодом.Конкуренция между моделями с открытым и закрытым исходным кодом не закончится в ближайшее время. Некоторые компании могут даже одновременно использовать как открытый, так и закрытый исходный код.В ИТ-индустрии это не беспрецедентно. База данных появилась более 60 лет назад, а первая база данных с открытым исходным кодом появилась более 50 лет назад. Рынок баз данных в настоящее время активен, представлены различные базы данных с закрытым и открытым исходным кодом, и новые бренды баз данных все еще появляются бесконечно. Гигант баз данных Oracle даже имеет как базу данных RDBMS с закрытым исходным кодом, так и базу данных MySQL с открытым исходным кодом.Многие технические специалисты поставщиков облачных услуг считают, что модели с открытым и закрытым исходным кодом будут сосуществовать в течение длительного времени. Рынок крупных моделей будет постепенно расти на фоне конкуренции со стороны различных технических направлений.