Когда большие модели проникают в отрасль, ключом к реализации становятся сценарии

Когда большие модели проникают в отрасль, ключом к внедрению становятся сценарии ToB Industry Observation |

2024-08-02

«Как технология, большие модели должны по-настоящему использоваться в отрасли и решать практические проблемы в отрасли, прежде чем они смогут принести свою истинную ценность», — Го Вэй, вице-президент группы маркетинга корпорации Intel и генеральный директор Intel China Network and Inc. Подразделение центров обработки данных Edge и Channel беседовал с Об этом много раз говорилось в общении с приложением TMTpost Media.

Прошло почти 2 года с момента выхода ChatGPT. Менее чем за 2 года крупные модели искусственного интеллекта проникают во все сферы жизни с беспрецедентной скоростью. Тем более, что в этом году как крупные производители моделей, так и компании из партии А переключили свое внимание с размера параметров модели на то, как большие модели решают болевые точки отрасли, пытаясь найти одну или несколько крупных моделей, которые могут решить их собственные сценарии внедрения в отрасли. .

Сценарии, от общих до отраслевых, являются ключом к реализации крупных моделей.

Если конкуренция крупных моделей от крупных производителей разделена на две половины, в первой половине крупные производители запускают одну за другой общие крупные модели и демонстрируют свою силу, постоянно совершенствуя параметры моделей, во второй половине, когда ИИ большой; модели принимаются большим количеством отраслей. Когда сторонние предприятия обращают на это внимание, появляется все больше и больше моделей с малыми параметрами, и сценарии отраслевых приложений, естественно, становятся в центре внимания предприятий Стороны А и крупных поставщиков моделей Стороны Б. Реализация конечных приложений становится все более популярной. вопрос о том, действительно ли на данном этапе могут быть реализованы крупные модели. Ключ к «монетизации» в отрасли.

В связи с этим Го Вэй сообщил TMTpost Media APP, что Intel считает, что по мере постепенного проникновения технологии больших моделей искусственного интеллекта в отрасль модели будут постепенно меняться от общих больших моделей к отраслевым большим моделям: «В этом процессе размер моделей будет постепенно меняться. Модель определенно изменится: «В то же время отраслевая модель будет сочетать в себе больше отраслевых знаний и фокусироваться на одном или нескольких конкретных сценариях».

По совпадению, Цао Пэн, председатель технического комитета JD Group и президент подразделения JD Cloud, также публично заявил недавно на саммите JD Cloud, что «в целом крупные модели полагаются на вычислительные мощности, в то время как крупные промышленные модели полагаются на бизнес». уже более 35 человек. Wan Jingdong имеет собственный персонал по доставке, более 200 000 продавцов, более 30 000 врачей, более 20 000 сотрудников по закупкам и продажам, а также более 10 000 сотрудников, занимающихся исследованиями и разработками. Он использует большие приложения на основе моделей в более чем 100 сценариях искусственного интеллекта на Jingdong.

В «Белой книге глобальной цифровой экономики 2024 года» показано, что количество крупных моделей искусственного интеллекта в мире достигло 1328, из которых на долю Китая приходится 36%. С другой стороны, данные IDC показывают, что в 2022 году на генеративный ИИ в Китае будет приходиться 4,6% от общего объема инвестиций на рынок ИИ. Благодаря быстрому развитию технологий генеративного ИИ доля инвестиций в генеративный ИИ достигнет 33,0% в 2027 году, масштаб инвестиций превысит 13 миллиардов долларов США, а пятилетний совокупный темп роста (CAGR) составит 86,2%.

Очевидно, что большая модель аналогична предыдущей эпохе облачных вычислений. С точки зрения технологий Китай все еще может немного отставать от первоклассного мирового уровня, но если мы сосредоточимся на сценариях, у Китая есть богатые сценарии применения, и они сценарии. Это ключ к тому, чтобы по-настоящему «залететь в дома простых людей» с большими моделями ИИ.

Как лучше использовать большие модели — от облака до периферии?

По мере того как большие модели постепенно переходят от больших параметров общих больших моделей к небольшим параметрам отраслевых моделей, большие модели также демонстрируют тенденцию перехода от облака к стороне устройства. Данные IDC показывают, что к 2026 году 80% предприятий по всему миру будут использовать генеративный ИИ, а 50% глобальных периферийных развертываний будут включать ИИ.

В связи с этим Сачин Катти, старший вице-президент и генеральный менеджер подразделения сетевых и периферийных технологий Intel, однажды сказал, что будущее искусственного интеллекта будет зависеть от открытой экосистемы, а применение искусственного интеллекта смещается от центров обработки данных к периферийным вычислениям.

Мало того, Чэнь Вэй, вице-президент корпорации Intel и генеральный менеджер подразделения Network and Edge в Китае, также рассказал TMTpost Media APP, что, судя по тенденциям развития в этом году, только клиенты Intel будут изучать возможность внедрения крупномасштабных периферийных моделей в этом году. . У этого решения появилось больше клиентов. «Этот год совершенно другой. В этом году можно сказать, что более половины клиентов изучают решения по внедрению на основе больших моделей, и есть много практических примеров». далее указал.

По мере того, как большие модели приближаются к периферии, предприятиям необходимо учитывать множество факторов при развертывании, таких как требования к задержке, практичность, настраиваемая оптимизация микроданных и требования информационной безопасности.

Однако развертывание крупномасштабных моделей на периферии все еще находится на ранних стадиях разработки, и в настоящее время на рынке представлено множество моделей развертывания. «По наблюдениям Intel, мы видим, что многие клиенты создают аппаратные и программные решения на их основе. общие крупномасштабные модели. Оптимизация производительности — это быстро развивающаяся модель», — сказал Чэнь Вэй, отвечая на вопрос, поднятый приложением Titanium Media, о том, как лучше применять большие модели на стороне клиента.

Говоря о тенденциях и перспективах внедрения в отрасли крупных моделей Китая, Го Вэй рассказал TMTpost Media APP, что с этого года все больше и больше пользователей отрасли внедряют множество крупных моделей отрасли. «В прошлом году, вероятно, речь шла больше о том, чтобы рассказывать. историй. В этом году мы наблюдаем все больше и больше случаев внедрения в отрасли, и все они представляют собой сценарии, которые могут эффективно решить болевые точки отрасли», — сказал Го Вэй.

Судя по текущему приложению, параметры модели на конечной стороне намного меньше, чем параметры общей большой модели. В настоящее время параметры модели на конечной стороне в основном находятся в пределах от 7B до 10B. В настоящее время сжатие модели становится очень высоким. трудная задача. Что-то важное и сложное. Текущая основная модель заключается в добавлении отраслевых знаний в данные при их сжатии, что широко известно как техническое решение прогрессивной обрезки.

В связи с этим соответствующий технический директор JD Cloud сообщил Titanium Media APP, что на примере сценария с беспилотным логистическим транспортным средством за счет уменьшения величины и поиска нейронной сети можно сжать примерно вдвое больше параметров, не уменьшая при этом саму модель. Производительность, это также может уменьшить задержку примерно в два раза.

В то же время Го Вэй поделился с Titanium Media APP своим анализом и суждениями о перспективах развития Китаем крупномасштабных промышленных моделей. Он отметил, что Китай может развиваться быстрее в трех аспектах.

Во-первых, разработка самой модели в отраслевых приложениях. Как упоминалось выше, «только с точки зрения технологий Китай, возможно, все еще сильно отстает от первоклассного мирового уровня, но у Китая есть богатые сценарии применения с точки зрения внедрения в отрасли, особенно с точки зрения интеграции с приложениями, по мнению Го Вэя». , Китай Может двигаться быстрее: «Одной из отличительных особенностей китайского рынка является быстрое развитие приложений и способность быстро находить эффективные способы решения болевых точек отрасли», — подчеркнул Го Вэй.

Во-вторых, улучшается способность модели к рассуждению. Когда большие модели действительно применяются в отрасли, недостаточно полагаться только на обучение моделей. Чтобы по-настоящему решить болевые точки отрасли, особенно важно улучшить возможности модели. Возможности также будут иметь значительные улучшения в этом году.

В-третьих, по мнению Го Вэя, когда в отрасли внедряются большие модели, необходимо координировать распределение вычислительной мощности между облаком, стороной устройства и периферией: «Если это просто какие-то стандартные приложения вертикальных больших моделей. Большие модели могут быть в основном развернуты в облаке, но из-за необходимости внедрения в отрасли вычислительная мощность ИИ неизбежно будет распределяться между периферийными устройствами и терминалами», — сказал Го Вэй в интервью TMTpost Media APP.

Реализовано много сцен

Как сказал Го Вэй, с этого года на стороне устройства было развернуто множество сценариев применения крупных отраслевых моделей.

Что касается образования, Seewo совместно запустила решение «AI + Education», основанное на технологии Intel. С помощью процессоров Intel® Core™ Ultra Seewo может локально выполнять работу крупных моделей обучения ИИ, не полагаясь на ресурсы облачных вычислений. тем самым улучшая скорость и стабильность реакции системы и обеспечивая плавность процесса обучения.

В сфере розничной торговли компания Tous Les Jours создала решения для умных магазинов с помощью технологий периферийных вычислений. Это решение может использовать существующее в магазине оборудование для сбора аудио и видео, а через платформу управления интеграцией и оптимизацией данных, в соответствии с потребностями и характеристиками различных магазинов, создавать для них набор эксклюзивных цифровых интеллектуальных моделей магазинов, обеспечивая отображение продуктов. и услуги магазинов, гигиена магазинов, нормы поведения сотрудников, понимание толпы и понимание потоков клиентов, которые расширили возможности дифференцированного управления операциями магазинов Tous Les Jours, повысили эффективность управления, снизили затраты на ручные проверки магазинов и укрепили внедрение. нормы для сотрудников, ускоряя интеллектуальное развитие хлебопекарной промышленности.

Что касается медицинского здравоохранения, компания JD Health запустила крупную медицинскую модель Jingyi Qianxun, основанную на большой модели JD Yanxi, которая объединяет большое количество руководств по клинической практике, медицинской литературы и экспертных знаний и может быстро завершить миграцию различных сценарии в области медицины и здравоохранения и обучения. Основываясь на крупномасштабной модели «Beijing Medical Qianxun», компания запустила ряд решений для практикующих врачей, включая облачные клиники, последующее наблюдение после диагноза, совместные консультации экспертов, клинические научные исследования, инкубацию IP-бренда врачей и « «умный помощник врача», которые не только оптимизируют эффективность и качество онлайн-диагностики и лечения врачей, но и повышают безопасность практики.

Что касается безопасности, многие поставщики средств безопасности, в том числе 360, Qi'anxin, Tencent Cloud, Sangfor и т. д., запустили в индустрии безопасности продукты для больших моделей, основанные на возможностях больших моделей, или интегрировали возможности больших моделей искусственного интеллекта в оригинальные Среди продуктов, перед лицом все более серьезных проблем безопасности, создаваемых ИИ в эпоху ИИ, мы достигли цели «победить ИИ с помощью ИИ».

Что касается офисной работы, многие производители предложили концепцию AIPC и сосредоточились на офисных помощниках с искусственным интеллектом. В сценарии AI Chatbot большие модели можно быстро развернуть на компьютерах с процессором Intel Core Ultra AI, и пользователи смогут беспрепятственно использовать их мощные возможности. создание текста больших моделей, программирование, математические расчеты и логические рассуждения, а также удобный и безопасный локализованный интеллектуальный интерактивный опыт;

Что касается обработки документов, пользователи могут использовать AI PC для эффективной обработки электронной почты, формирования данных, автоматического создания рабочих документов и повышения эффективности работы. Они также могут быстро составлять контрактные документы и использовать AI для интеллектуального анализа судебных дел, обеспечивая профессиональное написание документов. возможности.

Вышеупомянутое — это лишь несколько сценариев, в которых приложения больших моделей искусственного интеллекта в настоящее время популярны. Кроме того, крупные отраслевые модели также широко используются во многих областях, таких как финансы, производство и геологоразведка. Началась эра, когда различные отрасли используют возможности крупных моделей искусственного интеллекта для расширения возможностей бизнеса.

Данные по-прежнему являются неизбежной темой

Как мы все знаем, данные являются «питательным веществом» для быстрой разработки больших моделей. Будь то общая большая модель или отраслевая модель, если вы хотите реализовать реальную ценность и уменьшить «иллюзии», данные необходимы. тема разговора.

Что касается отрасли, то крупные отраслевые модели требуют массивных и богатых отраслевых данных. Для компаний, которые хотят использовать крупные отраслевые модели для снижения затрат и повышения эффективности, а также для перехода от цифровизации к цифровому интеллекту, эта часть очень важна. к своим данным возможности управления выдвигают более высокие требования. С точки зрения текущих отраслевых приложений исходных данных о предприятии недостаточно для обучения полной крупномасштабной отраслевой модели на уровне предприятия. В настоящее время основным решением является использование синтетических данных. Далее, с одной стороны, предприятиям необходимо улучшить качество своих собственных данных. С другой стороны, выбор отличных синтетических данных также стал щекотливой проблемой, с которой предприятиям приходится сталкиваться.

С другой стороны, разница между крупными отраслевыми моделями и обычными большими моделями заключается в том, что большинство крупных отраслевых моделей необходимо развертывать на стороне устройства или на периферии. Gartner прогнозирует, что к 2025 году более 50% данных, которыми управляют предприятия, будут создаваться и обрабатываться за пределами центров обработки данных или облака.

Другими словами, к 2025 году объем данных на стороне устройства превысит 50%. В этом процессе, поскольку объем данных на периферии увеличивается, пропускная способность передачи данных также является серьезной проблемой, с которой приходится сталкиваться предприятиям. «Хотя Китай является мировым лидером в создании пропускной способности для всей инфраструктуры, когда Большое количество данных. Когда данные генерируются на периферии, это по-прежнему может вызывать сетевые штормы, и нам все еще необходимо дополнительно оптимизировать стратегии управления сетью и передачи данных», — сказал Го Вэй в интервью Titanium Media APP.

Заглядывая в будущее, Сачин Катти рассказал TMTpost Media APP, что, хотя ИИ управляет данными для улучшения качества, эти данные, в свою очередь, помогут ИИ стать лучше, что в конечном итоге приведет к созданию благоприятного цикла.

Очевидно, что большие модели вступили в период быстрого развития в отрасли. В ходе этого процесса предприятия должны следовать принципу «управляемые данными, сценарий превыше всего», чтобы обеспечить более эффективное внедрение больших моделей в отрасли.(Эта статья была впервые опубликована в приложении Titanium Media, автор | Чжан Шэньюй, редактор | Гай Хонда)

Новости

Когда большие модели проникают в отрасль, ключом к внедрению становятся сценарии ToB Industry Observation |

Введение

моя контактная информация