внутренняя речь робина ли разоблачила: обсуждая три основных когнитивных заблуждения о больших моделях, разрыв между моделями в будущем станет больше

внутренняя речь робина ли разоблачила: обсуждая три основных когнитивных заблуждения о больших моделях, разрыв между моделями в будущем станет больше.

2024-09-16

«во внешнем мире довольно много недопониманий относительно крупных моделей», — согласно недавним сообщениям сми, была разоблачена внутренняя речь робин ли. в недавнем общении с сотрудниками робин ли рассказал о трех недопониманиях в отношении больших моделей, касающихся конкуренции между крупными моделями, эффективности моделей с открытым исходным кодом и интеллектуального агента.тенденцияждите горячих тем.

робин ли заявил, что в будущем разрыв между большими моделями может стать все больше и больше. он сказал, что потолок больших моделей очень высок, и он все еще далек от идеальной ситуации. поэтому модель должна продолжать быстро повторяться, обновляться и модернизироваться, в нее нужно иметь возможность непрерывно инвестировать в течение нескольких лет или более; десять лет для постоянного удовлетворения потребностей пользователей и снижения затрат. повышение эффективности.

ниже приводится содержание внутренней речи

вопрос: некоторые думают, что между возможностями больших моделей нет преград?

робин ли:я не согласен с этим утверждением. я думаю, что во внешнем мире довольно много недоразумений относительно больших моделей. каждый раз, когда выходит новая модель, они обязательно хотят сказать, насколько они хороши, и каждый раз следовать за ними.для сравнения с gpt-4o я беру тестовые наборы или составляю какие-то списки и говорю, что мой результат почти такой же, а в некоторых отдельных пунктах даже превосходит его, но это не доказывает, что эти недавно выпущенные модели являются самыми продвинутыми. с openal по сравнению с моделью такого большого разрыва нет.

разрыв между моделями является многомерным. одно измерение — это способности, будь то разрыв в базовых способностях, таких как способность к пониманию, способности к генерации, способности к логическому рассуждению или способности к памяти; другое измерение — это стоимость;，если вы хотите обладать этой способностью или ответить на эти вопросы, сколько вам это будет стоить? некоторые модели могут иметь очень низкую скорость вывода. хотя они достигают того же эффекта, их эффективность на самом деле не так хороша, как у самых продвинутых моделей. и для тестового наборапри составлении рейтинга он должен угадать, что тестируют другие, какие вопросы я могу использовать и какие методы я могу получить правильно, поэтому каждая модель, которая хочет доказать свои способности, попадает в рейтинги, исходя из рейтингов. или тестовые наборы. на первый взгляд вам кажется, что возможности очень близки, но в реальных приложениях все еще существует явный разрыв.

отчасти шумиха в сми в сочетании с мотивацией огласки при выпуске каждой новой модели создает у всех впечатление, что разница в возможностях между моделями относительно невелика. на самом деле это не так. в процессе фактического использования я не позволяю нашему техническому персоналу составлять рейтинги. что действительно измеряет возможности большой модели wenxin, так это то, можете ли вы удовлетворить потребности пользователей в конкретных сценариях применения и можете ли вы получить выгоду. что нас действительно волнует.

нам нужно увидеть, что, с одной стороны, существует относительно очевидный разрыв между возможностями модели, а с другой стороны, потолок очень высок. то, что вы делаете сегодня, еще далеко от того, что вы на самом деле хотите делать, и от того, что вы действительно хотите делать. идеальное состояние, поэтому модель также необходимо постоянно и быстро повторять, обновлять и совершенствовать.даже если вы увидите, что разрыв сегодня не так уж велик, увидите ли вы, увеличится ли он в следующем году? кто сможет продолжать инвестировать в это направление в течение нескольких лет или даже более десяти лет, чтобы оно могло все больше удовлетворять потребности пользователей, соответствовать сценариям и удовлетворять потребности повышения эффективности или снижения затрат?разрыв между разными моделями не становится все меньше и меньше, а будет становиться все больше и больше. просто, когда они не знают реальных потребностей, им может показаться, что почти достаточно просто ответить на вопросы тестового набора.

так называемый ведущийдвенадцать месяцев или 18 месяцев позади, я не думаю, что это так уж важно. каждая из наших компаний находится в условиях абсолютно конкурентного рынка. независимо от того, какое направление вы выберете, конкурентов будет много. если вы всегда сможете опережать своих конкурентов на 12–18 месяцев, вы не станете непобедимыми. подумайте, что впереди вас 12-18 человек. месяц — это очень короткий срок.даже если вы можете гарантировать, что всегда будете впереди своих конкурентов.6 месяцев, затем выиграй, ваша доля рынка может быть70%, тогда как у оппонента может быть только 20% или даже 10%.

вопрос: некоторые говорят, что модель с открытым исходным кодом сокращает разрыв с моделью с закрытым исходным кодом. уничтожит ли это бизнес-модель крупных компаний, использующих модель с закрытым исходным кодом?

робин ли:этот вопрос тесно связан с предыдущим вопросом. я только что сказал, что помимо возможностей или эффектов модель также должна быть эффективной. с точки зрения эффективности модели с открытым исходным кодом не очень хороши. точнее, модель с закрытым исходным кодом следует называть бизнес-моделью. коммерческая модель — это модель, в которой бесчисленное количество пользователей или клиентов используют одни и те же ресурсы и разделяют затраты на исследования и разработки, машинные ресурсы и ресурсы для рассуждений.графический процессор, а модель с открытым исходным кодом требует самостоятельного развертывания набора компонентов. какова интенсивность использования графического процессора после развертывания? нашбольшая модель вэньсинь3.5、4независимо от 0.0, уровень использования превышает 90%. сколько людей используют развернутую вами модель с открытым исходным кодом? мы сообщаем общественности, что модель wenxin вызывается более 600 миллионов раз в день, а количество токенов, генерируемых каждый день, превышает один триллион. какая модель с открытым исходным кодом может сказать, сколько вызовов она совершает в день и сколько токенов она генерирует? как будут распределяться затраты, если им никто не пользуется? как можно сравнить стоимость вывода с коммерческими моделями?

до эпохи больших моделей все привыкли к открытому исходному коду, что означает бесплатность и низкую стоимость. в то время за коммерческие продукты на рынке приходилось платить за каждую версию, например, за покупку компьютерной установки.windows, microsoft, возможно, придется брать за нее много денег, но вам не придется тратить эти деньги, если вы используете linux. поскольку linux имеет открытый исходный код, все программисты могут видеть код. если что-то сделано не так, я могу его обновить. после обновления я могу зарегистрироваться. каждый подливает масла в огонь, и вы можете продолжать добиваться прогресса на своих плечах. гигантов. но это не так в эпоху больших моделей. в эпоху больших моделей люди часто говорят о том, насколько дорогими являются графические процессоры, а вычислительная мощность является ключевым фактором, определяющим успех или неудачу больших моделей.дает ли модель открытого исходного кода вам вычислительную мощность? если он не дает вам вычислительной мощности, как он сможет эффективно использовать вычислительную мощность? модель с открытым исходным кодом не может решить эту проблему.

раньше вы уже платили за вычислительную мощность при покупке компьютера, но это не относится к выводу больших моделей. этот вывод на самом деле очень дорогой. поэтому ценность больших моделей с открытым исходным кодом заключается в области преподавания и научных исследований. если вы хотите понять, как работают большие модели, если вы не знаете исходный код, это определенно будет недостатком. но в реальности. сфера бизнеса, когда вы стремитесь к эффективности, эффекту, когда стремление к наименьшим затратам, модель с открытым исходным кодом не имеет преимуществ.

просить:как будут развиваться приложения ии? почему акцент делается на интеллекте?

робин ли: процесс разработки больших моделей должен пройти эти этапы. в начале людям оказывают помощь, и наконец, когда что-то выходит, людям нужно пройти финальную проверку. мы уверены, что эффект есть.хорошо, его выпустят только в том случае, если он хорош во всех аспектах. это этап второго пилота; дальше находится интеллект агента. во внешнем мире есть разные определения агента. самое главное, чтобы он имел определенную степень. автономии, со способностью использовать инструменты независимо, размышлять, саморазвиваться и т. д., если эта степень автоматизации пойдет дальше, он станет так называемым al worker, способным выполнять разнообразную умственную и физическую работу, например. человек, и все аспекты работы могут быть выполнены самостоятельно. должен быть такой процесс.

мнение о том, что «интеллектуальные агенты являются важнейшим направлением развития больших моделей», на самом деле не является консенсусом. на конференции baidu create мы представили три продукта: agentbuilder, appbuilder и modelbuilder. оба продукта — agentbuilder и appbuilder — посвящены агентам, один имеет более низкий порог, а другой — более мощные функции. после того, как мы это объяснили, некоторые люди, наконец, начали понимать, что эта вещь действительно интересна, может приносить пользу и может быть сделана с относительно низким порогом, который каждый считает пригодным для использования. с тех пор популярность интеллектуальных агентов постепенно росла, и многие люди начали с оптимизмом смотреть на направление развития интеллектуальных агентов.но до сих пор интеллект не является консенсусом. немногие компании, подобные baidu, считают интеллект самой важной стратегией и самым важным направлением развития больших моделей.

почему мы уделяем такое большое внимание агентам? потому что порог для интеллектуальных агентов действительно очень низок. в прошлом году мы сказали, что мы должны развертывать приложения, и каждый должен создавать приложения. на самом деле, многие люди до сих пор говорят, что не знают, как это сделать, смогут ли они это сделать. в этом направлении и какие способности мне нужно использовать? существует бесчисленное множество неопределенностей в отношении возможности создания ценности в этом сценарии, и все не знают, как перейти от модели к приложению.но агент предоставляет очень прямой, очень эффективный и очень простой способ. построить агент на основе модели довольно удобно., поэтому каждую неделю на платформе wenxin создаются десятки тысяч новых агентов.

что касается агентов, то мы уже увидели эту тенденцию и имеем относительно хорошие предпосылки. помимо сильных возможностей самой модели, у нас также есть хорошие каналы сбыта. байдуприложение, особенно поиск baidu, имеетмиллиарды людейпри использовании пользователи активно выражают нам свои потребности, какой интеллектуальный агент сможет лучше ответить на его вопросы и удовлетворить его потребности. это естественный процесс сопоставления, поэтому мы лучше всего можем помочь этим интеллектуальным разработчикам.

отчет/отзыв

новости

внутренняя речь робина ли разоблачила: обсуждая три основных когнитивных заблуждения о больших моделях, разрыв между моделями в будущем станет больше.

введение

моя контактная информация