внутренняя речь робина ли раскрыта: модель с открытым исходным кодом неэффективна и не может решить проблему вычислительной мощности

внутренняя речь робина ли раскрыта: модель с открытым исходным кодом неэффективна и не может решить проблему вычислительной мощности.

2024-09-11

«у внешнего мира довольно много недопониманий относительно крупных моделей». недавно была раскрыта внутренняя речь робина ли. робин ли считает, что в будущем разрыв между крупными моделями может увеличиться. далее он пояснил, что «потолок» крупных моделей очень высок, и он все еще далек от идеальной ситуации. поэтому модель должна продолжать быстро повторяться, обновляться и модернизироваться, в нее нужно иметь возможность инвестировать каждый день по нескольку раз. лет или более десяти лет, чтобы постоянно удовлетворять потребности пользователей, снижать затраты и повышать эффективность.

что касается заявления отрасли о том, что «между возможностями больших моделей нет барьеров», робин ли высказал другую точку зрения: «каждый раз, когда выпускается новая модель, ее необходимо сравнивать с gpt-4o, говоря, что мой результат почти равен так же, как и он, даже баллы по некоторым отдельным пунктам превысили его, но это не означает, что нет отставания от современных моделей».

он рассказал, что для того, чтобы проявить себя, многие модели после выхода выйдут в рейтинги и будут угадывать тестовые вопросы и навыки ответов. по рейтингам возможности моделей могут быть очень близкими, «но на самом деле. приложений, сила все еще существует явный разрыв».

робин ли отметил, что разрыв между моделями многомерен. промышленность часто уделяет больше внимания пробелам в понимании, генерации, логике, памяти и других способностях, но игнорирует такие аспекты, как стоимость и скорость мышления. хотя некоторые модели могут достичь того же эффекта, они все же уступают продвинутым моделям из-за своих возможностей. высокая стоимость и медленная скорость рассуждения.

робин ли также сказал: «до эпохи больших моделей все привыкли к открытому исходному коду, что означает бесплатность и низкую стоимость». он объяснил, что, например, linux с открытым исходным кодом, поскольку у вас уже есть компьютер, использование linux является бесплатным. но это не так в эпоху больших моделей. вывод больших моделей очень дорог, а модели с открытым исходным кодом не обеспечивают вычислительную мощность. вам приходится покупать собственное оборудование, которое не может обеспечить эффективное использование вычислительной мощности.

«модель с открытым исходным кодом неэффективна с точки зрения эффективности». он сказал: «модель с закрытым исходным кодом, если быть точным, следует называть бизнес-моделью. она позволяет бесчисленному количеству пользователей разделить затраты на исследования и разработки, а также машинные ресурсы и графические процессоры, используемые для рассуждений. . эффективность использования графического процессора является самой высокой. статья baidu. использование графического процессора моделей xinda 3.5 и 4.0 достигло более 90%.

робин ли проанализировал, что в таких областях, как преподавание и научные исследования, модель с открытым исходным кодом ценна, но в коммерческой сфере, когда стремление к эффективности, результативности и минимальным затратам, модель с открытым исходным кодом не имеет преимуществ;

на уровне крупномасштабного применения модели робин ли считает, что сначала появится второй пилот, чтобы помогать людям, а затем агентный интеллект, который обладает определенной степенью автономии и может самостоятельно использовать инструменты, размышлять и саморазвиваться на этом уровне; развития автоматизации, он станет ai-работником и сможет самостоятельно выполнять все аспекты работы.

он также сказал, что, хотя «многие люди с оптимизмом смотрят на направление развития интеллекта, на сегодняшний день интеллект не является консенсусом, и такие компании, как baidu, которые считают интеллект наиболее важной стратегией и наиболее важным направлением развития больших моделей, не много".

робин ли считает, что порог для интеллектуальных агентов действительно очень низок. многие люди не знают, как превратить большие модели в приложения. интеллектуальные агенты — это очень прямой, эффективный и простой способ создавать интеллектуальные агенты. моделей.

новости

внутренняя речь робина ли раскрыта: модель с открытым исходным кодом неэффективна и не может решить проблему вычислительной мощности.

введение

моя контактная информация