Разговор с Ли Яном: первая генеративная рекомендация при поддержке Suhua, Jingwei и Redpoint

Разговор с Ли Яном: финансируется Suhua, Jingwei и Redpoint, первой стартап-компанией, занимающейся генеративными рекомендациями.

2024-07-18

Человечество предвещает взрывное обновление в области искусственного интеллекта. Каждый шаг в распространении технологий в неизведанное привлекает удивительное внимание.

В процессе расширения границ искусственного интеллекта инновации и разногласия сосуществуют на технических маршрутах важных направлений. Суждения и выбор пионеров технологий влияют на шаги многих последователей.

В прошлом году Heart of the Machine взяла на себя эксклюзивную инициативу по представлению всем выдающихся компаний, таких как Dark Side of the Moon, Shengshu Technology, Aishi Technology и Wuwen Core Dome, оставив им первый сценарий интервью на 10 000 слов. «В мире Интернета. . На этапе, когда технологические маршруты еще не сошлись, мы видим лидерство предпринимателей, занимающихся искусственным интеллектом, которые действительно обладают верой, смелостью и систематическим познанием.

Поэтому мы запустили рубрику «Пионеры ИИ», надеясь и дальше находить и фиксировать предпринимателей с лидерскими качествами в различных подразделениях искусственного интеллекта в эпоху AGI, знакомить с наиболее выдающимися и высокопотенциальными стартапами в сфере ИИ. и поделятся своими достижениями в области искусственного интеллекта.

Автор: Цзян Цзинлин

Отчет о сердце машины

Покинув Куайшоу, чтобы начать бизнес, «Ли Янь» незаметно получил 32 миллиона долларов США в виде начального раунда финансирования от соучредителя Kuaishou Су Хуа, Redpoint Ventures и Matrix Partners.

Являясь ключевой фигурой первоначальной системы искусственного интеллекта Куайшоу, Ли Янь однажды построил первый отдел глубокого обучения в Куайшоу, а позже помог Куайшоу создать технологическую систему понимания мультимедиа.

Один из его инвесторов пришел к выводу, что среди трех предпринимательских портретов профессоров и ученых, деятелей мобильного Интернета и академических гениев, созданных AGI, Yuanshi Technology является единственной компанией, способной интегрировать три «мультимодальные, поисковые и рекомендательные» функции. команда с большим стеком основных технологий.

Однако с тех пор, как Ли Янь официально подтвердил, что начинает бизнес в начале 2023 года, он уже больше года практически исчез.

В прошлом году мы разослали команде Ли Яна несколько приглашений на интервью, надеясь поговорить с ним о его предпринимательских идеях, но нам всем было отказано со ссылкой «продукт еще не готов (публично доступен)».

Не так давно был официально запущен продукт Yuanshi Technology «Ask Xiaobai», и началось внутреннее тестирование холодного запуска. Это также первый раз, когда команда Ли Яня раскрыла свой предпринимательский прогресс. Итак, мы снова нашли Ли Яня, надеясь поговорить с ним о его предпринимательском плане.

Неожиданным в этом эксклюзивном интервью является то, что Ли Янь выбрал не просто модельную компанию, и он даже не начинает с мультимодального аспекта.

В продукте «Спросите Xiaobai» пользователи могут видеть контент AIGC, созданный искусственным интеллектом, в «ленте», как только они открывают экран, и персонализированный в зависимости от интересов пользователя, а также могут использовать функцию «чата» и искусственный интеллект, чтобы делать больше. контент на основе контента в любое время.

Можно понять, что это продукт сообщества генеративного контента, основанный на самостоятельно разработанной модели LLM. По сравнению с предыдущими продуктами сообщества контента, действие Ли Яна заключается в «генеративных рекомендациях».

Это передовая область технологических исследований, и пока только Meta и CMU имеют некоторые практические результаты. Он сказал мне, что по сравнению с предыдущими алгоритмами рекомендаций, алгоритмы генеративных рекомендаций больше не будут основаны на системах рекомендаций совместной фильтрации, а рекомендации станут более интеллектуальными, от нынешних «тысяч людей с десятью лицами» до истинного смысла «тысячи людей». люди с десятью лицами». У людей тысячи лиц».

Изучая более глубокие потребности пользователей, эффективность рекомендаций еще больше повышается, и пользователи могут получать информацию, которая им больше подходит. Более того, включение большого количества высококачественного корпуса в большие модели придает алгоритму генеративных рекомендаций «ценность». Вы уже можете не просто «порадовать» пользователей, а направить пользователей обратить внимание на качественную информацию, которая действительно требует внимания.

В настоящее время команда Ли Яна является первой стартап-компанией в Китае, которая использует алгоритмы генеративных рекомендаций на основе LLM в качестве основы своего продукта и направления развития.

Инвестор Yuanshi считает, чтоОптимизация затрат и эффективности, которую этот новый технологический движок привносит в индустрию контента, в основном соответствует пути Toutiao к успеху.На пути к созданию продуктов на основе алгоритмов генеративных рекомендаций: «Мы увидели, что единственная команда, имеющая три опыта: мультимодальный, поисковый и рекомендательный, — это Ли Ян».

Зрение:

Создайте многомерный алгоритм рекомендаций.

Сердце машины: Давайте сначала представим, на что надеется Yuanshi Technology?

Ли Ян: Мы надеемся, что благодаря технологическим инновациям и сбору данных мы сможем помочь пользователям войти в состояние потока и бороться с умственной усталостью. (Из теории «потока» Михая Чиксентмихайи)

Machine Heart: Это немного абстрактно, можете ли вы объяснить это подробнее?

Ли Ян:Мы чувствуем, что нынешняя эпоха — это эпоха информационного взрыва. Существует множество каналов получения информации, но каналы, которые действительно могут получить нужную нам информацию, отсутствуют.

Например, в недавнем WAIC вы можете видеть ошеломляющие отчеты, но каждый отчет содержит всего несколько слов, но вы не можете получить информацию, которая вас действительно волнует. В это время вы впадаете в своего рода беспокойство.

Мы понимаем, что это форма «духовной энтропии». Эту концепцию предложил психолог Михай Чиксентмихайи, и она очень точно соответствует тому, что мы хотим сделать. Мы хотим помочь каждому улучшить свое счастье и чувство выгоды после просмотра этой информации. Это состояние будет отличаться от «более тревожного, усталого и счастливого», которое мы чувствуем после интенсивного использования некоторых информационных продуктов.

Сердце машины: Какая информация заставит людей чувствовать себя более счастливыми и полезными, а не более тревожными и уставшими?

Ли Ян:Здесь существует понятие «потока», которое означает, что только когда люди видят ту информацию, которую они действительно хотят видеть, они войдут в состояние потока и почувствуют счастье, вместо того, чтобы видеть множество вещей, которые не связаны с ними самими. неактуальны или неинтересны.

Это тоже результат психологических исследований. Если привести конкретный пример, родители просят своих детей сделать домашнее задание. Хотя это в конечном итоге выполняется, ребенок пассивен и очень болезненный. Он почувствует себя счастливым. Поэтому мы надеемся помочь пользователям войти в состояние потока и бороться с ментальной энтропией.

Сердце машины: Фактически, базовые системы рекомендаций большинства социальных сообществ теперь по сути надеются достичь этой цели (рекомендовать пользователям то, что они действительно хотят видеть)?

Ли Ян: Есть разница. Если мы посмотрим десять лет спустя, в 2034 году, и посмотрим на сегодняшние системы рекомендаций, включая продукты и технологии, лежащие в их основе, они на самом деле очень отсталые. То, что делает нынешний продукт, на самом деле не в идеальном состоянии.

Сердце машины: Как понять текущий уровень и «лучший» уровень?

Ли Ян:Могу провести аналогию: нынешнее распространение информации больше похоже на инстинктивную реакцию первобытных людей. На стадии, когда дух еще не слишком богат, возможно, человеческий инстинкт - «Я хочу есть», «Я хочу плакать», «Я хочу плакать». «Я хочу смеяться»», это очень прямо.

Отражением в системе рекомендаций может быть то, что, например, если вам нравятся красивые парни, вам всегда порекомендуют красивых парней — система рекомендаций не требует слишком глубокого мышления. Наша продукция надеется достичь не удовлетворения инстинктивной реакции пользователя, а рекомендации с высшей мудростью, заботой и любовью.

Сердце машины: Это звучит как более высокий уровень эстетики, что-то вроде «обучения пользователей».

Ли Ян: Не образование, если быть точным. Многие вещи невозможно увидеть ясно, если мы посмотрим на них за относительно короткий период времени. Но, например, если мы посмотрим на всю историю человеческого развития, мы обнаружим, что каждое продвижение человеческой цивилизации будет сопровождаться критикой, размышлениями и даже переворотами и реконструкциями. Некоторые вещи могут выглядеть хорошо сейчас, но в будущем, возможно, это возможно. есть ограничения. То же самое справедливо и в онлайн-мире. Мы надеемся привнести в распространение контента больше цивилизованных элементов и передовых идей, накопленных человечеством.

Технический путь реализации:

Выберите данные более высокого качества для обучения модели, чтобы она имела значения.

Сердце машины: Я только что сказал, что надеюсь создать контент-продукт, который поможет пользователям улучшить поток информации. Почему вы начинаете с создания лучшего LLM?

Ли Ян: Мы считаем, что LLM — это очень важный узел, ведущий к AGI. Большие языковые модели могут лучше понимать пользователей и контент, а также знать, что волнует пользователей, что им нравится и что не нравится. Все личные интересы и хобби пользователя могут быть токенизированы, и большие модели могут их очень хорошо понимать.

Предыдущая система рекомендаций не могла достичь такого уровня понимания. Она могла только маркировать пользователя множеством отдельных ярлыков и пытаться с помощью этого охарактеризовать и понять пользователя. Теперь большие модели могут не только лучше понять существующие интересы пользователей, но также улучшить анализ интересов пользователей и сделать выводы о скрытых интересах и хобби пользователей.

С помощью большой модели мы можем сжать корпус высочайшего качества во всем Интернете, сжать человеческую цивилизацию, содержащуюся в тексте, использовать эти цивилизации и в дальнейшем применять эти возможности для генеративных рекомендаций, она будет иметь свои ценности, мировоззрение и, следовательно, многомерная рекомендуемая система значений.

Большая модель на самом деле играет роль моста, связывая эти самые передовые знания с вашим потреблением информации, а затем еще больше повышая уровень вашего потребления контента.

Machine Heart: Относится ли это «продвинутое» содержание к статьям? Включает ли оно как социальные, так и естественные науки, или же оно больше сосредоточено на чем-то одном?

Ли Ян:Большая модель будет читать всю информацию о развитой цивилизации и информацию, накопленную людьми во всем Интернете, и ее можно будет усовершенствовать во всех аспектах.

Сердце машины: Как большая модель определяет, что такое «развитая цивилизация»?

Ли Ян:На самом деле, мы, люди, уже вынесли суждения по этому вопросу, а не большие модели. Например, наши авторитетные статьи, журналы и книги, написанные известными учеными, основаны не на больших моделях, а на высококачественной информации, установленной самими людьми. в течение длительного периода времени.

Machine Heart: Что же это за часть высококачественных данных? источник?

Ли Ян: Мы ценим создание возможностей моделей, управляемых данными. В нашей модели мы используем алгоритмы, позволяющие увеличить объем доступных высококачественных данных более чем на порядок. Кроме того, что касается отбора данных, мы используем больше классических книг, теорий и статей для обучения наших больших моделей, чтобы наши модели могли глубже понимать пользователей. Если говорить более конкретно, когда дело доходит до рекомендаций по контенту. не будет слепо позволять пользователям оставаться в краткосрочном удовольствии. Вместо этого есть долгосрочное счастье от накопления высококачественной информации.

Machine Heart: Я только что упомянул, что алгоритмы генеративных рекомендаций могут улучшить понимание пользователей. Существует ли какой-либо количественный стандарт для сравнения понимания пользователей различными алгоритмами рекомендаций?

Ли Ян: Поскольку цели, которые преследуют разные компании, различны, то и цели оптимизации также различны. Вообще говоря, это может быть продолжительность, рейтинг кликов и удержание. Поскольку наши технические принципы и направление бизнеса являются новыми областями, в настоящее время у нас есть очень сложная внутренняя система данных для оценки этого вопроса.

Сердце машины: Каковы преимущества технологии Yuanshi в настоящее время в отношении LLM?

Ли Ян: Начиная с первого дня основания компании, то есть примерно с апреля 2023 года, первая версия большой модели базировалась на архитектуре MoE. Общий выбор технических маршрутов на рынке очень дальновиден. С апреля 2023 года по настоящее время в течение более года наша модель сменила четыре версии. На многих общедоступных наборах тестов наши результаты лучше, чем у многих других моделей.

Кроме того, наш качественный корпус делает качество ответов очень высоким, а модель обладает способностью глубоко мыслить. В-третьих, скорость нашей большой модели также очень конкурентоспособна и имеет чрезвычайно низкую задержку. Мы провели экстремальную оптимизацию в обучении моделей и выводе, что значительно снизило затраты на обучение больших моделей. Теперь мы бесплатны и не нужно платить за использование в периоды пиковой нагрузки.

Machine Heart: Как вы думаете, почему МО — лучший маршрут?

Ли Ян: Мы считаем, что для создания собственных продуктов нам необходимо иметь возможность интегрировать основные звенья модели. В эпоху больших моделей эффект модели становится лучше, а это часто означает, что ее параметры больше. Но как продукт TO C, если стоимость вывода модели высока, он не будет работать с коммерческой точки зрения. Следовательно, нам нужно как большое количество параметров, так и низкая стоимость вывода. В качестве предварительного условия коммерческой осуществимости в конечном итоге мы можем выбрать только MoE. Мы четко обдумали эту проблему с первого дня, и первая строка кода, которую мы написали, была MoE.

Сердце машины: Поскольку Yuanshi позиционируется как компания-разработчик приложений, рассматривали ли вы возможность использования некоторых моделей с открытым исходным кодом в процессе исследований и разработок, что может быть более экономичным?

Ли Ян:Наша цель не в том, чтобы стать компанией на уровне моделей, но причина, по которой мы по-прежнему предпочитаем разрабатывать собственные большие модели, заключается в том, что мы считаем, что модели других людей не служат нашим целям. Мы — продукт, движимый нашими собственными большими моделями. компания.

Мы не предпринимали никаких попыток создания бизнес-модели на модельном уровне. Это связано с моими личными знаниями. Некоторые думают, что большие модели — это вода и электричество, а это значит, что как только я сделаю хорошую большую модель, вам не нужно этого делать, и вы все сможете использовать мои способности. Но мы считаем, что большее значение большой модели заключается в ее способности максимально обслуживать пользователей и возможностях, основанных на сценариях. Она лучше обслуживает пользователей в фиксированном сценарии и обеспечивает опыт, который раньше был совершенно недоступен.

Кроме того, возможности точной настройки изменений оказались ограниченными. Поскольку мы достаточно новаторски подходим к этому, нам необходимо внести серьезные изменения в базовую архитектуру модели. Мы также будем использовать наши собственные модели для внутреннего сравнения с моделями с открытым исходным кодом. Факты доказали, что результаты наших внутренних моделей, разработанных нами, намного лучше, чем результаты моделей с открытым исходным кодом. Поскольку эта модель полностью построена для моего сценария, была проделана большая работа — от построения обучающих данных до разработки алгоритма.

Machine Heart: Вы также один из первых исследователей мультимодальности в Китае. Есть ли у вас график мультимодальности?

Ли Ян: В настоящее время большая текстовая модель по-прежнему является ядром ядра. Это основа интеллекта.

стоимость продукта:

Возможность уделять больше внимания индивидуальным потребностям пользователей.

Сердце машины: форма продукта Yuanshi Technology на самом деле отличается от почти всех крупных моделей продуктов C-конца, представленных на рынке. Почему вы хотите дать определение такому продукту?

Ли Ян: Мы не являемся продуктом, ориентированным на определенную группу людей, мы нацелены на широкий круг людей, и мы не являемся сообществом с вертикальным контентом. Мы считаем, что с улучшением возможностей создания и распространения ИИ границы будущих категорий контента в эпоху ИИ будут становиться все более размытыми.

На уровне продукта наш продукт в настоящее время имеет две функции: одна — «Лента», другая — «Чат». Мы называем это «Спроси Сяобая». Одним из аспектов является то, что пользователи могут задавать ему любые вопросы в своей жизни. С другой стороны, Сяобай «спрашивает». Основываясь на вопросах, которые пользователи задают ИИ, Сяобай также возьмет на себя инициативу, чтобы заботиться о пользователях и активно подталкивать их к пользователям. Его зовут Сяобай, он надеется, что у пользователей появится чувство безопасности и близости, они откажутся от холодного или жестокого ИИ и смогут иметь тесный контакт с пользователями.

Machine Heart: Так можно ли это понимать как контент-продукт с функциями искусственного интеллекта?

Ли Ян:Да, в дополнение к этому, это еще и онлайн-друг, который понимает ваши предпочтения. Как пользователь, вы можете организовать ему что-то, если вам есть чем заняться, он может наблюдать за вами и активно действовать. что-то, чтобы посмотреть, чем это может вам помочь.

Сердце машины: Все содержимое потока исходит от AIGC? Как обеспечить качество этого контента?

Ли Ян: Если для создания контента используется большая модель, ей сначала необходимо знать, какой контент нравится пользователям, а затем генерировать и организовывать высококачественный контент статей на основе этих тем. Эти два уровня — это способность к пониманию, с одной стороны, и способность к порождению, с другой стороны. Если посмотреть на это сейчас, в этих двух аспектах еще есть много возможностей для улучшения больших моделей способностей. Это также причина, по которой мы начали бизнес, потому что мы верим, что у нас есть возможность значительно улучшить это дело.

Сердце машины: Продукт немного похож на версию Zhihu, Xiaohongshu и Toutiao с искусственным интеллектом. Каковы различия и преимущества по сравнению с ними?

Ли Ян: В первую очередь мы уделяем больше внимания персонализированным потребностям пользователей. Для всех продуктов предыдущего поколения, о которых вы только что говорили, самым основным принципом их системы рекомендаций является совместная фильтрация. То есть, если одному пользователю нравятся A и B, а другому пользователю нравятся A и C, то B и C. тоже похожи. Тогда мы порекомендуем вам B и C соответственно. У этого метода совместной фильтрации есть очень очевидная проблема: он всегда рекомендует вам некоторые категории позвонков.

почему? Это потому, что если вам нравится какая-либо тема, велика вероятность, что вам, как и другим людям, которым нравится эта тема, больше нравятся красивые женщины и красивые мужчины, и все они, как правило, любят развлечения. Таким образом, система в конечном итоге определит, что вы действительно любите развлечения и любите красивых парней и красивых женщин.

У этого метода есть свои преимущества: он позволяет быстро экономить время пользователя и продолжать расти. Но его проблема в том, что он закрывает личные и нишевые интересы пользователей, что затрудняет детальное понимание пользователей.

И делаем это на основе больших моделей. Прежде всего, мы надеемся позаботиться о ваших личных интересах, а не рекомендовать вам красивых парней, красавиц или развлекательный контент. В этом случае эта система рекомендаций не является по-настоящему персонализированной системой рекомендаций.

Поэтому достаточно интеллектуальная рекомендательная система теоретически должна быть в состоянии позаботиться обо всех интересах пользователей. Будь то ваши общие интересы или нишевые персональные интересы. Пока сделано недостаточно.

Machine Heart: Почему при открытии бизнеса вы выбрали именно это направление, а не распространённую сейчас форму продукта в виде чат-бота или эмоционального компаньона?

Ли Ян: Мы считаем, что интеграция LLM с рекомендациями дает возможность определить новый тип взаимодействия, плавный опыт, не требующий «активного» взаимодействия. В настоящее время чистое общение в чате по-прежнему имеет определенные пороги использования для пользователей, и пользователям необходимо активно инициировать вопросы. В некоторой степени это также ограничивает проникновение и использование более широкого круга пользователей. Как и все рекомендуемые продукты, которые мы используем сегодня, хотя пользователи используют их часто, мы по-прежнему видим, как пользователи неоднократно их удаляют. Постоянное притворство означает, что он не может жить без этого, но неоднократное откладывание означает, что он не удовлетворен на 100%. Это момент, который заставляет нас думать, что рекомендуемые продукты на самом деле по-прежнему имеют большие возможности.

Исходя из этого, мы считаем, что опыт нашей команды очень подходит для этого. Я лично и команда имеем большой опыт в поиске, исследованиях искусственного интеллекта и масштабном внедрении продуктов.

Machine Heart: Однако в настоящее время продукты, основанные на контенте, обычно сталкиваются с дилеммой неясных путей коммерциализации и не очень успешны. Что вы думаете по этому поводу?

Ли Ян: Мы все еще находимся на том этапе, когда нам необходимо более полно продемонстрировать ценность наших пользователей. Имеет смысл говорить только о коммерческой ценности, основанной на большой пользовательской ценности. Многие продукты представляют собой очень успешные примеры сильных возможностей монетизации продуктов с большим объемом контента, таких как Kuaishou.

Сердце машины: Оглядываясь назад на продукт, в чем ценность лучшего ответа на продукт?

Ли Ян: Я думаю, что есть два. Во-первых, чем лучше ваши ответы, тем выше будет привязка пользователей. В этом случае вы сможете узнать больше пользовательских сигналов и лучше их понять. В конечном итоге система может использовать их для создания контента для пользователей, который им нравится и действительно нужен. Постоянно формируйте положительный опыт и цикл данных.

Machine Heart: Если рассуждать оптимистично, какое влияние может оказать постепенная зрелость алгоритмов генеративных рекомендаций на контент-индустрию? В вашем воображении, как мог бы выглядеть зрелый «Спросите новичка»?

Ли Ян:Генеративные рекомендации придают новую жизнь контенту, позволяя вносить огромные изменения в этот сектор, а не разрабатывать улучшения.

В настоящее время большие модели и другие связанные с ними технологии развиваются семимильными шагами, но существует очевидное узкое место в общении между людьми и ИИ. У нас есть возможность добиться большего в обоих аспектах. Спросите Сяобая, спрашивает Сяобай, мы надеемся значительно способствовать инклюзивности технологии искусственного интеллекта и позволить обычным пользователям, которым больше нужен искусственный интеллект, почувствовать силу искусственного интеллекта.

Новости

Разговор с Ли Яном: финансируется Suhua, Jingwei и Redpoint, первой стартап-компанией, занимающейся генеративными рекомендациями.

Введение

моя контактная информация