моя контактная информация
почта[email protected]
2024-09-26
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
текст | белый голубь
редактор|ван ису
«основная логика искусственного интеллекта для науки отличается от нынешней логики обучения больших языковых моделей», — лу цзиньтан, технический директор shenzhen technology, прямо заявил, что нынешняя логика искусственного интеллекта в области научных исследований и применения больших технологий. языковые модели в других отраслях не те же.
в отрасли хорошо известно, что обучение на больших языковых моделях опирается на «подачу» высококачественных данных. чем больше данных, тем сильнее возможности большой языковой модели. однако в некоторых конкретных областях научных исследований объем данных относительно скуден. например, для определенных типов белковых структур получение сотен качественных экспериментальных данных может занять несколько лет.
это также означает, что применение ии в области научных исследований требует относительно меньшего количества данных для достижения лучших эффектов модели.
итак, как именно ии меняет науку? и как запустить бизнес-модель? компания shenzhen technology, одна из компаний-представителей искусственного интеллекта для науки, предложила свои собственные идеи и решения.
в традиционных научных вычислениях, если вы хотите предсказать физические свойства молекул и атомов на основе их структурной информации, вам обычно приходится выполнять микроскопические расчеты в сочетании с практическими задачами. в настоящее время отрасли все еще не хватает возможности реализовать эти межмасштабные вычислительные возможности и она больше полагается на эмпирические суждения и экспериментальную проверку.
в то же время с расширением масштабов вычислительных систем объем вычислений в традиционных научных расчетах увеличился в геометрической прогрессии, часто достигая десятков тысяч и даже сотен миллионов систем атомного масштаба. если расчеты полностью зависят от обычных физических вычислений. моделей общее время расчета составит цикл может быть очень длинным.
«shenzhen technology может заставить модель выдавать результаты вычислений, близкие к точности физической модели, и в то же время значительно улучшить производительность вычислений», — сказал лу цзиньтан: «мы используем ии, чтобы соответствовать этим физическим методам, которые могут иметь значение». раньше требовалось большое количество вычислений.
если взять в качестве примера распознавание изображений, то его суть заключается в анализе пиксельной информации изображения. используя сверточную нейронную сеть, она может извлекать локальные особенности изображения, разлагать исходное изображение на различные карты признаков и выполнять приблизительное решение с помощью признаков. комбинация. на самом деле это анализ уменьшения размерности.
фактически, ии также является приложением для уменьшения размерности в научной области. он снижает сложность вычислений благодаря своим мощным возможностям моделирования, особенно на ранних этапах, связанных с межмасштабными вычислениями. в то же время, основываясь на возможностях мультимодальной большой модели, можно также достичь многомерного анализа и прогнозирования различных типов данных, таких как молекулярная структура, физические свойства, экспериментальные данные и т. д.
например, в процессе разработки лекарств обычно необходимо сначала проанализировать структуру белка и точки-мишени, а затем отобрать соединения-кандидаты с высоким сродством к точкам-мишеням из сотен тысяч или даже миллионов библиотек соединений. обычно проводятся многомерные оценки, включая анализ аффинности, прогнозирование и оценку химических свойств фармацевтических препаратов (таких как токсичность, абсорбция, метаболизм и т. д.).
«в области искусственного интеллекта для науки ключ к крупным моделям, поддерживающим межмасштабные расчеты, заключается в их огромном масштабе параметров и сильных возможностях обобщения. огромное количество параметров модели позволяет ей отражать сложные физические, химические и биологические явления. и сильная способность к обобщению: «базовая модель может предсказывать соответствующие свойства лекарства на основе его микроструктуры, а также ее можно применять к области материалов при переносе модели. анализируя микроструктуру материалов, мы можем прогнозировать». стабильность и другие физические состояния материалов при различных температурах и давлениях».
таким образом, понимание базовых общих моделей искусственного интеллекта для науки в shenzhen technology больше основано на наличии набора базовых моделей предварительного обучения. эту модель можно применять в различных областях промышленности для решения проблем посредством тонкой настройки.
несколько базовых моделей, которые в настоящее время изучаются shenzhen technology, по-прежнему могут давать хорошие результаты при ограниченном обучении данных и могут быть дополнительно оптимизированы и пересмотрены на основе полученных данных более высокого качества. в рамках этой модельной системы, позволяя ии самому изучать основные научные принципы и посредством дополнительного обучения с небольшим объемом данных предметной области, можно уже достичь хороших результатов, что немного отличается от больших языковых моделей.
лу цзиньтан рассказал light cone intelligence: «источники данных в области научных вычислений не широко распространены, и общедоступных наборов данных не так много, поэтому большая часть нашей работы сейчас заключается в том, чтобы повысить обучающий эффект модели. более эффективно на основе небольших наборов данных. тем лучше».
за последние два года компания shenzhen technology также успешно запустила серию крупных промышленных моделей, таких как модель молекулярного моделирования dpa, модель молекулярной конформации uni-mol 3d, модель сворачивания белка uni-fold, модель структуры нуклеиновой кислоты uni-рнк, модель uni-fold. -док высокопроизводительный механизм стыковки молекул лекарств, мультимодальная модель большого языка научной литературы uni-smart и т. д.
по словам лу цзиньтаня, shenzhen technology в настоящее время имеет сотни моделей в области материалов и лекарств, и эти модели также были успешно интегрированы в продуктовую платформу shenzhen technology.в то же время shenzhen technology также достигла стратегического сотрудничества с десятками ведущих фармацевтических компаний отрасли, а также добьется прорыва в коммерциализации в 2023 году, доход превысит 100 миллионов долларов.
в настоящее время бизнес shenzhen technology охватывает интеллектуальное образование в университетах, биомедицинские исследования и разработки, а также новые материалы для аккумуляторов.
однако, согласно текущей классификации алгоритмов ии для науки, общая разработка все еще находится на стадии l2, которая близка к экспериментальной точности. она все еще больше ориентирована на людей и использует модельные расчеты для помощи людям и снижения стресса.
на этапе l3 ии может напрямую давать результаты, а в некоторых сценариях может напрямую заменить человеческие эксперименты.
если вы хотите перейти от l2 к l3, «основная трудность заключается в том, что точность каждого звена должна достичь определенной высоты. в то же время, как интегрировать алгоритмы в каждом звене, также является большой проблемой». сказал.
глядя в будущее, лу цзиньтан считает, что рыночное пространство для ии в науке достаточно велико, будь то образование и научные исследования, биомедицина или аккумуляторные материалы, внедрение ии действительно может решить многие фундаментальные проблемы, по крайней мере, на экспериментальном уровне. и расширять возможности людей. промышленность, исследование границ и т. д. дают больше идей и точек входа.
ниже приводится подробный разговор между guangcone intelligence и лу цзинтаном, техническим директором shenzhen technology (удалено и отредактировано guangcone intelligence):
shenzhen technology использует искусственный интеллект
повышение качества и эффективности научных исследований и разработок
вопрос: большие модели изменили обработку естественного языка, создание видео и изображений. как они изменили науку?
а:большие языковые модели начали использоваться при анализе литературной информации, патентной информации и других областях. мы называем их литературными большими моделями. мы также получили некоторые результаты исследований в этой области. также выполнит некоторые мультимодальные приложения, такие как интерпретация изображений и диаграмм.
в традиционных научных вычислениях часто встречаются проблемы от микро- до макромасштабов. для решения проблем используются различные физические модели, но в некоторых сценариях межмасштабных вычислений по-прежнему отсутствуют возможности. например, если мы хотим предсказать макроскопические свойства молекулы на основе структурной информации ее атомов, нам нужна возможность моделирования в разных масштабах.
искусственный интеллект включает в себя большие модели, которые позволяют осуществлять межмасштабное моделирование. изучая эти физические модели и затем применяя их к конкретным проблемам, эти проблемы можно хорошо решить.
обычно нам приходится выполнять вычисления с большой производительностью, часто в системах с десятками тысяч или даже сотнями миллионов атомов. если расчеты основаны на физических моделях, период времени будет относительно длительным. компания shenshi technology здесь занимается тем, что позволяет модели выдавать результаты вычислений, близкие по точности к физической модели, и в то же время может значительно повысить производительность вычислений.
вопрос: как преобразовать расчеты в масштабе системы в сотни миллионов атомов в расчеты в области больших моделей? каков примерный объем расчетов?
а:на микроскопическом уровне взаимодействие между двумя атомами можно анализировать с помощью физических моделей, например, с помощью уравнений классической механики или квантовой механики, чтобы рассчитать силу взаимодействия и траекторию движения между ними. на данный момент при расчете необходимо учитывать только взаимное влияние двух атомов, и проблема относительно проста. однако с увеличением числа атомов в системе ситуация усложняется. например, когда вводится третий атом, помимо рассмотрения парного взаимодействия между каждым атомом, необходимо также проанализировать эффект многих тел среди этих трех. в это время взаимодействие и траектория между атомами не только зависят от двух атомов, но и совместно определяются состоянием всей системы, а объем вычислений возрастает нелинейно. ученые часто используют алгоритмы аппроксимации, такие как теория функционала плотности или моделирование молекулярной динамики, для эффективного выполнения вычислений в различных масштабах.
на первых порах наш ии фактически использовал ии для соответствия этим физическим уравнениям и повышения производительности вычислений. его можно сравнить с распознаванием изображений. его основная суть заключается в том, что после добавления сверточной нейронной сети оно разделяет изображение на характерные изображения, а затем выполняет приблизительное решение. то, что мы делали на заре искусственного интеллекта в области научных вычислений, также можно рассматривать как действие по уменьшению размерности, то есть ускорение процессов, которые раньше могли требовать большого количества вычислений.
вопрос: в чем разница между методами расчета традиционного ии и появлением больших моделей?
а:определение большой модели относительно расплывчато, и количество параметров обычно используется в качестве индикатора. чем больше параметров, тем больше объем вычислений. для нас это скорее предоставление многомасштабных расчетов. наша текущая модель предварительного обучения uni-mol основана на трехмерной структуре молекул и атомов, предсказывает соответствующие физические свойства, устанавливает взаимосвязи структура-активность и решает их напрямую. в прошлом прогнозы часто основывались на экспериментах и экспериментах. опыт. этот метод объединяет расчеты в разных масштабах и предоставляет новые методы расчета для таких областей, как материаловедение.
когда мы рассматриваем большие модели, мы обычно уделяем больше внимания возможностям обобщения модели. в области ии для науки это относительно распространено. например, базовая модель может предсказывать некоторые свойства, связанные с лекарствами, на основе микроструктуры. если эту модель перенести, ее можно применить к области материалов. однако рассматриваемые свойства могут быть не лечебными, а их свойствами. различные температуры и давления, поэтому наше понимание базовой общей модели в ai for science представляет собой скорее набор базовых моделей предварительного обучения. эту модель можно применять в различных областях промышленности для решения проблем посредством тонкой настройки.
вопрос: какова основная роль мультимодальности?
а:он предполагает объединение различных типов данных, таких как молекулярная структура, физические свойства, экспериментальные данные и т. д., для комплексного анализа. например, в процессе поиска лекарств обычно необходимо сначала проанализировать структуру белка и целевые точки, а затем отсеять соединения с высоким сродством к целевым точкам из сотен тысяч или даже миллионов библиотек соединений. этот процесс может включать в себя анализ сродства, анализ медицинских свойств, токсичность или полезность для усвоения организмом человека и т. д. это может быть многомерный анализ. поэтому, если вы хотите добиться лучшего эффекта скрининга, вам необходимо проанализировать его с разных точек зрения и с разных сторон.
общие мультимодальные задачи, такие как изображения и видео, могут быть ближе к нашим мультимодальным приложениям при интеллектуальном анализе данных документов. например, в документе необходимо прочитать не только текстовую информацию в документе, но и информацию об изображениях. , а информацию об изображении необходимо провести углубленный анализ, затем интегрировать ее с текстовой информацией и, наконец, вывести результаты. в литературе мы также применяем эту общую мультимодальную возможность.
вопрос: насколько велик спрос на модельные данные в области искусственного интеллекта для науки?
а:разные поля разные. конечно, чем больше, тем лучше. существует также проблема сложности их получения. например, в сегментированных приложениях в области биомедицины и аккумуляторов сложность получения данных различна. в отраслях с длительными циклами исследований и разработок и проверки вывод данных будет относительно небольшим, а абсолютный объем данных будет ограничен. . например, для некоторых конкретных типов белковых структур за несколько лет может быть всего несколько сотен записей, но в других областях данных определенно больше.
однако базовые физические модели могут генерировать больше данных. некоторые базовые модели, которые мы сейчас изучаем, все еще могут давать хорошие результаты при ограниченном обучении данных и могут быть оптимизированы и исправлены на основе данных более высокого качества, полученных в будущем. в нашей модельной системе, позволяя ии самому изучать основные научные принципы и посредством дополнительного обучения с небольшим объемом данных предметной области, можно уже достичь хороших результатов, что немного отличается от больших языковых моделей.
вопрос: как заставить ии изучить базовую научную логику, а затем решать конкретные прикладные задачи?
а:как правило, некоторые физические модели используются для непосредственного выполнения вычислений, затем полученные данные обучаются, а затем моделируются физические модели.
вопрос: какова связь между базовой большой моделью и большими моделями каждого вертикального типа? должен ли я обучать базовую большую модель самостоятельно или использовать стороннюю большую модель с открытым исходным кодом?
а:разные сценарии различны. если речь идет о большой языковой модели, она больше используется при интерпретации документов, например, при интерпретации документов. основное применение — интерпретация одной статьи. из соображений стоимости для интерпретации статьи будут использоваться некоторые общие большие модели. если мы хотим интерпретировать несколько статей или даже провести общий поиск в нашей большой библиотеке документов, включая патентный поиск и анализ, тогда мы будем использовать нашу самостоятельно разработанную литературную модель для более подробной интерпретации статьи.
поэтому мы еще работаем над продуктами для пользователей. возможно, мы решим, какая модель больше подойдет для наших продуктов, а также сделаем выбор, исходя из соображений стоимости.
в настоящее время мы называем многие модели моделями предварительного обучения. например, dpa, который мы выпустили в прошлом году, представляет собой набор моделей предварительного обучения для расчета потенциальных функций между атомами различных элементов. мы также запустили проект модели большого атома openlam. некоторое время назад, надеясь, что это пройдет. чтобы мобилизовать некоторые силы открытого исходного кода, мы можем внести свой вклад и поделиться данными вместе, чтобы обучить модель, чтобы она стала более зрелой.
вопрос: сколько моделей сейчас у shenzhen technology?
а:сейчас у нас есть сотни моделей в области материалов и медицины вместе взятых.
выручка превысила 100 миллионов, работаю с десятками фармацевтических компаний.
бизнес-модель shenzhen technology
вопрос: можете ли вы поделиться последними достижениями в области исследований и разработок shenzhen technology в области искусственного интеллекта?
а:в области медицины мы сейчас уделяем особое внимание доклиническим исследованиям, охватывающим почти все сценарии доклинических вычислений, такие как раннее обнаружение мишеней и анализ структуры белка, целевой анализ, молекулярный скрининг и анализ аффинности, прогнозирование свойств и т. д. эта серия ссылок содержит множество таких методов расчета, и теперь мы реализовали алгоритмы.
в сочетании с медицинским сценарием мы объединяем все эти алгоритмы в один продукт — нашу платформу для разработки лекарств hermite. сейчас мы в основном сотрудничаем с 50 ведущими отечественными фармацевтическими компаниями в различных областях, в основном в трех аспектах, один из которых — биотехнология. , одна — cro (организация клинических исследований), а другая — pharma (фармацевтическая компания), каждая из которых имеет свою представительскую компанию.
на прошлой неделе мы только что подписали соглашение о сотрудничестве с отечественной компанией eastern sunshine, которая производит препарат от гриппа осельтамивир. она также только что получила три первоклассных сертификата в соединенных штатах. мы продолжим работать с ними по целевым направлениям. сотрудничать.
помимо типичных компаний в области биомедицины, таких как dongguang sunshine, мы также сотрудничаем со многими научно-исследовательскими институтами и университетами, которые занимаются исследованиями и разработками лекарств, такими как западно-китайский университет медицинских наук, больница сянъя и медицинский колледж.
вопрос: наши текущие продукты можно использовать непосредственно с помощью браузера, а общее развертывание также очень легкое. все ли основные методы развертывания продуктов похожи на этот?
а:да, большая часть того, что мы выполняем онлайн, — это работа по выводу ии. работа по обучению обычно выполняется в автономном режиме, поэтому объем передаваемых данных не так уж велик. также будет небольшое количество сценариев обучения, и они более основаны. по тонкой настройке предварительно обученной модели. это также может быть выполнено с небольшими пакетами данных, и нагрузка на передачу данных также невелика. легкое развертывание не означает, что мы не используем достаточно вычислительной мощности. система использует вычислительную мощность гибридного облака и высокопроизводительных вычислений, но она реализована как доступ через браузер для пользователей. если речь идет о каких-то сценариях приватизации, нам также необходимо развернуть за ним вычислительную систему, которая не требуется для saas.
вообще говоря, крупные предприятия необходимо приватизировать. поскольку к ним предъявляются особенно высокие требования к конфиденциальности данных, в некоторых сценариях, подобных преподаванию или в некоторых исследовательских институтах, их можно временно использовать для определенной темы без необходимости приватного развертывания.
вопрос: как продвигается фактический прогресс проекта с нынешними кооперативными предприятиями? на каком именно этапе?
а:наше сотрудничество с фармацевтическими компаниями заключается в основном в процессе расчета. компания не производит лекарства, поэтому не участвует в процессе разработки лекарств фармацевтических компаний.
по сути, мы являемся полной нагрузкой. сейчас мы также пробуем некоторые новые области и исследования, такие как интеграция программного обеспечения в автоматизированные лаборатории, которые сосредоточены на исследованиях и разработках оборудования, чтобы совместно обслуживать больше компаний, потому что потребности фармацевтических компаний растут. все еще довольно большой. как сложно.
а что касается выручки, то наша выручка в прошлом году превысила 100 миллионов.
есть две бизнес-модели нашего сотрудничества с фармацевтическими компаниями: продажа программного обеспечения и совместные исследования и разработки.
многие крупные компании будут развертывать свою деятельность на местном уровне и могут позволить себе содержать свои собственные команды и иметь достаточные средства для поддержки покупки программного обеспечения. однако некоторые из них могут быть средними или новыми инновационными фармацевтическими компаниями, которым не хватает передовых производственных инструментов и соответствующих талантов для поддержки своих специалистов. использование этих инструментов они предпочитают разрабатывать совместно с нами. мы можем помочь им выполнить больше расчетов. поскольку это связано с безопасностью данных и информации, интеграция между двумя сторонами особенно тесная.
но многие крупные фармацевтические компании обладают достаточными средствами и талантами, и они даже надеются, что мы сможем предоставить им некоторые индивидуальные услуги, одновременно предоставляя им saas.
будущее искусственного интеллекта для науки
вопрос: я видел несколько существующих классификаций алгоритмов, которые очень похожи на пять классификаций автономного вождения. какого состояния мы можем достичь на этапе l2? в какой степени она сможет заменить предыдущую экспериментальную модель? можете ли вы привести пример конкретного сценария?
а:в сценарии l2 мы называем его более близким к экспериментальной точности и более ориентированным на человека, вычислениями, помогающими людям и снижающими экспериментальное давление. поскольку существуют большие различия между различными системами разработки лекарств, в некоторых системах нам удалось достичь точности, близкой к экспериментальной. так что это не значит, что пользователям вообще не нужно проводить эксперименты, но я могу помочь пользователям делать более простые вещи, такие как молекулярный скрининг. возможно, ии может помочь пользователям отсеивать сотни тысяч соединений. конец, может быть. остальное требует от научных исследователей проведения экспериментальной проверки, и экспериментальная величина будет значительно уменьшена.
вопрос: какие сложности при переходе с l2 на l3?
а:насколько я понимаю, этот уровень l3 заключается в том, что ии может напрямую давать результаты, что эквивалентно прямой замене человеческих экспериментов в определенных сценариях. трудность достижения уровня l3 главным образом заключается в том, что точность каждого звена должна достичь определенного уровня. кроме того, задействовано множество алгоритмов, и интеграция различных алгоритмов также представляет собой трудность. интеграция алгоритмов на самом деле похожа на полноценную систему рабочих процессов, и эта система может постоянно пересматриваться и оптимизировать себя.
вопрос: есть ли какие-либо итерации всей технологии от прошлого к настоящему? и будут ли какие-то узкие места в развитии нынешней модели?
а:в настоящее время мы постоянно совершенствуем различные алгоритмы на основе данных, особенно для продуктов, обычно используемых пользователями. итерация алгоритма происходит быстрее. например, наш продукт dpa был обновлен с 1-го поколения до 2-го поколения. заключается в том, что 1-е поколение может поддерживать предварительное обучение в одном поле, а второе поколение может одновременно выполнять параллельное обучение на основе наборов данных с разными методами аннотации.
узкое место в основном связано с данными. в области научных вычислений источники данных не широко распространены и общедоступных наборов данных не так много. поэтому большая часть нашей работы сейчас заключается в том, чтобы сделать обучающий эффект модели все лучше и лучше. на основе небольших наборов данных.
кроме того, есть еще одна вещь, на которую следует обратить внимание, а именно проблема интерпретируемости. поскольку требования к научным вычислениям более строгие, а требования к интерпретируемости выше, мы сейчас пытаемся улучшить интерпретируемость модели, раскрывая параметры. пути трансляции и т. д. секс.
вопрос: как решить проблему нехватки данных?
а:в области ии для науки, будь то в области материалов или медицины, самые основные физические принципы на микроуровне одни и те же, поэтому преимущество состоит в том, что данные в некоторых областях материалов можно напрямую повторно использовать в медицинской сфере. например, dpa 2 может быть основан на данных, предоставленных в различных стандартных системах, которые помогают пользователям обучать единую модель. затем, когда этот набор моделей применяется конкретно в отрасли, небольшой объем данных можно использовать для точной настройки.
мы еще не участвовали в рынке toc, но наша система уже охватывает некоторые сценарии обучения. у нас есть платформа научных исследований, которая объединяет обучение, исследования и применение. в настоящее время мы в основном сталкиваемся с университетами и некоторыми пользователями, которые более ориентированы на потребителя. для колледжей и университетов у нас будет аналогичная платформа практического обучения для преподавателей. эта платформа может поддерживать все: от преподавания до посещения занятий студентами и даже использования и даже внедрения результатов исследований.
в:ai fкаково будущее развитие рынка или науки?
а:я думаю, что рыночное пространство достаточно велико. будь то научные исследования, медицина или материалы, добавление ии, по крайней мере на экспериментальном уровне, действительно может решить проблемы, помочь научным исследователям улучшить результаты экспериментов и снизить экспериментальную нагрузку.
с точки зрения общего признания потребителями, во многих сценариях часть затрат для нас заключается в обучении пользователей. например, в области лекарств мы устанавливаем долгосрочные отношения сотрудничества с клиентами, поскольку нам необходимо сопровождать клиентов на протяжении всего цикла проверки. .
сравнительно говоря, в области материалов происходит намного быстрее. например, цикл исследований и разработок батарей происходит очень быстро. если влияние соотношения электролитов прогнозируется ии, этого будет достаточно для проверки подготовки.
на национальном уровне министерство науки и технологий совместно с фондом естественных наук китая запустило специальную работу по развертыванию искусственного интеллекта для науки. это также еще раз показывает, что все, от социально-экономического уровня до национальной макрополитики, настроены оптимистично и решительно поддерживают это, без сомнения.
вопрос: искусственный интеллект для науки все еще находится на ранней стадии своего развития. на какой стадии он разовьется в ближайшие три года?
а:думаю, по крайней мере, у всех клиентов будет единое понимание в этом вопросе. теперь все начали активно использовать ии, и их понимание ии достигло более высокого уровня. все отрасли не будут чувствовать себя незнакомыми или отталкивающими это слово и будут иметь относительно позитивное отношение. следующий шаг — как мы можем установить отношения сотрудничества, подобные совместному творчеству, с нашими клиентами. в конце концов, эта отрасль чувствительна к данным. мы также надеемся, что по прошествии трех лет мы сможем помочь клиентам разработать некоторые практические сценарии реализации.
на самом деле, я думаю, что если рассматривать ценность более четко, то признание клиентов все еще будет довольно высоким, потому что, вообще говоря, будь то фармацевтические компании или только что упомянутая новая энергетика, все уделяют все больше и больше внимания инвестициям в инновации. мы также надеемся помочь в обновлении всей парадигмы научных исследований, включая инфраструктуру научных исследований и сценарии верхнего уровня. с помощью нашей платформы научных исследований мы можем соединить их и расширить возможности различных отраслей.