Еженедельный отчет AI | Большая модель не может определить, какая версия больше: 9.11 или 9.9. OpenAI выпускает облегченную модель GPT-4o mini

Еженедельный отчет AI | Большая модель не может определить, какая версия больше: 9.11 или 9.9. OpenAI выпускает облегченную модель GPT-4o mini;

2024-07-21

Большая модель не может определить, какая из них больше, 9,11 или 9,9.

Математическая задача, которая сложна для учеников начальной школы, поставила в тупик многие крупные модели ИИ в стране и за рубежом. Что больше, 9,11 или 9,9? Что касается этого вопроса, 17 июля репортеры China Business News протестировали 12 крупных моделей, среди которых Alibaba Tongyi Qianwen, Baidu Wenxinyyan, Minimax и Tencent Yuanbao ответили правильно, но ChatGPT-4o, Byte Doubao, Dark of the Moon Mian kimi, Zhipu Qingyan , Zero One All Things Knowledge, Step Stars Yuewen, Baichuan Zhibai Xiaoying, Shangtang Discovery, все получили неправильные ответы, и неправильные пути разные. Большинство крупных моделей ошибочно сравнивают числа после десятичной точки в своих вопросах и ответах, думая, что 9,11 больше, чем 9,9.

Комментарий: За ошибками стоит давняя проблема слабых математических способностей больших моделей. Некоторые инсайдеры отрасли считают, что модели генеративного языка созданы для того, чтобы больше походить на буквальное мышление, чем на числовое. Однако целевое обучение корпуса может постепенно улучшить способность модели отвечать на научные вопросы в будущем.

OpenAI выпускает облегченную модель GPT-4o mini, стоимость модели за два года снизилась на 99%

18 июля по местному времени компания OpenAI выпустила новую легкую большую модель GPT-4o mini. По имеющимся данным, GPT-4o mini с этого момента заменит GPT-3.5 Turbo в роботе вопросов и ответов ChatGPT, а корпоративные пользователи смогут получить доступ к GPT-4o mini со следующей недели. «Мы ожидаем, что GPT-4o mini расширит возможности применения искусственного интеллекта и сделает искусственный интеллект более доступным». Согласно статье на официальном сайте OpenAI, входная цена GPT-4o mini составляет 15 центов (0,15 доллара США) за миллион». токены (элементы слов), выходная цена составляет 60 центов (0,6 доллара США) за миллион токенов, что на 60 % дешевле, чем у GPT-3.5 Turbo. OpenAI заявила, что компания также продолжит снижать затраты, одновременно улучшая производительность модели. По сравнению с моделью text-davinci-003 2022 года стоимость GPT-4o mini снизилась на 99%.

Комментарий: Хотя OpenAI не выпустила модель GPT-5 следующего поколения, она все еще обновляет модель на основе существующих возможностей и продолжает снижать стоимость больших моделей. Другие крупные производители моделей также продвигают в этом году легкие модели. В мае этого года Google выпустила облегченную модель Gemini 1.5 Flash. Серия Claude 3, выпущенная Anthropic в марте, включает в себя облегченную версию Claude 3 Haiku. В этом году большие модели с меньшими параметрами продемонстрировали большой потенциал. Обучение может повысить производительность за счет увеличения объема данных, а не увеличения количества параметров.

Шесть крупных производителей моделей отреагировали на проблему плохих цифровых возможностей крупных моделей

Репортеры China Business News недавно связались и взяли интервью у ряда крупных производителей моделей, в том числе Alibaba Tongyi, Tencent Hunyuan Team, Dark Side of the Moon Kimi, MiniMax Conch, Xueersi Jiuzhang, NetEase Youdao и т. д. В ходе интервью они ответили на важные вопросы. проблема плохой математической модели. Ван Сяомин, менеджер по продукции лаборатории Alibaba Tongyi, сказал, что подобные проблемы являются обычными проблемами математических расчетов и логических рассуждений, а также случаями, которые разработчики часто проверяют в процессе обучения и использования моделей. Большие модели имеют «правильные ответы» или «. неправильные ответы». «На самом деле это вопрос вероятности. Команда Tencent Hunyuan заявила, что большая модель сама по себе является вероятностной моделью, и ей трудно стабильно решать такие численные задачи расчета или сравнения при различных обстоятельствах.

Комментарий: «Какой из них больше, 9,11 или 9,9?» не является трудным для человека, но для больших моделей на этот вопрос не всегда легко ответить. Судя по исчерпывающим ответам, мнения, упомянутые соответствующими лицами, ответственными за производителей крупных моделей, включают в себя то, что большие модели еще не полностью контролируют правила расчета или сравнения чисел. В то же время исследование человеком возможностей больших моделей является предметом обсуждения. на очень ранней стадии. Многие инсайдеры отрасли также считают, что в будущем необходимо повысить уровень интеллекта базовой базовой модели и устранить подобные ошибки на уровне обучающих данных и внешних инструментов. Окончательным решением может стать улучшение возможностей следующего поколения. модель. Обнаружение таких случаев поможет производителям лучше понять границы возможностей больших моделей.

Закон об искусственном интеллекте вступит в силу на всей территории ЕС 1 августа.

Первый в мире Закон об искусственном интеллекте (EU AI Act), изданный Европейским Союзом, вступит в силу на всей территории ЕС 1 августа. Это также наиболее полный законопроект, направленный на надзор за искусственным интеллектом, из опубликованных на данный момент в мире. Закон ЕС об искусственном интеллекте также закладывает основу для глобального регулирования искусственного интеллекта, стремясь достичь того же «брюссельского эффекта», что и Общий регламент по защите данных (GDPR). Согласно последнему законопроекту, компании, нарушающие правила, будут подвергнуты административным штрафам в размере до 35 миллионов евро или 7% от максимального годового дохода, в зависимости от того, какая сумма больше.

Комментарий: ЕС всегда был в авангарде регулирования технологий. Закон ЕС об искусственном интеллекте является первым в мире всеобъемлющим нормативным актом в области искусственного интеллекта, демонстрирующим дальновидность и лидерство ЕС в области регулирования технологий. Однако правила также увеличат операционные расходы предприятий Ю Юньтинг, партнер юридической фирмы Shanghai Dabang, сказал, что после введения GDPR затраты предприятий, особенно затраты на соблюдение требований, значительно возросли. Ожидается, что Закон об искусственном интеллекте будет таким же, а это означает, что компании должны инвестировать в новые правила и назначать специальный персонал для изучения политик соответствия. Кроме того, обработка уведомлений о нарушениях, системы публичного раскрытия информации и т. д. также увеличат расходы.

Оглашаются баллы семи основных моделей после участия в «Вступительном экзамене в колледж»: можно сдать только два естественных предмета.

В июне ранее OpenCompass, система оценки Sinan при Шанхайской лаборатории искусственного интеллекта, опубликовала первые полные результаты оценки вступительного экзамена в колледж по искусственному интеллекту, которые показали, что кандидаты в области искусственного интеллекта могут набрать максимум 303 балла по трем предметам, помимо язык и математику, и провалил всю математику. 17 июля OpenCompass опубликовала оценку, которая расширила круг предметов. Команда протестировала 7 крупных моделей ИИ по всем 9 предметам вступительного экзамена в колледж, чтобы их можно было сравнить с результатами вступительных экзаменов в колледж.

Если AI сдаст вступительные экзамены в колледж, в какой университет он сможет поступить? Тест OpenCompass показал, что если большая модель сдает экзамен по гуманитарным наукам, лучший результат может быть «допущен» к одной книге, но если она сдает экзамен по естественным наукам, ее можно «допустить» максимум к двум книгам (на основе рейтинг провинции Хэнань, где в этом году проводится наибольшее количество вступительных экзаменов в колледж) для справки).

Комментарий: Судя по оценкам учителей, выставляющих оценки, по сравнению с кандидатами-людьми, текущая большая модель все еще имеет серьезные ограничения. После завершения выставления оценок преподаватели сошлись во мнении, что хотя большая модель и хорошо показала себя в освоении базовых знаний, она все же неудовлетворительна с точки зрения логического рассуждения и гибкого применения знаний. В частности, при ответе на субъективные вопросы большие модели часто не могут до конца понять суть вопроса и не понимают направления местоимений, что приводит к неверным ответам при ответе на математические вопросы, процесс решения задач является механическим и плохо логичным. часто возникают проблемы с пространственной логикой. Противоречивые выводы.

Ли Фейфей вынашивает «единорога», оценка World Labs превышает 1 миллиард долларов США

17 июля стало известно, что стоимость World Labs, стартапа в области «пространственного интеллекта», основанного известным китайским ученым-компьютерщиком Ли Фейфеем, превысила 1 миллиард долларов США. Стартап в основном использует технологию обработки визуальных данных, подобную человеческой, чтобы снабдить ИИ расширенными возможностями рассуждения.

С момента своего создания в апреле этого года World Labs провела два раунда финансирования, в число инвесторов входили ведущий технологический инвестор Андриссен Горовиц и фонд искусственного интеллекта Radical Ventures. Предполагается, что последний раунд финансирования компании может достичь примерно 100 миллионов долларов США. Ли Фейфей, Andreessen Horowitz и Radical Ventures не ответили на запросы о комментариях.

Комментарий: Предпринимательские тенденции Ли Фейфэя, как легендарной личности, также привлекли большое внимание со стороны отрасли. Ли Фейфей стал штатным профессором кафедры компьютерных наук в Стэнфорде в возрасте 33 лет, академиком Национальной инженерной академии в возрасте 44 лет и в настоящее время является директором Стэнфордского человеко-ориентированного института искусственного интеллекта (HAI). ). ImageNet, эталонное достижение в области компьютерного зрения, также была разработана ею. У него много учеников, таких как Андрей Карпати, работавший в OpenAI и Tesla, и Джим Фан, который сейчас работает в Nvidia и т. д. Они также являются влиятельными фигурами в области искусственного интеллекта.

Гиганты-производители чипов искусственного интеллекта и облачных технологий «раскупают» мировые компании, занимающиеся искусственным интеллектом

Согласно статистическим данным Crunchbase, компании, занимающейся базами данных корпоративного уровня, финансирование глобальных стартапов в области искусственного интеллекта в первой половине этого года выросло на 24% в годовом исчислении до 35,6 млрд долларов США. Второй квартал стал кварталом с наибольшим количеством. Инвестиции в искусственный интеллект в последние годы. Согласно публичной статистике China Business News, в этом году Nvidia инвестировала или приобрела не менее 16 компаний, связанных с искусственным интеллектом, и большая часть раундов финансирования составила более 100 миллионов долларов США. После того, как Microsoft инвестировала в OpenAI, она также приняла участие в нескольких раундах финансирования на общую сумму более 100 миллионов долларов США в этом году. Google широко развернул экосистему искусственного интеллекта с помощью своих многочисленных инвестиционных платформ и принял участие не менее чем в 31 раунде финансирования. В этом раунде инвестиционного бума в области искусственного интеллекта активными фигурами являются AMD, Amazon, SoftBank и т. д.

Комментарий: Популярность ИИ интуитивно отражается на инвестициях. Инвестиционные стили и предпочтения крупных гигантов не совсем одинаковы. Стоит задуматься о том, являются ли они производителями, основным бизнесом которых является полупроводниковое оборудование, такое как Nvidia и AMD, или производителями облачных технологий, такими как Microsoft, Google и Amazon. надеюсь инвестировать в некоторые крупные компании. Поставщики моделей и поставщики облачных технологий более охотно связывают крупные стартапы с моделями. Наблюдая за крупнейшими раундами финансирования в отрасли в этом году, мы можем обнаружить, что основными горячими точками являются базовые большие модели, автономное вождение, данные искусственного интеллекта и человекоподобные роботы.

Великобритания начала антимонопольное расследование в отношении сделки Microsoft и Inflection AI

Британский антимонопольный регулятор, Управление по конкуренции и рынкам (CMA), недавно заявил, что начал официальное антимонопольное расследование сделки Microsoft-Inflection AI. В марте этого года Microsoft согласилась выплатить 650 миллионов долларов стартапу Inflection AI, занимающемуся искусственным интеллектом, за лицензию на его программное обеспечение для искусственного интеллекта. Кроме того, Microsoft объявила о приеме на работу сооснователей Inflection AI Мустафы Сулеймана и Карена Симоняна, а также большинства сотрудников компании.

Комментарий: Оценка Inflection AI составляет примерно 4 миллиарда долларов США. Инсайдеры отрасли говорят, что поведение Microsoft эквивалентно аннексии Inflection AI по низкой цене. В отличие от приобретения, Inflection AI по-прежнему сохраняет свою запатентованную технологию. Помимо Великобритании, в прошлом месяце появились сообщения о том, что Федеральная торговая комиссия США (FTC) также рассматривает сделку. По имеющимся данным, Федеральная торговая комиссия направила повестки в суд Microsoft и Inflection AI, запросив соответствующие документы за последние два года.

Компания по производству роботов-гуманоидов Zhuji Dynamics завершает финансирование серии А

15 июля China Business News узнало, что стартап-гуманоидный робот Zhuji Dynamics завершил финансирование серии A под руководством China Merchants Venture Capital, инвестиционной платформы прямых инвестиций SAIC Group Shangqi Capital, а также старых акционеров Fengrui Capital, Oasis Capital и Mingshi Capital. участвовала в инвестициях, сумма финансирования не разглашается. Ранее Alibaba также инвестировала в Zhuji Dynamics. Компания Zhuji Dynamics была основана в 2022 году. Основатель Чжан Вэй — штатный профессор Южного университета науки и технологий. Продукция Zhuji Dynamics включает полноразмерных гуманоидных роботов, четвероногих роботов, двуногих роботов и сопутствующие решения.

Комментарий: Многие компании, производящие роботов-гуманоидов, все еще находятся в процессе финансирования. В этом году на треке роботов-гуманоидов постоянно проводились мероприятия по финансированию. В январе этого года Xingdong Era объявила о завершении ангельского раунда финансирования на сумму более 100 миллионов юаней. Впоследствии Yushu Technology объявила о завершении раунда финансирования B2 на сумму 1 миллиард юаней, Kepler Exploration Robot завершила ангельский раунд финансирования, а Galaxy Universal Robots завершила ангельский раунд. раунд финансирования в размере 700 миллионов юаней. Интернет-гиганты Tencent, Baidu и Alibaba инвестировали в UBTECH, Zhiyuan Robot и Zhuji Dynamics соответственно, а Meituan инвестировала в Galaxy Universal Robots и Yushu Robot. После того, как компании-гуманоидные роботы собрали средства, следующим шагом станет внедрение массового производства.

NVIDIA и Mistral AI выпускают крупную модель Mistral-NeMo

Согласно новостям от 19 июля, NVIDIA и французский стартап Mistral AI выпустили большую языковую модель искусственного интеллекта Mistral-NeMo, которая имеет 12 миллиардов параметров и контекстное окно (максимальное количество токенов, которые модель искусственного интеллекта может обрабатывать одновременно). 128 000 токенов. Крупная модель искусственного интеллекта Mistral-NeMo в основном ориентирована на корпоративные среды и реализует решения искусственного интеллекта без использования большого количества облачных ресурсов.

Комментарий: В этом году Mistral AI завершила финансирование на сумму 600 миллионов евро, а в список инвесторов входят Nvidia и Samsung. Microsoft также ранее объявила об инвестициях в размере 15 миллионов евро в Mistral AI, которые будут конвертированы в акционерный капитал в рамках следующего раунда финансирования Mistral AI. Mistral AI заключила партнерское соглашение с Nvidia для запуска крупных моделей, а также компания будет балансировать и стремиться к сотрудничеству между крупными гигантами. Nvidia все активнее участвует в экосистеме искусственного интеллекта. Ранее она открыла исходный код модели серии Nemotron-4 340B, чтобы разработчики могли использовать ее для генерации синтетических данных для обучения больших языковых моделей.

Новости

Еженедельный отчет AI | Большая модель не может определить, какая версия больше: 9.11 или 9.9. OpenAI выпускает облегченную модель GPT-4o mini;

Введение

моя контактная информация