Новости

Будет ли артефакт на стороне B?Microsoft выпускает SpreadsheetLLM, который может значительно улучшить возможности искусственного интеллекта в Excel

2024-07-16

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

12 числа Microsoft выпустила новую крупномасштабную языковую модель и планирует разработать новую модель большого языка искусственного интеллекта — SpreadsheetLLM для приложений с электронными таблицами, таких как Excel и Google Sheets.

В документе Microsoft отметила, что SpreadsheetLLM, как новая модель искусственного интеллекта, будет широко использоваться для понимания и обработки сложных данных электронных таблиц.

SpreadsheetLLM может трансформировать управление и анализ данных электронных таблиц, открывая путь к более разумному и эффективному взаимодействию с пользователем.

Это может заставить бухгалтеров и аналитиков данных беспокоиться о своих будущих перспективах трудоустройства. Пользователи сети пошутили в социальной платформе X, что «работу Карен скоро заменит искусственный интеллект».

«Карен скоро может остаться без работы»

Исследователи отметили, что современные приложения для работы с электронными таблицами обладают богатым набором функций и предоставляют пользователям большое количество вариантов макета и формата, что затрудняет эффективность традиционных моделей большого языка ИИ при обработке электронных таблиц. SpreadsheetLLM — это модель искусственного интеллекта, специально разработанная для приложений с электронными таблицами.

Microsoft также разработала инструмент SheetCompressor (сжатая электронная таблица), который помогает SpreadsheetLLM лучше понимать и обрабатывать данные электронных таблиц.


Исследователи говорят, что потенциальные применения SpreadsheetLLM варьируются от автоматизации рутинных задач анализа данных до предоставления интеллектуальных идей и рекомендаций на основе данных электронных таблиц. Например, SpreadsheetLLM можно использовать для автоматического создания финансовых отчетов, выявления аномалий или тенденций в данных, предоставления клиентам персонализированных рекомендаций по продуктам или услугам и многого другого.

В результате SpreadsheetLLM может произвести революцию в способах обработки данных компаниями.

Один пользователь заявил: «LLM, умеющий писать SQL, убьет всю индустрию обработки данных, какой мы ее знаем».


Другой написал: «У SaaS большие проблемы».


«Это окажет огромное влияние на финансовое сообщество»


Итан Моллик, доцент Уортонской школы Пенсильванского университета, написал в Твиттере: «Это еще один признак того, что LLM скоро сможет обрабатывать структурированные и неструктурированные данные электронных таблиц. Это откроет множество вариантов использования (прогнозирование, финансы, оценки и т. д.), а наличие источника истины в электронной таблице уменьшает иллюзии».


Как работает SpreadsheetLLM?

SpreadsheetLLM работает путем кодирования данных электронных таблиц в формат, который могут понимать большие языковые модели (LLM), что позволяет LLM рассуждать о данных электронных таблиц, отвечать на вопросы о данных и даже создавать новые электронные таблицы на основе подсказок на естественном языке.

В основе SpreadsheetLLM лежит платформа SheetCompressor, которая эффективно сжимает и кодирует данные электронных таблиц, упрощая их обработку с помощью LLM. SheetCompressor состоит из трех модулей:

▲ Сжатие на основе структурных привязок: разместите «структурные привязки» по всей электронной таблице, чтобы помочь LLM понять структуру данных.
▲Инверсный индексный перевод: конвертируйте электронные таблицы в более компактный формат и устраняйте избыточные данные.
▲Агрегация с учетом формата данных: группируйте соседние ячейки на основе числового формата и типа данных.


Иллюстрация инфраструктуры SHEETCOMPRESSOR (Изображение: Microsoft)

По данным Microsoft, SpreadsheetLLM значительно повышает производительность задач обнаружения электронных таблиц, превосходя обычные методы на 25,6% в настройке контекстного обучения GPT4, снижая стоимость использования токенов на 96% и обеспечивая лучший результат обработки.

В настоящее время Microsoft не объявила, когда SpreadsheetLLM будет опубликована. В документе отмечается, что модель все еще имеет некоторые ограничения, например, ее способность понимать сложные или высокоструктурированные данные все еще ограничена; SheetCompressor в настоящее время не может сжимать ячейки, содержащие естественный язык, и т. д.