소식

Excel용으로 특별히 디자인된 대형 모델이 나왔습니다!

2024-07-16

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

마이크로소프트는 지난 12일 새로운 대규모 언어 모델을 공개했으며, 엑셀, 구글 시트 등 스프레드시트 애플리케이션을 위한 새로운 AI 대형 언어 모델인 스프레드시트LLM을 개발할 계획이다.

마이크로소프트는 논문에서 새로운 AI 모델인 SpreadsheetLLM이 복잡한 스프레드시트 데이터를 이해하고 처리하는 데 널리 사용될 것이라고 지적했습니다.

SpreadsheetLLM은 스프레드시트 데이터 관리 및 분석을 혁신하여 보다 스마트하고 효율적인 사용자 상호 작용을 위한 기반을 마련할 수 있는 잠재력을 가지고 있습니다.

이로 인해 회계사와 데이터 분석가는 향후 직업 전망에 대해 걱정할 수 있습니다. 네티즌들은 소셜플랫폼 X에 "카렌의 직업이 곧 인공지능으로 대체될 것"이라고 농담을 했다.

'카렌은 곧 직장을 잃을지도 모릅니다'

연구원들은 현재 스프레드시트 애플리케이션이 기능이 풍부하고 사용자에게 레이아웃과 형식에 대한 많은 선택권을 제공하므로 기존 AI 대형 언어 모델이 스프레드시트 처리에 효과적이기 어렵다는 점을 지적했습니다. SpreadsheetLLM은 스프레드시트 애플리케이션용으로 특별히 설계된 AI 모델입니다.

Microsoft는 또한 SpreadsheetLLM이 스프레드시트 데이터를 더 잘 이해하고 처리할 수 있도록 SheetCompressor(압축 스프레드시트) 도구를 개발했습니다.


SpreadsheetLLM의 잠재적 응용 분야는 일상적인 데이터 분석 작업 자동화부터 스프레드시트 데이터를 기반으로 한 지능형 통찰력 및 권장 사항 제공에 이르기까지 광범위합니다. 예를 들어 SpreadsheetLLM을 사용하면 재무 보고서를 자동으로 생성하고, 데이터의 이상이나 추세를 식별하고, 고객에게 맞춤형 제품 또는 서비스 권장 사항을 제공하는 등의 작업을 수행할 수 있습니다.

결과적으로 SpreadsheetLLM은 기업이 데이터를 처리하는 방식을 혁신할 수 있는 잠재력을 가지고 있습니다.

한 사용자는 "SQL을 작성할 수 있는 LLM은 우리가 알고 있는 전체 데이터 엔지니어링 산업을 멸망시킬 것입니다."라고 주장했습니다.


또 다른 사람은 "SaaS가 큰 어려움에 처해 있습니다."라고 썼습니다.


“금융계에 큰 영향 미칠 것”


펜실베이니아 대학교 와튼 스쿨의 부교수인 Ethan Mollick은 트위터에 다음과 같이 썼습니다. “이것은 LLM이 곧 구조화된 스프레드시트 데이터와 구조화되지 않은 스프레드시트 데이터를 처리할 수 있게 될 것이라는 또 다른 신호입니다. 이로 인해 예측, 재무, 평가 등), 스프레드시트의 진실 소스를 보유하면 환상이 줄어드는 경향이 있습니다.”


SpreadsheetLLM은 어떻게 작동하나요?

SpreadsheetLLM은 스프레드시트 데이터를 LLM(대형 언어 모델)이 이해할 수 있는 형식으로 인코딩하여 작동하므로 LLM이 스프레드시트 데이터에 대해 추론하고 데이터에 대한 질문에 대답하며 자연어 프롬프트를 기반으로 새 스프레드시트를 생성할 수도 있습니다.

SpreadsheetLLM의 중심에는 스프레드시트 데이터를 효과적으로 압축하고 인코딩하여 LLM 처리를 더 쉽게 만드는 "SheetCompressor" 프레임워크가 있습니다. SheetCompressor는 세 가지 모듈로 구성됩니다.

▲ 구조적 앵커 기반 압축: LLM이 데이터 구조를 이해할 수 있도록 스프레드시트 전체에 "구조적 앵커"를 배치합니다.
▲역색인 번역: 스프레드시트를 보다 컴팩트한 형식으로 변환하고 중복 데이터를 제거합니다.
▲데이터 형식 인식 집계: 숫자 형식 및 데이터 유형을 기준으로 인접한 셀을 그룹화합니다.


SHEETCOMPRESSOR 프레임워크 그림(이미지: Microsoft)

Microsoft에 따르면 SpreadsheetLLM은 스프레드시트 감지 작업의 성능을 크게 향상시켜 GPT4의 컨텍스트 학습 설정에서 일반 방법보다 25.6% 더 나은 성능을 발휘하고 토큰 사용 비용을 96% 절감하며 더 나은 처리 결과를 제공합니다.

현재 Microsoft는 SpreadsheetLLM이 언제 대중에게 출시될지 발표하지 않았습니다. 이 논문에서는 모델에 여전히 복잡하거나 고도로 구조화된 데이터를 이해하는 능력이 제한되어 있는 등 몇 가지 제한 사항이 있음을 지적합니다. SheetCompressor는 현재 자연어 등이 포함된 셀을 압축할 수 없습니다.