微软研发“超级大脑“:Excel智商提高25.6%!

微软研发"超级大脑":Excel智商提高25.6%!

前言

QQ截图20240716144419.png

微软

就在7月16日,一项来自微软的最新研究引发了广泛关注——SPREADSHEETLLM。这个专为Excel等电子表格应用而生的AI大脑,号称能让Excel更加智能化。据悉,它不仅性能大幅提升,词元使用量也显著降低。那么,这个"超级大脑"到底有何过人之处?它又将如何重塑我们使用Excel的方式?让我们一探究竟。

SPREADSHEETLLM的核心创新

QQ截图20240716144257.png

新模型SPREADSHEETLLM

SPREADSHEETLLM的奥秘,主要在于它的编码框架SheetCompressor。这个由结构锚点压缩、反向索引转换和数据格式感知聚合三大模块组成的框架,是其性能飞跃的关键。

结构锚点压缩技术巧妙地识别并提取电子表格的关键结构信息,生成精简版的"骨架"表格,大幅减少了需处理的数据量。反向索引转换则采用优化的JSON格式,将具有相同文本的单元格地址合并,显著提高了词元利用率。而数据格式感知聚合通过提取并聚类具有相似格式的数值单元格,简化了模型对数据分布的理解。

SPREADSHEETLLM的性能提升

得益于这些创新,SPREADSHEETLLM在各项指标上都交出了亮眼的成绩单。实验显示,它将电子表格问答的准确率提高了22%,整体性能较普通方法高出25.6%。更令人惊喜的是,它仅用了4%的词元就达成了如此表现,这意味着模型可以更高效地理解和处理复杂的电子表格。

在GPT-4的情境学习设置中,SPREADSHEETLLM同样表现出色。微调后的模型在电子表格表格检测和问答任务上的F1值和准确度,分别提高了79%和6%,充分证明了其强大的泛化能力。

SPREADSHEETLLM的工作原理

QQ截图20240716144314.png

SPREADSHEETLLM框架图

首先,SheetCompressor的三大模块各司其职,通力合作。结构锚点压缩负责提纯表格的关键结构;反向索引转换优化词元使用;数据格式感知聚合简化数值数据的理解。它们环环相扣,逐步提炼并优化电子表格的表示。

数据在这个流程中的演变颇为有趣。原始的杂乱无章的电子表格,经过一系列"修剪"和"打包",最终呈现为简洁明了的形式,方便SPREADSHEETLLM高效地"理解"和处理。

值得一提的是,微软还提出了Chain of Spreadsheet(CoS)框架,以拓展SPREADSHEETLLM的应用场景。它先识别与任务查询相关的表格内容,再分解任务生成准确回答。实验表明,CoS大大提高了复杂电子表格的处理效率和回答的精准度。

总结

SPREADSHEETLLM的创新编码框架和出色的性能表现,为Excel带来了更加强大的系统,能更好的协助用户快速办公,在技术方面来说可谓是大突破。

厚德云是一款专业的AI算力云平台,为用户提供稳定、可靠、易用、省钱的 GPU 算力解决方案。海量 GPU 算力资源租用,就在厚德云。

相关推荐

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-16 17:48:01       66 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-16 17:48:01       70 阅读
  3. 在Django里面运行非项目文件

    2024-07-16 17:48:01       57 阅读
  4. Python语言-面向对象

    2024-07-16 17:48:01       68 阅读

热门阅读

  1. 艺术类硕士在核心期刊上发表论文真的很难么?

    2024-07-16 17:48:01       23 阅读
  2. 靖江美食元宇宙

    2024-07-16 17:48:01       18 阅读
  3. 1213:八皇后问题

    2024-07-16 17:48:01       19 阅读
  4. py每日spider案例之影视搜索篇

    2024-07-16 17:48:01       19 阅读
  5. Linux内核 -- 用户态coredump处理之do_coredump函数

    2024-07-16 17:48:01       24 阅读
  6. 什么是MATLAB许可证协议书

    2024-07-16 17:48:01       22 阅读
  7. InnoDB 存储结构与索引页结构

    2024-07-16 17:48:01       21 阅读
  8. C++ 入门13:异常处理

    2024-07-16 17:48:01       17 阅读
  9. Nim 游戏

    2024-07-16 17:48:01       24 阅读