首页 > 原创知识 > 原创知识 > 微软野心再现:对Excel和谷歌Sheet下手了!

微软野心再现:对Excel和谷歌Sheet下手了!

发布时间:2024-07-17 22:58:03来源: 15210273549

微软团队在办公领域有着很强的“AI霸者”的野心。

近日,微软最新公布的研究论文,正在计划为 Excel、谷歌 Sheets 等电子表格应用程序,开发全新的 AI 大语言模型--SpreadsheetLLM。


研究人员表示现有电子表格应用程序具备丰富的功能,在布局和格式方面为用户提供大量的选项,因此传统 AI 大语言模型很难胜任电子表格处理场景。


而 SpreadsheetLLM 就是专门为电子表格应用而设计的 AI 模型,微软还研发了 SheetCompressor(压缩电子表格),让 SpreadsheetLLM 能够更好地理解、处理电子表格数据。

论文摘要部分,SpreadsheetLLM 模型主要由 3 个模块组成:基于结构锚的压缩、反向索引转换和数据格式感知聚合。


SpreadsheetLLM 大大提高了电子表格表检测任务的性能,在 GPT4 的情境学习设置中,比普通方法高出 25.6%;使用词元(token)的成本降低了 96%,并能提供更好的处理结果。

论文指出,这种电子表格LLM框架,显著提高了LLM解释和利用电子表格的方式。但还有很多改进的空间,比如这种方法没有利用电子表格格式的细节,如背景颜色和边框,因为它们需要太多的标记(这些元素通常包含有价值的上下文和视觉线索,可以进一步深化模型对电子表格数据的理解和处理)。

此外,虽然SheetCompressor有效地聚合了数据区域,但它目前没有对包含自然语言的单元格采用复杂的基于语义的压缩方法。例如,将“中国”、“美国”和“法国”等术语归入“国家”等统一标签下,不仅可以提高压缩比,还可以加深LLM对数据的语义理解。探索这些先进的语义压缩技术将是我们持续努力增强SpreadsheetLLM功能的一个关键重点。

目前还没有关于微软计划何时或是否向公众提供 SpreadsheetLLM 的消息

原创知识更多>>

想买全新大型SUV的别急!5月这6款好车马上将上市 广汽丰田用5.4万辆的4月总销量告诉你,合资车搞电动化,不是不能打,是以前没找对路子 不止于“开不坏”:解码一汽丰田产品布局的长期主义逻辑 探店上汽大众ID.ERA 9X:端走新势力饭碗,看看这款合资“9系”旗舰SUV终端的真实行情 五一黄金周,3款新车上市,分别是华境S正式上市、2026款丰田铂智3X焕\"芯\"登场、奥迪E7X 保时捷重大战略调整,35.8万的Macan再也回不来了? 弯道之王?领克10不再只是拼参数,而是把重点重新拉回到“驾驶”本 当改装从\"地下\"走向\"殿堂\":长城如何重写中国汽车文化叙事 北京汽车展览|从城市微出行到电动竞速,雪铁龙能否完成跨越升级? 穷人为省钱买新能源?百亿投资大佬:开了特斯拉,劳斯好久不开了 外观有面子的实在商用车 试驾体验鑫源汽车向上V6 捷豹旗下全新纯电旗舰 GT 车型 ——Type 00 量产版假想图正式曝光 补齐四大行业短板 第二代腾势D9重塑新能源MPV技术底色 销量略降、利润下滑,依然不降价、不国产,保时捷为什么这么硬气? 长城欧拉5北京车展上市混动/燃油双版本7.98万元起 魏牌7965台,哈弗60330台,长城汽车4月销量有啥看点? 上汽大通孙浩:MPV王者领跑全球,极致品质为核心 奇瑞商用车4月销量10384辆 同比增长40% 皮卡销量2300辆 北京国际车展|双线并进全面焕新,奥迪能否实现新一轮突破? 4月份,奇瑞新能源汽车销量100276台,同比增长63.8%;海外出口177573台,同比大增102.4% 对话宝马中国CTO:大圆柱真量产?宁德时代亿纬锂能怎么配? 新款别克世纪,依然是最懂高净值人群的超豪华MPV 虽然问道V9价格很亲民,但对于其市场表现,我为啥仍不看好? 35.98万起!第二代腾势D9全面升级,重塑高端MPV格局 上汽大众ID. ERA 9X爆单背后:信任比流量更珍贵 埃安N60用实打实的价格与产品力践行“Easy Life”的松弛感 smart 精灵6号18.99万元起预,精灵2号概念车首发亮相 新能源竞赛换挡时刻,谁是“央企新势力”压舱石? 埃安AION N60正式上市 限时焕新价10.68万起,全系标配激光雷达 长安凯程Robovan亮相:无人物流车终于从“概念”走向“赚钱”