#人工智能# 大语言模型(LLMs)被广泛应用到地理空间人工智能(GeoAI)相关科研与行业应用中,但它们是否能够胜任复杂的地理空间分析任务?GIS 工作流往往包含多个子任务、多步操作,从空间数据加载、空间计算到结果可视化与制图。威斯康星大学麦迪逊分校地理空间数据科学实验室(GeoDS Lab)联合俄亥俄州立大学自然语言处理团队发布了多个科学任务工作流基准测试集,包括ScienceAgentBench (ICLR’25)、AutoSDT-5K (EMNLP’25)、GeoAnalystBench (TGIS ’25)等。GeoAnalystBench是一个覆盖 50 个真实 GIS 空间分析工作流的基准数据集,专门用于评估各种 LLMs 在空间分析工作流与代码生成上的能力。 http://t.cn/AXwhNy7j http://t.cn/A6V71c45
发布于 美国
