GdiSDK 0.3.2 发布|跨Pipeline数据互通,岩土与数据分析再升级

发布时间:2026-05-06

一句话导读

GdiSDK 0.3.2 带来「水土腐蚀性分析」专业模块、跨Pipeline数据互通能力,以及球面K均值聚类分析和表格描述统计新工具;同时对 Markdown 导出、CSV 读取、Docx 转 Markdown 等模块做了升级优化。

GdiSDK 是什么?

GdiSDK(Geo Data Intelligence Software Development Kit)是面向地学与环境相关领域的 Python 开发包,聚焦数据处理、智能分析与 GDIM 平台二次开发

可以把它的能力理解为三层:

  • 标准化数据结构(dataclass):统一表格、结果、地质等业务对象;
  • 即用型模块(modules):读数、清洗、转换、统计、绘图、报告等;
  • 工作流框架(pipeline):像搭积木一样把模块串成可复用、可部署的应用。

一句话:用「模块 + 工作流」把专业问题做成可上传 GDIM、团队可维护的数据应用,而不是从零造一整套系统。

0.3.2 亮点速览

平台能力:Pipeline 与 GDIM「数据落库 + 跨应用读取」

  • PipeLine 新增 save_data_to_db 方法:Pipeline 在 GDIM 上运行时,可将指定出端口数据、Pipeline 属性或模块属性写入 GDIM 数据库,便于 跨 Pipeline 共享与交换数据
  • 新增 GdimAppDataReader 模块:读取其他应用通过 save_data_to_db 方法存入 GDIM 数据库的数据。
  • 新增 GdimAppDataSelector 模块:从 GdimAppDataReader 模块输出中按需选取数据。

这三项组合起来,意味着 多应用、多流程之间的数据协作路径更清晰,更适合复杂项目里的分工与复用。例如,我们可以在自动报告 Pipeline 应用中读取水腐蚀性分析 Pipeline 应用的计算结果。

专业模块:水土腐蚀性

  • 新增 WaterSoilCorrosion 模块:按岩土勘察规范计算 水土腐蚀性,直接服务于勘察报告与合规性分析场景。

数据分析:方向/高维特征的球面聚类 + 表格描述统计

  • 新增 SphericalKMeans 模块:球面 K 均值聚类,按余弦相似度划簇,适用于方向向量或高维特征(例如 岩石节理聚类 等)。
  • 新增 TableDescribe:基于 pandas DataFramedescribe 方法做 描述性统计,可选列与统计指标,便于快速摸底数据分布。

模块优化(节选

  • TextWriter 模块:支持直接接入 ResultModel 并打印数据。
  • TableToMarkdown / TablesToMarkdown 模块:新增 precision 控制数字输出精度;新增 latex_math 以用于前端 LaTeX 渲染;主子表合并标题可选 combined / main / sub 三种模式。
  • CsvReader 模块:新增 check_units,读取表结构时可选择是否校验单位表示。
  • DocxToMarkdown 模块:新增 images_dir_relative_to_inputrelative_image_link,更灵活地控制图片目录与 Markdown 中链接为绝对或相对路径。

问题修复

  • GdimTableWriter 模块:写入时在 name 匹配未果时,补充与 GDIM 字段 title 的匹配逻辑。
  • PromptTemplate 模块:修复某些情况下 重复执行 的问题。

应用开发

基于 GdiSDK 0.3.2,我们在 GDIM 上开发了内置应用 水腐蚀性分析 ,支持基于「水化学分析表」按照岩土工程勘察规范进行水腐蚀性分析,包括:

  • 水对钢筋混凝土中的钢筋腐蚀性评价
  • 按环境类型水对混凝土结构的腐蚀性评价
  • 按地层渗透性水对混凝土结构的腐蚀性评价

水腐蚀性分析应用界面

升级须知(兼容性)

  • MarkdownSectionFilter:已 移除用于输出 markdown 文件的端口;若需写文件,请 接入 TextWriter
  • MarkdownSectionFilterOutputSingleResult 端口改为 OutputResultModel

从旧流程迁移时,请对照上述两点调整连线与下游模块类型。

若本地已用 git 克隆 gdisdkcdgdisdk 目录下,运行以下命令 git pull origin master 更新即可。若使用压缩包安装,则直接访问代码仓库下载最新代码覆盖本地 gdisdk 文件夹即可。

适合谁关注这次更新?

  • 已在 GDIM 上跑 Pipeline、希望 流程之间沉淀数据、互相读取 的团队;
  • 勘察与岩土方向需要 水土腐蚀性 等规范化计算的工程师;
  • 做节理/方向数据或高维特征聚类、以及 批量表格描述统计 的分析人员;
  • 重度使用 Markdown 报告、Word 转 Markdown、CSV 读入的朋友们——本次有不少「用起来更顺手」的细节。

了解更多

  • 开发文档也已同步更新,扫码查看 !
  • 扫码观看GdiSDK官方入门课程(第一期) !

欢迎升级体验,也欢迎在代码仓库 Issues 里告诉我们你的场景与建议。