中国科学院空天信息创新研究院近日宣布,研究员付琨团队与鹏城实验室联合发布了全球首个百亿参数级空天一体遥感解译基础模型——“空天·灵眸”3.0版。这一基础模型是我国首个面向多模态遥感数据生成式基础模型,也是专为遥感领域打造的行业基础模型之一。
据介绍,“空天·灵眸”3.0版的内核工作架构是基于热传导原理自主研发的一套小而精的架构,通过模拟热能扩散过程来实现场景目标间视觉语义传播建模,从而有效突破了遥感模型推理的性能和速度瓶颈,将计算速度提升了2.4倍以上。
研究员孙显解释道,这一架构的实现使得模型数据学习和推理速度大幅提升。以往训练1000万张数据样本需要300多块显卡,而现在只需1/3的数量,处理速度也提升了约2.4倍。
“空天·灵眸”3.0版在各类任务中表现出色,涵盖了场景分类、目标检测、语义分割、变化检测等6大类任务,在23个国际基准数据集上测试,相较于主流模型,精度平均提升4%至10%,并已在多个行业部署试运行,为空地一体化应用提供了高效解决方案。
未来,研究团队将继续推动“空天·灵眸”3.0版在国民经济各个行业的落地应用。