HyperAI超神经
Back to Headlines

英国国家测绘局CTO分享:构建高效AI基础模型的五大策略

4 days ago

Manish Jethwa,英国国家测绘局(Ordnance Survey,简称OS)的首席技术官(CTO),分享了他们如何结合多年积累的机器学习(ML)经验和最新的生成式人工智能技术来优化和分发海量地理空间数据的宝贵经验。通过使用基础模型(Foundation Models)作为起点,OS能够更高效地构建针对性的应用程序,这些模型不仅有助于降低训练成本,还能在多个领域反复应用。 确立强大的应用场景:Jethwa强调,OS正在开发基础模型以从内部高精度数据中提取环境特征进行分析,这种方法可以避免使用大型技术组织基于商业数据训练的模型。OS的基础模型可以从零开始逐步建立,通过不断细化标签数据集,实现更精准的目标识别。Jethwa认为,这些基础模型可以在多种应用场景中复用,比如分析屋顶材料、绿色空间或生物多样性,只需在最后进行微调。 采用有目的的训练方法:为了在构建基础模型时控制成本,OS采取了一种渐进式的方法,即先用少量的数据训练一个小规模的模型,再逐渐增加标签数据的规模。这种方法不仅减少了资源浪费,还提高了模型的训练效率。Jethwa指出,尽管OS的模型规模较小,但其性能已经超过了市场上其他大型供应商的通用模型。 利用其他大型语言模型(LLM)进行微调:除了自行开发的基础模型外,OS还积极探索如何与其他知名的技术公司合作,利用成熟的大型语言模型进行微调。OS使用的是微软的Azure机器学习平台,同时也在考察与IBM和其他供应商的合作机会。Jethwa认为,这种合作模式能够更好地整合外部资源,解决特定领域的数据挑战,同时保持成本可控。 考虑商业化可能性:随着基础模型的不断成熟,OS也在考虑未来是否将这些技术授权给其他组织或直接销售。然而,由于这些模型的大部分数据来源于政府所有的版权材料,OS需要谨慎处理商业化的问题。Jethwa表示,OS希望保护好自己的数据资产,同时也能够为英国纳税人创造更多价值。这个过程中需要平衡好数据共享与保护之间的关系。 着眼未来:Jethwa展望了OS在未来十年内AI应用的发展方向,认为生成式AI将极大地简化用户获取深度数据的过程。他描述了一个未来的场景,即用户可以通过地图界面与AI对话,例如“我感兴趣的是这个区域”,然后AI会询问具体的兴趣点,如学校类型等,通过对话逐步精确搜索结果。Jethwa强调,要实现这一愿景,关键在于利用API和可信数据源,为用户提供确凿的答案,而不是概率性的猜测。OS希望在回答用户提问时,能够直接查询到准确的数据,并将其呈现出来。 业内人士对此给予了高度评价,认为OS的做法展示了如何将传统的行业数据与新兴的AI技术有效结合,为地理空间数据分析带来了新的突破。OS作为英国的国家测绘机构,拥有超过百年历史,积累了大量高精度的空间数据,这为其在AI领域的探索提供了坚实的基础。通过这种方式,OS不仅能够在内部提高工作效率,还有可能在未来为更广泛的行业提供先进的数据解决方案。

Related Links