HyperAI超神经

过去一年，AI 与科学研究的关系正在发生一场深刻而安静的转变。从实验设计、数据建模到理论推演，人工智能正以前所未有的速度渗透进科研流程的核心环节，催生出一批难以用传统范式解释的突破性成果。 2025 年，AI for Science 不再只是零散的技术应用，而是逐渐演化为一条清晰、系统、可复用的科研创新路径。

与早期「AI 辅助科研」的尝试不同，2025 年的一个显著变化在于：AI 不再只是工具，而是正在成为科研范式的一部分。越来越多的研究工作，从一开始就围绕「如何让模型参与科学发现」展开设计，这也催生了大量兼具方法创新与科学价值的高质量成果。

HyperAI 超神经长期关注 AI4S 领域的进展与突破，通过系统解读前沿论文的方式，记录这一浪潮中的关键节点。一方面，我们希望将最新的研究成果与方法论进行结构化、普适化的整理，降低不同领域读者的理解门槛；另一方面，也希望通过持续输出，推动更多研究者、工程师与机构，真正认识到 AI 对科研生产力的深远影响。

值此岁末年初，正是回顾与展望的关键时刻。本文对「HyperAI 超神经」在 2025 年解读过的 AI for Science 相关前沿论文进行了系统梳理与分类汇总，覆盖生物医药、医疗健康、材料化学、气象研究、天文学等多个方向，方便不同背景的读者快速检索与回顾。

查看更多前沿论文：

https://hyper.ai/cn/papers

查看研究相关数据集：

https://hyper.ai/cn/datasets

AI+ 生物医药

新的生成式模型及新评测基准，重塑无序蛋白集合预测能力

Advancing Protein Ensemble Predictions Across the Order-Disorder Continuum

*来源：bioRxiv

*作者：Peptone 公司、英伟达公司、麻省理工学院等组成的联合团队

*解读：重塑无序蛋白集合预测能力，英伟达/MIT/牛津大学/哥本哈根大学/Peptone 等发布生成式模型及新评测基准

*论文：

https://www.biorxiv.org/content/10.1101/2025.10.18.680935v1

首个经人类皮层数据验证的神经元建模框架 NOBLE，超越传统 4200 倍速

NOBLE – Neural Operator with Biologically-informed Latent Embeddings to Capture Experimental Variability in Biological Neuron Models

*来源：NeurIPS 2025

*作者：苏黎世联邦理工学院、加州理工学院与阿尔伯塔大学等机构的联合团队

*解读：超越传统 4200 倍速！苏黎世联邦理工提出 NOBLE，首个经人类皮层数据验证的神经元建模框架

*论文：

https://go.hyper.ai/Ramfp

图神经网络 PLACER，解决蛋白质构象异质性

Modeling protein-small molecule conformational ensembles with PLACER

*来源：《美国国家科学院院刊》（PNAS）

*作者：华盛顿大学 David Baker 教授的研究团队

*解读：解决蛋白质构象异质性的原子级建模挑战！David Baker 团队 PLACER 框架解析

*论文：

https://www.biorxiv.org/content/10.1101/2024.09.25.614868v2

Squidiff 实现多场景转录组模拟，助力精准医学与空间医学发展 Squidiff: predicting cellular development and responses to perturbations using a diffusion model

*来源：Nature Methods

*作者：哥伦比亚大学、斯坦福大学的联合研究团队

*解读：哥大/斯坦福联手！Squidiff 实现多场景转录组模拟，助力精准医学与空间医学发展

*论文：

https://www.nature.com/articles/s41592-025-02877-y

血液细胞图像分类器，扩散模型助力白血病发现，能力超越临床专家

Deep generative classification of blood cell morphology

*来源：Nature

*作者：英国剑桥大学的研究团队

*解读：剑桥大学研发血液细胞图像分类器，扩散模型助力白血病发现，能力超越临床专家

*论文：

https://www.nature.com/articles/s42256-025-01122-7

Ctrl-DNA 框架，实现特定细胞基因表达的「靶向控制」

Ctrl-DNA: Constrained Reinforcement Learning for Cell-Specific Cis-Regulatory Element Design

*来源：NeurIPS 2025

*作者：多伦多大学团队联合昌平实验室

*解读：入选 NeurIPS 2025，多伦多大学等提出 Ctrl-DNA 框架，实现特定细胞基因表达的「靶向控制」

*论文：

https://arxiv.org/abs/2505.20578

BoltzGen，可跨分子类型设计蛋白结合物，66% 靶标获纳摩尔级亲和力

BoltzGen: Toward Universal Binder Design

*来源：

*作者：麻省理工学院与 Boltz 等多家机构

*解读：MIT 团队开源 BoltzGen，可跨分子类型设计蛋白结合物，66% 靶标获纳摩尔级亲和力

*论文：

https://go.hyper.ai/3sx2K

全新蛋白质动态融合表征框架 FusionProt，实现迭代式信息交换，多项任务性能达到 SOTA

FusionProt: Fusing Sequence and Structural Information for Unified Protein Representation Learning

*来源：bioRxiv

*作者：以色列理工学院联合 Meta AI 的研究团队

*解读：Meta AI 等提出全新蛋白质动态融合表征框架 FusionProt，实现迭代式信息交换，多项任务性能达到 SOTA

*论文：

https://go.hyper.ai/OXLYl

转录组引导的扩散模型 MorphDiff，为表型药物研发提速

Prediction of cellular morphology changes under perturbations with a transcriptome-guided diffusion model

*来源：Nature Communications

*作者：中国香港中文大学、穆罕默德·本·扎耶德人工智能大学等机构的研究人员

*解读：关联基因表达数据与细胞形态图像，港中文等开发转录组引导的扩散模型，为表型药物研发提速

*论文：

https://www.nature.com/articles/s41467-025-63478-z

AlphaPPIMI，PPIs 界面调节剂预测性能超越现有方法

Alphappimi: a comprehensive deep learning framework for predicting PPI-modulator interactions

*来源：Journal of Cheminformatics

*作者：中国石油大学和延世大学的联合研究团队

*解读：从「盲筛」到「精准定位」，中国石油大学团队推出 AlphaPPIMI，PPIs 界面调节剂预测性能超越现有方法

*论文：

https://jcheminf.biomedcentral.com/articles/10.1186/s13321-025-01077-2

scSiameseClu 在无监督单细胞聚类任务中达到 SOTA 性能

scSiameseClu: A Siamese Clustering Framework for Interpreting single-cell RNA Sequencing Data

*来源：IJCAI 2025

*作者：中国科学院、东北农业大学、澳门大学与吉林大学的研究团队

*解读：IJCAI 2025 丨 7 个数据集验证：scSiameseClu 在无监督单细胞聚类任务中达到 SOTA 性能

*论文：

https://go.hyper.ai/00BhP

融合神经网络框架，高效预测蛋白质序列的多金属结合位点

A Modular Fusion Neural Network Approach to Efficiently Predict Multi-Metal Binding Sites in Protein Sequences

*来源：bioRxiv

*作者：香港科技大学的研究团队

*解读：香港科技大学提出融合神经网络框架，高效预测蛋白质序列的多金属结合位点

*论文：

https://go.hyper.ai/Y7DNU

ReaSyn 借鉴思维链类比分子合成，实现超高重建率与路径多样性

Rethinking Molecule Synthesizability with Chain-of-Reaction

*来源：arXiv

*作者：英伟达研究团队

*解读：英伟达提出 ReaSyn，借鉴思维链类比分子合成，实现超高重建率与路径多样性

*论文：

https://arxiv.org/abs/2509.16084

无序区域结合蛋白设计新方法，专攻不可成药靶点

Design of intrinsically disordered region binding proteins

*来源：Science

*作者：David Baker 及其团队

*解读：登 Science，David Baker 团队提出无序区域结合蛋白设计新方法，专攻不可成药靶点

*论文：

https://www.science.org/doi/10.1126/science.adr8063

AMix-1 实现可扩展通用的蛋白质设计，设计蛋白变体活性提升 50 倍

AMix-1: A Pathway to Test-Time Scalable Protein Foundation Model

*来源：arXiv

*作者：清华大学智能产业研究院（AIR）周浩课题组联合上海人工智能实验室

*解读：设计蛋白变体活性提升 50 倍！清华 AIR 周浩团队基于贝叶斯流网络提出 AMix-1，实现可扩展通用的蛋白质设计

*论文：

https://go.hyper.ai/6Lz0c

双向布朗桥扩散模型输出方差显著降低，提升虚拟染色结果可重复性

Virtual staining of label-free tissue in imaging mass spectrometry

*来源：Science Advances

*作者：UCLA 研究团队

*解读：输出方差显著降低！UCLA 发布双向布朗桥扩散模型，提升虚拟染色结果可重复性

*论文：

https://go.hyper.ai/X9GEn

全原子扩散 Transformer ADiT，打破了周期性与非周期性系统的建模壁垒

All-atom Diffusion Transformers: Unified generative modelling of molecules and materials

*来源：ICML 2025

*作者：Meta FAIR 、剑桥大学与麻省理工学院的联合科研团队

*解读：入选 ICML 2025，Meta/剑桥/MIT 提出全原子扩散 Transformer 框架，首次实现周期性与非周期性原子系统统一生成

*论文：

https://go.hyper.ai/27d7U

Full-Atom MPNN 显式建模每个氨基酸残基的序列身份和侧链结构

Sidechain conditioning and modeling for full-atom protein sequence design with FAMPNN

*来源：ICML 2025

*作者：斯坦福大学的团队联合加州帕洛阿尔托市 Arc 研究院

*解读：同时处理蛋白质主链和侧链信息，斯坦福等基于消息传递神经网络实现全原子结构建模

*论文：

https://go.hyper.ai/JUJDq

La-Proteina 实现原子级蛋白质设计突破，高精度生成多达 800 个残基的蛋白质

La-Proteina: Atomistic Protein Generation via Partially Latent Flow Matching

*来源：arXiv

*作者：NVIDIA 的研究团队联合加拿大魁北克人工智能研究所 Mila

*解读：英伟达实现原子级蛋白质设计突破，高精度生成多达 800 个残基的蛋白质

https://go.hyper.ai/3csT5

深度学习模型 SUICA 实现空间转录组切片中任一位置基因表达的预测

SUICA: Learning Super-high Dimensional Sparse Implicit Neural Representations for Spatial Transcriptomics

*来源：ICML 2025

*作者：东京大学郑银强老师组，麦吉尔大学丁俊老师组

*解读：数据降噪/生物信号强化/缓解 dropout，深度学习模型 SUICA 实现空间转录组切片中任一位置基因表达的预测

*论文：

https://go.hyper.ai/C6Zcl

全新全原子蛋白质生成模型 APM 实现全原子设计与功能优化

An All-Atom Generative Model for Designing Protein Complexes

*来源：ICML 2025

*作者：湖南大学联合中国科学院大学、字节跳动 Seed 团队

*解读：支持蛋白质生成/折叠/逆折叠，湖大/中科大/字节提出 APM 模型，实现全原子设计与功能优化

*论文：

https://go.hyper.ai/TVp4i

深度学习模型 APEX，筛选潜在抗生素候选物

Computational exploration of global venoms for antimicrobial discovery with Venomics artificial intelligence

*来源：Nature Communications

*作者：美国宾夕法尼亚大学的研究团队

*解读：从动物毒液中挖掘 386 种全新抗菌肽，宾夕法尼亚大学开发深度学习模型 APEX，筛选潜在抗生素候选物

*论文：

https://www.nature.com/articles/s41467-025-60051-6[*]

蛋白质语言模型 Prot42 实现长序列建模与高亲和力结合剂生成

Prot42: a Novel Family of Protein Language Models for Target-aware Protein Binder Generation

*来源：arXiv

*作者：阿布扎比 Inception AI 研究所与硅谷 Cerebras Systems 公司的联合研究团队

*解读：8k 长序列建模，蛋白质语言模型 Prot42 仅利用目标蛋白序列即可生成高亲和力结合剂

*论文：

https://go.hyper.ai/cFupD

生物分子时间粗化动力学模拟器 UniSim，首次实现了跨分子类型、跨化学环境的统一时间粗化动力学模拟

UniSim: A Unified Simulator for Time-Coarsened Dynamics of Biomolecules

*来源：ICML 2025

*作者：清华大学、人民大学高瓴人工智能学院

*解读：入选 ICML 2025，清华/人大提出统一生物分子动力学模拟器 UniSim

*论文：

https://go.hyper.ai/5NWuO

SimplifiedBondfinder 基于 8.6 万蛋白质结构数据，融合量子力学计算的机器学习方法挖掘 69 个全新氮-氧-硫键

Revealing arginine-cysteine and glycine-cysteine NOS linkages by a systematic re-evaluation of protein structures

*来源：Communications Chemistry

*作者：乔治奥古斯特大学的团队

*解读：基于 8.6 万蛋白质结构数据，融合量子力学计算的机器学习方法挖掘 69 个全新氮-氧-硫键

*论文：

https://www.nature.com/articles/s42004-025-01535-w

利用蛋白质序列生成模型实现重叠基因设计，成功率极高

Design of overlapping genes using deep generative models of protein sequences

*来源：bioRxiv

*作者：美国华盛顿大学 David Baker 团队

*论文：

https://doi.org/10.1101/2025.05.06.652464

预测框架 PUPS 创新地结合蛋白质语言模型和图像修复模型, 实现单细胞级蛋白质定位

Prediction of protein subcellular localization in single cells

*来源：Nature Methods

*作者：麻省理工学院和哈佛大学的团队

*解读：融合蛋白质语言模型和图像修复模型，麻省理工与哈佛联手提出 PUPS，实现单细胞级蛋白质定位

*论文：

https://go.hyper.ai/LeaQF

首个跨分子种类统一生成框架 UniMoMo，实现多类型药物分子设计

UniMoMo: Unified Generative Modeling of 3D Molecules for De Novo Binder Design

*来源：ICML 2025

*作者：清华大学刘洋老师组联合人大黄文炳老师组和字节 AI 制药团队

*解读：入选 ICML 2025，清华/人大/字节提出首个跨分子种类统一生成框架 UniMoMo，实现多类型药物分子设计

*论文：

https://go.hyper.ai/wZXZZ

深度学习框架 STAIG，揭示肿瘤微环境中的详细基因信息

STAIG: Spatial transcriptomics analysis via image-aided graph contrastive learning for domain exploration and alignment-free integration

*来源：Nature Communications

*作者：日本东京大学医科学研究所的研究团队

*解读：无需预对齐即可消除批次效应，东京大学团队开发深度学习框架 STAIG，揭示肿瘤微环境中的详细基因信息

*论文：

https://www.nature.com/articles/s41467-025-56276-0

DRAKES 算法引入强化学习框架，首次实现了在离散扩散模型中对完整生成轨迹的可微奖励反向传播

Fine-Tuning Discrete Diffusion Models via Reward Optimization with Applications to DNA and Protein Design

*来源：ICLR 2025

*作者：美国麻省理工学院、哈佛大学、斯坦福大学、加州大学伯克利分校以及美国基因工程技术公司 Genentech 的研究人员

*解读：入选 ICLR 2025，MIT/UC 伯克利/哈佛/斯坦福等提出 DRAKES 算法，突破生物序列设计瓶颈

*论文：

https://doi.org/10.48550/arXiv.2410.13643

机器学习辅助的紫外吸收光谱法，基于 SVM 构建微生物污染检测模型

Machine learning aided UV absorbance spectroscopy for microbial contamination in cell therapy products

*来源：Scientific Reports

*作者：新加坡-麻省理工学院研究联盟、新加坡 A*SRL 实验室、新加坡国立大学、美国麻省理工学院的联合研究团队

*解读：30 分钟内输出结果，新加坡国立大学/MIT 等基于 SVM 构建微生物污染检测模型

*论文：

https://doi.org/10.1038/s41598-024-83114-y

蛋白质预训练新范式，解密蛋白质家族进化

Steering Protein Family Design through Profile Bayesian Flow

*来源：ICLR 2025

*作者：清华大学 AIR GenSI 研究组联合清华大学药学院

*解读：入选 ICLR 2025 Oral，清华 AIR 周浩团队提出蛋白质预训练新范式，解密蛋白质家族进化

*论文：

https://go.hyper.ai/Dg5ha

玻尔兹曼对齐技术蛋白质结合自由能预测达 SOTA

Boltzmann-Aligned Inverse Folding Model as a Predictor of Mutational Effects on Protein-Protein Interactions

*来源：ICLR 2025

*作者：浙江大学计算机科学与技术学院沈春华教授团队联合澳大利亚阿德莱德大学、美国东北大学等团队

*解读：入选 ICLR 2025！浙大沈春华等人提出玻尔兹曼对齐技术，蛋白质结合自由能预测达 SOTA

*论文：

https://arxiv.org/abs/2410.09543

Proteina 模型参数超 RFdiffusion 5 倍，从头设计蛋白质主链性能达 SOTA

Proteina: Scaling Flow-based Protein Structure Generative Models

*来源：ICLR 2025 Oral

*作者：英伟达联合魁北克人工智能研究所 Mila 、蒙特利尔大学、麻省理工学院的研究团队

*解读：模型参数超 RFdiffusion 5 倍！英伟达等发布 Proteina，从头设计蛋白质主链性能达 SOTA

*论文：

https://openreview.net/forum?id=TVQLu34bdw&nesting=2&sort=date-desc

UniGEM 模型首次基于扩散模型实现两任务协同增强

UniGEM: A Unified Approach to Generation and Property Prediction for Moleculess

*来源：ICLR 2025

*作者：清华大学联合中科院团队

*解读：首次实现分子生成与性质预测的统一，清华团队提出两阶段扩散生成机制，入选 ICLR 2025

*论文：

https://openreview.net/pdf?id=Lb91pXwZMR

RFdiffusion 再进化，实现原子级精度的抗体从头设计

Atomically accurate de novo design of antibodies with RFdiffusion

*来源：bioRxiv

*作者：David Baker 团队及其合作者

*解读：David Baker 团队新成果！RFdiffusion 再进化，实现原子级精度的抗体从头设计

*论文：

https://doi.org/10.1101/2024.03.14.585103

首个蛋白质 -RNA 语言模型融合方案，结合亲和力预测刷新 SOTA

CoPRA: Bridging Cross-domain Pretrained Sequence Models with Complex Structures for Protein-RNA Binding Affinity Prediction

*来源：arXiv

*作者：清华大学、伦敦大学学院、莫纳什大学、北京邮电大学的联合团队

*解读：入选 AAAI 2025！清华/伦敦大学学院等首创蛋白质-RNA 语言模型融合方案，结合亲和力预测刷新 SOTA

*论文：

https://arxiv.org/abs/2409.03773

Celcomen 模型首次在空间转录组学分析中实现因果推断可识别性

Estimation of single-cell and tissue perturbation effect in spatial transcriptomics via Spatial Causal Disentanglement

*来源：ICLR 2025

*作者：剑桥大学的研究团队

*解读：入选 ICLR 2025！剑桥大学提出 Celcomen 模型，首次在空间转录组学分析中实现因果推断可识别性

*论文：

https://openreview.net/forum?id=Tqdsruwyac

AlphaFold-Metainference 方法精准预测无序蛋白质结构集合

AlphaFold prediction of structural ensembles of disordered proteins

*来源：Nature Communications

*作者：剑桥大学的研究团队

*解读：AlphaFold 应用新里程碑！剑桥大学团队提出 AlphaFold-Metainference，精准预测无序蛋白质结构集合

*论文：

https://www.nature.com/articles/s41467-025-56572-9

第二代 RNA 结构预测算法，多项基准测试超越 SOTA

Ab initio RNA structure prediction with composite language model and denoised end-to-end learning

*来源：bioRxiv

*作者：新加坡国立大学的张阳教授团队

*解读：新加坡国立大学张阳团队开发第二代 RNA 结构预测算法，多项基准测试超越 SOTA

*论文：

https://www.biorxiv.org/content/10.1101/2025.03.05.641632v1

创新性 4D 扩散模型结合分子动力学模拟数据，能够同时预测多个时间步长的蛋白质运动轨迹

4D Diffusion for Dynamic Protein Structure Prediction with Reference and Motion Guidance

*来源：arXiv

*作者：复旦大学、上海科学智能研究院和南京大学的研究团队

*解读：AlphaFolding 填补蛋白质动态结构预测空白！复旦大学等提出 4D 扩散模型，成果入选 AAAI 2025

*论文：

https://arxiv.org/abs/2408.12419

PepPrCLIP 破解「不可成药」难题，创建几乎总是与目标蛋白质更匹配的肽

De novo design of peptide binders to conformationally diverse targets with contrastive language modeling

*来源：Science Advances

*作者：杜克大学的研究团队

*解读：有望开发癌症新疗法！杜克大学用 PepPrCLIP 破解「不可成药」难题

*论文：

https://www.science.org/doi/10.1126/sciadv.adr8638

MOLRL 基于强化学习优化靶向分子，成功率可达 100%

Targeted Molecular Generation With Latent Reinforcement Learning

*来源：ChemRxiv

*作者：Cellarity 公司和英伟达的研究团队

*解读：成功率可达 100%，药物开发公司 Cellarity 联手英伟达，基于强化学习优化靶向分子

*论文：

https://go.hyper.ai/H4JhR

进化驱动的病毒变异驱动力预测框架 E2VD，预测精度提升 67%

A unified evolution-driven deep learning framework for virus variation driver prediction

*来源：Nature Machine Intelligence

*作者：北京大学信息工程学院田永鸿教授、陈杰副教授，联合广州国家实验室周鹏研究员指导博士生聂志伟、硕士生刘旭东等

*解读：登 Nature 子刊！北大团队用 AI 预测新冠/艾滋病/流感病毒进化方向，精度提升 67%

*论文：

https://www.nature.com/articles/s42256-024-00966-9

AI+ 医疗健康

Healthcare Agent 问诊主动性及相关性超越 GPT-4 等闭源模型

Healthcare agent: eliciting the power of large language models for medical consultation

*来源：Nature Artificial Intelligence

*作者：武汉大学和南洋理工大学研究团队

*解读：从伦理保障到病史管理，武汉大学等提出 Healthcare Agent，问诊主动性及相关性超越 GPT-4 等闭源模型

*论文：

https://go.hyper.ai/09lYX

ICA-Var 的多变量分析方法，基于基因测序和机器学习的废水流行病学评估，病毒检出时间最高提前 4 周

Early detection of emerging SARS-CoV-2 Variants from wastewater through genome sequencing and machine learning

*来源：Nature Communications

*作者：内华达大学拉斯维加斯分校的研究团队

*解读：登 Nature 子刊，基于基因测序和机器学习的废水流行病学评估，病毒检出时间最高提前 4 周

*论文：

https://www.nature.com/articles/s41467-025-61280-5

医学 GraphRAG 刷新问答准确性记录，在 11 个数据集评测上达 SOTA

Medical Graph RAG: Towards Safe Medical Large Language Model via Graph Retrieval-Augmented Generation

*来源：ACL 2025

*作者：牛津大学、卡内基梅隆大学与爱丁堡大学的联合团队

*解读：ACL 2025 丨牛津大学等提出医学 GraphRAG，刷新问答准确性记录，在 11 个数据集评测上达 SOTA

*论文：

https://go.hyper.ai/OaMIE

首个 VR 运动干预系统 REVERIE（「灵境」），重塑青少年脑-身-心健康

Adaptive AI-based virtual reality sports system for adolescents with excess body weight: a randomized controlled trial

*来源：Nature Medicine

*作者：上海交通大学医学院附属第六人民医院/主动健康战略与发展研究院李华婷教授团队、上海交通大学计算机学院/人工智能教育部重点实验室盛斌教授团队通过医工交叉合作研究，携手上海体育大学王继红研究员团队、上海科技大学/上海临床研究中心曾嵘教授团队及新加坡国立大学林水德教授团队

*解读：钱学森「灵境」预言成真！上交/上体/清华等构建全球首个 VR 运动干预系统 REVERIE，重塑青少年脑-身-心健康

*论文：

https://www.nature.com/articles/s41591-025-03724-5

NeuralCohort 方法基于多维度 EHR 数据实现细粒度患者队列建模，住院时间预测准确率提升 16.3%

NeuralCohort: Cohort-aware Neural Representation Learning for Healthcare Analytics

*来源：ICML 2025

*作者：新加坡国立大学联合浙江大学

*解读：新加坡国立大学基于多维度 EHR 数据实现细粒度患者队列建模，住院时间预测准确率提升 16.3%

*论文：

https://openreview.net/forum?id=bqQVa6VRvm

全球首个 HIE 领域临床思维图谱模型，神经认知结果预测任务上性能提升 15%

Visual and Domain Knowledge for Professional-level Graph-of-Thought Medical Reasoning

*来源：ICML 2025

*作者：哈佛医学院、波士顿儿童医院、纽约大学及 MIT-IBM 沃森实验室的跨学科团队

*解读：入选 ICML 2025！哈佛医学院等推出全球首个 HIE 领域临床思维图谱模型，神经认知结果预测任务上性能提升 15%

*论文：

https://openreview.net/forum?id=tnyxtaSve5

分层蒸馏多示例学习框架 HDMIL，快速处理千兆像素病理全切片图像

Fast and Accurate Gigapixel Pathological Image Classification with Hierarchical Distillation Multi-Instance Learning

*来源：CVPR 2025

*作者：哈尔滨工业大学江俊君教授、江奎副教授和张永兵教授团队

*解读：入选 CVPR 2025，哈工大团队提出分层蒸馏多示例学习框架 HDMIL，快速处理千兆像素病理全切片图像

*论文：

https://go.hyper.ai/B3RMf

专为 3D 血管分割而设计的基础模型 vesselFM，能够在零样本、单样本和少样本场景中实现优于现有先进模型的分割能力和泛化能力。

vesselFM: A Foundation Model for Universal 3D Blood Vessel Segmentation

*来源：CVPR 2025

*作者：苏黎世大学、苏黎世联邦理工学院和慕尼黑工业大学的研究人员

*解读：性能远超 SAM 系模型，苏黎世大学等开发通用 3D 血管分割基础模型，入选 CVPR 2025

*论文：

https://go.hyper.ai/lVad9

图编码混合生存模型基于 800 万真实数据，识别具有一致特征和生存结局的亚表型

Identification of predictive subphenotypes for clinical outcomes using real world data and machine learningn

*来源：Nature Communication

*作者：美国康奈尔大学与再生元制药公司

*解读：基于 800 万真实数据，康奈尔大学团队利用图神经网络精准预测肺癌患者生存期，发现 3 类致命亚型

*论文：

https://doi.org/10.1038/s41467-025-59092-8

融合策略 AI 模型，实现多中心、跨专科感染性休克死亡风险的精准预测

Artificial intelligence based multispecialty mortality prediction models for septic shock in a multicenter retrospective study

*来源：npj digital medicine

*作者：华中科技大学同济医学院附属同济医院、医药卫生管理学院研究团队

*解读：登 Nature 子刊！华中科技大学提出融合策略 AI 模型，实现多中心、跨专科感染性休克死亡风险的精准预测

*论文：

https://go.hyper.ai/faMLL

2 种新型癌症预测算法，基于血液指标实现 15 种癌症早期预测

Development and external validation of prediction algorithms to improve early diagnosis of cancer

*来源：Nature Communications

*作者：伦敦玛丽女王大学与牛津大学研究团队

*解读：牛津大学等深挖 746 万成年人健康数据开发早筛算法，基于血液指标实现 15 种癌症早期预测

*论文：

https://go.hyper.ai/L7gNm

多智能体对话 (MAC) 框架，显著提升 LLMs 的诊断能力

Enhancing diagnostic capability with multi-agents conversational large language models

*来源：npj digital medicine

*作者：四川大学华西医院、华西生物医学大数据中心、浙江大学医学院、北京邮电大学等团队

*解读：模拟医生会诊，四川大学华西医院团队开发多智能体对话框架助力疾病诊断

*论文：

https://www.nature.com/articles/s41746-025-01550-0#Tab6

首个全模态医疗图像重识别框架，在 11 个数据集上的评测达 SOTA

Towards All-in-One Medical Image Re-Identification

*来源：

*作者：上海人工智能实验室联合多家知名高校

*解读：入选 CVPR 2025，上海 AI Lab 等提出首个全模态医疗图像重识别框架，在 11 个数据集上的评测达 SOTA

*论文：

https://arxiv.org/pdf/2503.08173

多对一回归模型 M2OST，利用数字病理图像精准预测基因表达

M2OST: Many-to-one Regression for Predicting Spatial Transcriptomics from Digital Pathology Images

*来源：AAAI 2025

*作者：中国浙江大学的林兰芬教授研究团队联合浙江杭州之江实验室以及日本立命馆大学

*解读：入选 AAAI 2025，浙江大学提出多对一回归模型 M2OST，利用数字病理图像精准预测基因表达

*论文：

https://arxiv.org/abs/2409.15092

MindGlide 模型，实现多发性硬化症病变量化

Enabling new insights from old scans by repurposing clinical MRI archives for multiple sclerosis research

*来源：Nature Communications

*作者：英国伦敦大学学院团队

*解读：最大化挖掘临床 MRI 数据价值，UCL 团队提出 MindGlide 模型，实现多发性硬化症病变量化

*论文：

https://www.nature.com/articles/s41467-025-58274-8

全球首个针对大模型在辅助基层医生培训中实际效能的前瞻性真实世界证据

Large language models for diabetes training: a prospective study

*来源：Science Bulletin

*作者：上海交通大学盛斌教授团队联合上海体育大学毛丽娟教授团队、携手清华大学黄天荫教授团队和上海市糖尿病研究所贾伟平教授团队等多学科力量，联合美国杜克大学、约翰霍普金斯大学以及澳洲墨尔本大学等国际顶尖学府和研究机构

*解读：医生培训迎来 DeepSeek 外挂！上体/上交/清华合作研究证实大模型可成为基层医生培训「黄金搭档」

*论文：

https://www.sciencedirect.com/science/article/pii/S2095927325000891

AcneDGNet 的深度学习算法准确率远超初级皮肤科医生，实现痤疮病变检测与分级

Evaluation of an acne lesion detection and severity grading model for Chinese population in online and offline healthcare scenarios

*来源：Scientific Reports

*作者：北京大学国际医院皮肤科韩钢文及其团队

*解读：准确率远超初级皮肤科医生，北大国际医院等开发深度学习算法，实现痤疮病变检测与分级

*论文：

https://www.nature.com/articles/s41598-024-84670-z

多模态医学影像分割模型，实现三维影像自动分割与交互

VISTA3D: A Unified Seamentation Foundation Model For 3D Medical lmaging

*来源：arXiv

*作者：英伟达联合阿肯色大学医学院、美国国立卫生研究院及牛津大学

*解读：精度提升 5.2%，英伟达等发布多模态医学影像分割模型，实现三维影像自动分割与交互

*论文：

https://doi.org/10.48550/arxiv.2406.05285

对多切面超声心动图的心脏结构进行精准分割，有效减少冗杂度

EchoONE: Segmenting Multiple echocardiography Planes in One Model

*来源：CVPR 2025

*作者：深圳大学医学部生物医学工程学院医学超声图像计算实验室

*解读：入选 CVPR 2025！深圳大学团队等提出 EchoONE，可精准分割多切面超声心动图

*论文：https://arxiv.org/abs/2412.02993

当前具有最大规模参数量的生物医学大语言模型 MedFound

A generalist medical language model for disease diagnosis assistance

*来源：Nature Medicine

*作者：北京邮电大学、北京大学第三医院、三峡大学

*解读：开源 1760 亿参数通用医学语言模型！北邮/北大/三峡大学提出 MedFound，推理能力接近专家医师

*论文：https://www.nature.com/articles/s41591-024-03416-6

对比度驱动医学图像分割的通用框架，实现医学图像精准分割

ConDSeg: A General Medical Image Segmentation Framework via Contrast-Driven Feature Enhancement

*来源：AAAI 2025

*作者：中国地质大学、百度

*解读：入选 AAAI 2025！解决医学图像分割软边界与共现难题，中国地质大学等提出图像分割模型 ConDSeg

*论文：

https://arxiv.org/abs/2412.08345

在 2 种传染性和 14 种非传染性疾病的 9 个基准数据集上均为最优

A multimodal multidomain multilingual medical foundation model for zero shot clinical diagnosis

*来源：Nature Portfolio

*作者：牛津大学、亚马逊、罗切斯特大学、 GlaxoSmithKline 、西湖大学医学人工智能实验室

*解读：牛津/亚马逊/西湖大学/腾讯等提出多模态多领域多语言医学模型 M³FM，可用于零样本临床诊断

*论文：

https://www.nature.com/articles/s41746-024-01339-7

分类准确率可达 97%，显著高于人类观察者的 82%

Deep learning versus human assessors: forensic sex estimation from three-dimensional computed tomography scans

*来源：Scientific Reports

*作者：澳大利亚西澳大学、新南威尔士大学、印度尼西亚哈萨努丁大学

*解读：准确率达 97%，澳大利亚团队新成果基于深度学习凭颅骨 CT 鉴定性别，赶超人类法医

*论文：

https://www.nature.com/articles/s41598-024-81718-y

双向逐步特征对齐的未对齐医学图像融合方法

BSAFusion: A Bidirectional Stepwise Feature Alignment Network for Unaligned Medical Image Fusion

*来源：AAAI 2025

*作者：昆明理工大学、中国海洋大学

*解读：入选 AAAI 2025！可实现多模态医学图像对齐与融合，国内两大高校联合提出 BSAFusion

*论文：https://arxiv.org/abs/2412.08050 新型分层多智能体框架，涵盖了 362 种常见疾病

KG4Diagnosis: A Hierarchical Multi-Agent LLM Framework with Knowledge Graph Enhancement for Medical Diagnosis

*来源：AAAI-25 Bridge Program

*作者：华威大学、克兰菲尔德大学、剑桥大学、牛津大学

*解读：助力诊断 362 种常见疾病！剑桥/牛津/华威大学等提出多 Agent 大语言模型框架，自动化构建医疗知识图谱

*论文：https://arxiv.org/abs/2406.05285

AI+ 材料化学

不足 10 万结构数据训练，PET-MAD 原子模拟精度媲美专业模型

PET-MAD as a lightweight universal interatomic potential for advanced materials modeling

*来源：Nature Communications

*作者：瑞士洛桑理工学院

*解读：以不足 10 万结构数据训练，瑞士洛桑联邦理工提出 PET-MAD，原子模拟精度媲美专业模型

*论文：

https://www.nature.com/articles/s41467-025-65662-7

计算成本减半，将人类的化学推理形式化为机器可理解的框架

ChemOntology: A Reusable Explicit Chemical Ontology-Based Method to Expedite Reaction Path Searches

*来源：ACS Catalysis

*作者：日本北海道大学

*解读：计算成本减半，化学反应发现工具 ChemOntology 将人类直觉「编码」到系统中，加速反应路径搜索

*论文：

https://pubs.acs.org/doi/10.1021/acscatal.5c06298

MOF-ChemUnity：一个结构化、可扩展、可拓展的知识图谱

MOF-ChemUnity: Literature-Informed Large Language Models for Metal–Organic Framework Research

*来源：ACS Publications

*作者：加拿大多伦多大学、加拿大国家研究委员会清洁能源创新研究中心

*解读：从 9,874 篇文献到 1.5 万晶体结构，MOF-ChemUnity 重构 MOF 全景知识，推动材料发现进入「可解释 AI」时代

*论文：

https://pubs.acs.org/doi/10.1021/jacs.5c11789

将 Graphormer 的全局注意力机制与 CGCNN 相融合

CGformer: Transformer-enhanced crystal graph network with global attention for material property prediction

*来源：Matter

*作者：上海交通大学人工智能与微结构实验室

*解读：新材料研发提速！上交大团队开发新 AI 材料设计模型 CGformer，融合全局注意力机制

*论文：

https://www.cell.com/matter/abstract/S2590-2385(25)00423-0

FASTSOLV 模型：实现任意温度下的小分子溶解度预测

Data-driven organic solubility prediction at the limit of aleatoric uncertainty

*来源：Nature Communication

*作者：麻省理工学院

*解读：推理速度快 50 倍，MIT 团队提出 FASTSOLV 模型，实现任意温度下的小分子溶解度预测

*论文：

https://www.nature.com/articles/s41467-025-62717-7

利用 MOFs 合成后即可获得的信息来预测其潜在性能和用途

Connecting metal-organic framework synthesis to applications using multimodal machine learning

*来源：Nature Communications

*作者：加拿大多伦多大学

*解读：多模态模型加速新材料与工业应用匹配，无需完整晶体结构即可预测材料性质

*论文：

https://www.nature.com/articles/s41467-025-60796-0

首次构建能够同时处理超材料设计三大模态的统一框架

UNIMATE: A Unified Model for Mechanical Metamaterial Generation, Property Prediction, and Condition Confirmation

*来源：ICML 2025

*作者：美国弗吉尼亚理工学院、 Meta AI

*解读：超材料设计破局！Meta AI 等提出 UNIMATE，首次实现拓扑生成/性能预测等任务的统一建模

*论文：

https://go.hyper.ai/FoAWw

覆盖 2 亿分子质谱图，构建全球最大规模质谱数据集 GeMS

Self-supervised learning of molecular representations from millions of tandem mass spectra using DreaMS

*来源：Nature Biotechnology

*作者：捷克科学院有机化学与生物化学研究所

*解读：覆盖 2 亿分子质谱图，捷克科学院发布 DreaMS 模型，构建全球最大规模质谱数据集 GeMS

*论文：

https://go.hyper.ai/uNbqL

在单一机器学习模型中同时学习广义势能及其对外部刺激的响应函数

Unified differentiable learning of electric response

*来源：Nature Communications

*作者：哈佛大学、 Robert Bosch LLC

*解读：从石英到铁电材料，哈佛大学提出等变机器学习框架，加速材料大规模电场模拟

*论文：

https://go.hyper.ai/18TWg

基于 LLM 从 8.8 万篇论文中提取 1.4 万种材料的化学组成

Data-driven material screening of secondary and natural cementitious precursors

*来源：Communication Materials

*作者：美国麻省理工学院

*解读：MIT 团队利用大模型筛选 25 类水泥熟料替代材料，相当于减排 12 亿吨温室气体

*论文：

https://go.hyper.ai/ZOAaW

将全面的 SSE 数据库与 LLM 和 ab initio 元动力学模拟相结合

Unraveling the Complexity of Divalent Hydride Electrolytes in Solid-State Batteries via a Data-Driven Framework with Large Language Model

*来源：Angewandte Chemie-International Edition

*作者：日本东北大学、中国四川大学、日本芝浦工业大学

*解读：中日团队联合攻关，利用大模型解析氢化物固态电解质传导机制，建立可靠活化能预测模型

*论文：

https://go.hyper.ai/isQRi

在高达 TB 级别的多组分高分辨质谱数据库中，检索离子同位素分布

Discovering organic reactions with a machine-learning-powered deciphering of tera-scale mass spectrometry data

*来源：Nature Communications

*作者：俄罗斯科学院

*解读：登 Nature 子刊，俄罗斯研究团队基于机器学习实现万亿级质谱数据搜索，发现未知化学反应

*论文：

https://go.hyper.ai/ak7bN

一种基于扩散模型的生成式人工智能结构解析方法 PXRDnet

Ab initio structure solutions from nanocrystalline powder diffraction data via diffusion models

*来源：Nature Materials

*作者：哥伦比亚大学、斯坦福大学

*解读：首次实现纳米晶体端到端解析，哥大团队提出 PXRDnet，成功解析 200 种复杂模拟纳米晶体

*论文：

https://go.hyper.ai/r1K6b

基于机器学习成功制备 10 种光驱动有机晶体

Machine learning-driven optimization of the output force in photo-actuated organic crystals

*来源：Digital Discovery

*作者：日本早稻田大学

*解读：效率提升 73 倍！日本研究团队基于机器学习成功制备 10 种光驱动有机晶体

*论文：

https://go.hyper.ai/RU0ro

成功预测金属的电声相互作用，效率提高 5 倍

Accelerating superconductor discovery through tempered deep learning of the electron-phonon spectral function

*来源：npj Computational Materials

*作者：美国佛罗里达大学、田纳西大学

*解读：超导材料搜索效率提升 5 倍！佛罗里达大学等用深度学习变革材料发现，成果登 Nature 子刊

*论文：

https://www.nature.com/articles/s41524-024-01475-4

通过梯度提升决策树技术，实现对 RHEAs 和 RCCAs 抗氧化性能的高精度预测

Advancing refractory high entropy alloy development with AI-predictive models for high temperature oxidation resistance

*来源：Scripta Materialia

*作者：法国波尔多大学、日本国立材料科学研究所、中国台湾国立清华大学、比利时鲁汶大学、比利时 WEL 研究所

*解读：高熵合金新发现！多团队联手实现抗氧化性高精度预测，增加铝/铬/硅含量可有效改善

*论文：

https://doi.org/10.1016/j.scriptamat.2024.116394

结合局部消息传递与全局注意力机制，能精准预测分子光电性能

RingFormer: A Ring-Enhanced Graph Transformer for Organic Solar Cell Property Prediction

*来源：AAAI 2025

*作者：香港理工大学

*解读：入选 AAAI 2025！香港理工大学团队基于图 Transformer，精准预测有机材料分子光电性能

*论文：

https://doi.org/10.48550/arXiv.2412.09030

一种无机逆合成规划方法，成功地促进了无机材料合成的效率和准确性

Retrieval-Retro: Retrieval-based Inorganic Retrosynthesis with Expert Knowledge

*来源：NeurIPS 2024

*作者：韩国化学技术研究所、韩国科学技术院

*解读：无机材料逆合成效率飙升，韩国团队推出 Retrieval-Retro，成果入选 NeurIPS 2024

*论文：

https://doi.org/10.48550/arXiv.2410.21341

基于扩散模型，根据目标空间群生成结构

A generative model for inorganic materials design

*来源：Nature

*作者：微软

*解读：直接设计目标属性材料！微软 MatterGen 模型重磅开源，用生成式 AI 重新定义材料逆向设计新范式

*论文：

https://www.nature.com/articles/s41586-025-08628-5

AI+ 农林畜牧业

覆盖近 1.5 万个物种，刷新生物声学分类检测 SOTA

Perch 2.0: The Bittern Lesson for Bioacoustics

*来源：arXiv

*作者：Google DeepMind 、 Google Research

*解读：覆盖近 1.5 万个物种，谷歌 DeepMind 发布 Perch 2.0，刷新生物声学分类检测 SOTA

*论文：

https://arxiv.org/abs/2508.04665

首次将 219 个基于傅里叶变换、香农熵等数学理论的新型序列描述符纳入特征空间

PlantLncBoost: key features for plant lncRNA identification and significant improvement in accuracy and generalization

*来源：New Phytologist

*作者：山东理工大学、北京林业大学、广东省农业科学院、巴西圣保罗大学、英国罗莎琳德富兰克林医科大学、瑞典于默奥大学

*解读：整合多源植物转录组数据，山东理工大学等构建 PlantLncBoost 模型，跨物种 lncRNA 预测准确率最高达 96%

*论文：

https://go.hyper.ai/F7pkc

AI+ 气象研究

攻克了「渐进式噪声调度」与「时间损失加权」的协同设计问题

Elucidated Rolling Diffusion Models for Probabilistic Weather Forecasting

*来源：NeurIPS 2025

*作者：英伟达、加州大学圣迭戈分校

*解读：入选 NeurIPS 2025，英伟达提出 ERDM 模型，解长期预报难题，中远期预报持续领先 EDM 基准

*论文：

https://doi.org/10.48550/arXiv.2506.20024

一种新型潜在扩散模型，可用于高精度概率性次季节至季节尺度天气预报

OmniCast: A Masked Latent Diffusion Model for Weather Forecasting Across Time Scales

*来源：NeurIPS 2025

*作者：加州大学洛杉矶分校、美国阿贡国家实验室

*解读：效率至高提升 20 倍！加州大学开发 OmniCast，解决自回归天气预报模型误差累计问题

*论文：

https://go.hyper.ai/YANIu

超本地预测模型，实现了提前数天预测大部分强降雨事件

Hyperlocal Extreme Rainfall Forecasts in Mumbai: Convolutional Neural Network Transfer Learning-Based Downscaling Approach

*来源：SSRN

*作者：印度理工学院孟买分校、马里兰大学

*解读：准确度提升 400%！印度季风预测模型基于 36 个气象站点，实现城区尺度精细预报

*论文：

https://go.hyper.ai/j05Vt

仅需 2 分钟，ACE2 可完成一次 4 个月季节预报

Skilful global seasonal predictions from a machine learning weather model trained on reanalysis data

*来源：npj Climate and Atmospheric Science

*作者：英国埃克塞特哈德利中心气象局、埃克塞特大学、美国艾伦人工智能研究所（Ai2）

*解读：机器学习 vs. 动力学模型，Ai2 最新研究：仅需 2 分钟，ACE2 可完成一次 4 个月季节预报

*论文：

https://go.hyper.ai/YyRfT

一个将球面信号处理与隐马尔可夫集合框架相结合的概率机器学习天气预报系统

FourCastNet 3: A geometric approach to probabilistic machine-learning weather forecasting at scale

*来源：arXiv

*作者：英伟达、美国劳伦斯伯克利国家实验室、加州大学伯克利分校、美国加州理工学院

*解读：1 分钟内完成 15 天预报，英伟达/UC 伯克利等提出机器学习天气预报系统 FCN3，支持单卡极速推理

*论文：

https://arxiv.org/pdf/2507.12144

无需依赖传统数值天气预报模型，即可实现高技巧性的天气预报

End-to-end data-driven weather prediction

*来源：Nature

*作者：剑桥大学、图灵研究所、多伦多大学、微软科学智能中心、欧洲中期天气预报中心、英国南极调查局、谷歌 DeepMind

*解读：登 Nature，剑桥大学等发布首个端到端的数据驱动天气预报系统，预测速度提升数十倍

*论文：

https://www.nature.com/articles/s41586-025-08897-0

AI+ 天文学

利用卷积神经网络，成功识别出 7 个高质量类星体透镜候选体

Quasars acting as Strong Lenses Found in DESI DR1

*来源：arXiv

*作者：斯坦福大学、 SLAC 国家加速器实验室、北京大学、意大利国家天体物理研究院布雷拉天文台、伦敦大学学院、加州大学伯克利分校

*解读：斯坦福/北大/UCL/UC 伯克利联手，利用 CNN 从 81 万类星体中精准识别 7 个罕见透镜样本

*论文：

https://arxiv.org/abs/2511.02009

首个面向天文学的大规模多模态基础模型家族 AION-1

AION-1: Omnimodal Foundation Model for Astronomical Sciences

*来源：NeurIPS 2025

*作者：加州大学伯克利分校、剑桥大学、牛津大学等

*解读：首个天文多模态基础模型 AION-1 诞生！UC 伯克利等基于 2 亿天文目标预训练，成功构建泛化性多模态天文 AI 框架

*论文：

https://openreview.net/forum?id=6gJ2ZykQ5W

查看更多前沿论文：

https://hyper.ai/cn/papers

查看研究相关数据集：

https://hyper.ai/cn/datasets

AI+ 生物医药

新的生成式模型及新评测基准，重塑无序蛋白集合预测能力

Advancing Protein Ensemble Predictions Across the Order-Disorder Continuum

*来源：bioRxiv

*作者：Peptone 公司、英伟达公司、麻省理工学院等组成的联合团队

*解读：重塑无序蛋白集合预测能力，英伟达/MIT/牛津大学/哥本哈根大学/Peptone 等发布生成式模型及新评测基准

*论文：

https://www.biorxiv.org/content/10.1101/2025.10.18.680935v1

首个经人类皮层数据验证的神经元建模框架 NOBLE，超越传统 4200 倍速

NOBLE – Neural Operator with Biologically-informed Latent Embeddings to Capture Experimental Variability in Biological Neuron Models

*来源：NeurIPS 2025

*作者：苏黎世联邦理工学院、加州理工学院与阿尔伯塔大学等机构的联合团队

*解读：超越传统 4200 倍速！苏黎世联邦理工提出 NOBLE，首个经人类皮层数据验证的神经元建模框架

*论文：

https://go.hyper.ai/Ramfp

图神经网络 PLACER，解决蛋白质构象异质性

Modeling protein-small molecule conformational ensembles with PLACER

*来源：《美国国家科学院院刊》（PNAS）

*作者：华盛顿大学 David Baker 教授的研究团队

*解读：解决蛋白质构象异质性的原子级建模挑战！David Baker 团队 PLACER 框架解析

*论文：

https://www.biorxiv.org/content/10.1101/2024.09.25.614868v2

Squidiff 实现多场景转录组模拟，助力精准医学与空间医学发展 Squidiff: predicting cellular development and responses to perturbations using a diffusion model

*来源：Nature Methods

*作者：哥伦比亚大学、斯坦福大学的联合研究团队

*解读：哥大/斯坦福联手！Squidiff 实现多场景转录组模拟，助力精准医学与空间医学发展

*论文：

https://www.nature.com/articles/s41592-025-02877-y

血液细胞图像分类器，扩散模型助力白血病发现，能力超越临床专家

Deep generative classification of blood cell morphology

*来源：Nature

*作者：英国剑桥大学的研究团队

*解读：剑桥大学研发血液细胞图像分类器，扩散模型助力白血病发现，能力超越临床专家

*论文：

https://www.nature.com/articles/s42256-025-01122-7

Ctrl-DNA 框架，实现特定细胞基因表达的「靶向控制」

Ctrl-DNA: Constrained Reinforcement Learning for Cell-Specific Cis-Regulatory Element Design

*来源：NeurIPS 2025

*作者：多伦多大学团队联合昌平实验室

*解读：入选 NeurIPS 2025，多伦多大学等提出 Ctrl-DNA 框架，实现特定细胞基因表达的「靶向控制」

*论文：

https://arxiv.org/abs/2505.20578

BoltzGen，可跨分子类型设计蛋白结合物，66% 靶标获纳摩尔级亲和力

BoltzGen: Toward Universal Binder Design

*来源：

*作者：麻省理工学院与 Boltz 等多家机构

*解读：MIT 团队开源 BoltzGen，可跨分子类型设计蛋白结合物，66% 靶标获纳摩尔级亲和力

*论文：

https://go.hyper.ai/3sx2K

全新蛋白质动态融合表征框架 FusionProt，实现迭代式信息交换，多项任务性能达到 SOTA

FusionProt: Fusing Sequence and Structural Information for Unified Protein Representation Learning

*来源：bioRxiv

*作者：以色列理工学院联合 Meta AI 的研究团队

*解读：Meta AI 等提出全新蛋白质动态融合表征框架 FusionProt，实现迭代式信息交换，多项任务性能达到 SOTA

*论文：

https://go.hyper.ai/OXLYl

转录组引导的扩散模型 MorphDiff，为表型药物研发提速

Prediction of cellular morphology changes under perturbations with a transcriptome-guided diffusion model

*来源：Nature Communications

*作者：中国香港中文大学、穆罕默德·本·扎耶德人工智能大学等机构的研究人员

*解读：关联基因表达数据与细胞形态图像，港中文等开发转录组引导的扩散模型，为表型药物研发提速

*论文：

https://www.nature.com/articles/s41467-025-63478-z

AlphaPPIMI，PPIs 界面调节剂预测性能超越现有方法

Alphappimi: a comprehensive deep learning framework for predicting PPI-modulator interactions

*来源：Journal of Cheminformatics

*作者：中国石油大学和延世大学的联合研究团队

*解读：从「盲筛」到「精准定位」，中国石油大学团队推出 AlphaPPIMI，PPIs 界面调节剂预测性能超越现有方法

*论文：

https://jcheminf.biomedcentral.com/articles/10.1186/s13321-025-01077-2

scSiameseClu 在无监督单细胞聚类任务中达到 SOTA 性能

scSiameseClu: A Siamese Clustering Framework for Interpreting single-cell RNA Sequencing Data

*来源：IJCAI 2025

*作者：中国科学院、东北农业大学、澳门大学与吉林大学的研究团队

*解读：IJCAI 2025 丨 7 个数据集验证：scSiameseClu 在无监督单细胞聚类任务中达到 SOTA 性能

*论文：

https://go.hyper.ai/00BhP

融合神经网络框架，高效预测蛋白质序列的多金属结合位点

A Modular Fusion Neural Network Approach to Efficiently Predict Multi-Metal Binding Sites in Protein Sequences

*来源：bioRxiv

*作者：香港科技大学的研究团队

*解读：香港科技大学提出融合神经网络框架，高效预测蛋白质序列的多金属结合位点

*论文：

https://go.hyper.ai/Y7DNU

ReaSyn 借鉴思维链类比分子合成，实现超高重建率与路径多样性

Rethinking Molecule Synthesizability with Chain-of-Reaction

*来源：arXiv

*作者：英伟达研究团队

*解读：英伟达提出 ReaSyn，借鉴思维链类比分子合成，实现超高重建率与路径多样性

*论文：

https://arxiv.org/abs/2509.16084

无序区域结合蛋白设计新方法，专攻不可成药靶点

Design of intrinsically disordered region binding proteins

*来源：Science

*作者：David Baker 及其团队

*解读：登 Science，David Baker 团队提出无序区域结合蛋白设计新方法，专攻不可成药靶点

*论文：

https://www.science.org/doi/10.1126/science.adr8063

AMix-1 实现可扩展通用的蛋白质设计，设计蛋白变体活性提升 50 倍

AMix-1: A Pathway to Test-Time Scalable Protein Foundation Model

*来源：arXiv

*作者：清华大学智能产业研究院（AIR）周浩课题组联合上海人工智能实验室

*解读：设计蛋白变体活性提升 50 倍！清华 AIR 周浩团队基于贝叶斯流网络提出 AMix-1，实现可扩展通用的蛋白质设计

*论文：

https://go.hyper.ai/6Lz0c

双向布朗桥扩散模型输出方差显著降低，提升虚拟染色结果可重复性

Virtual staining of label-free tissue in imaging mass spectrometry

*来源：Science Advances

*作者：UCLA 研究团队

*解读：输出方差显著降低！UCLA 发布双向布朗桥扩散模型，提升虚拟染色结果可重复性

*论文：

https://go.hyper.ai/X9GEn

全原子扩散 Transformer ADiT，打破了周期性与非周期性系统的建模壁垒

All-atom Diffusion Transformers: Unified generative modelling of molecules and materials

*来源：ICML 2025

*作者：Meta FAIR 、剑桥大学与麻省理工学院的联合科研团队

*解读：入选 ICML 2025，Meta/剑桥/MIT 提出全原子扩散 Transformer 框架，首次实现周期性与非周期性原子系统统一生成

*论文：

https://go.hyper.ai/27d7U

Full-Atom MPNN 显式建模每个氨基酸残基的序列身份和侧链结构

Sidechain conditioning and modeling for full-atom protein sequence design with FAMPNN

*来源：ICML 2025

*作者：斯坦福大学的团队联合加州帕洛阿尔托市 Arc 研究院

*解读：同时处理蛋白质主链和侧链信息，斯坦福等基于消息传递神经网络实现全原子结构建模

*论文：

https://go.hyper.ai/JUJDq

La-Proteina 实现原子级蛋白质设计突破，高精度生成多达 800 个残基的蛋白质

La-Proteina: Atomistic Protein Generation via Partially Latent Flow Matching

*来源：arXiv

*作者：NVIDIA 的研究团队联合加拿大魁北克人工智能研究所 Mila

*解读：英伟达实现原子级蛋白质设计突破，高精度生成多达 800 个残基的蛋白质

https://go.hyper.ai/3csT5

深度学习模型 SUICA 实现空间转录组切片中任一位置基因表达的预测

SUICA: Learning Super-high Dimensional Sparse Implicit Neural Representations for Spatial Transcriptomics

*来源：ICML 2025

*作者：东京大学郑银强老师组，麦吉尔大学丁俊老师组

*解读：数据降噪/生物信号强化/缓解 dropout，深度学习模型 SUICA 实现空间转录组切片中任一位置基因表达的预测

*论文：

https://go.hyper.ai/C6Zcl

全新全原子蛋白质生成模型 APM 实现全原子设计与功能优化

An All-Atom Generative Model for Designing Protein Complexes

*来源：ICML 2025

*作者：湖南大学联合中国科学院大学、字节跳动 Seed 团队

*解读：支持蛋白质生成/折叠/逆折叠，湖大/中科大/字节提出 APM 模型，实现全原子设计与功能优化

*论文：

https://go.hyper.ai/TVp4i

深度学习模型 APEX，筛选潜在抗生素候选物

Computational exploration of global venoms for antimicrobial discovery with Venomics artificial intelligence

*来源：Nature Communications

*作者：美国宾夕法尼亚大学的研究团队

*解读：从动物毒液中挖掘 386 种全新抗菌肽，宾夕法尼亚大学开发深度学习模型 APEX，筛选潜在抗生素候选物

*论文：

https://www.nature.com/articles/s41467-025-60051-6[*]

蛋白质语言模型 Prot42 实现长序列建模与高亲和力结合剂生成

Prot42: a Novel Family of Protein Language Models for Target-aware Protein Binder Generation

*来源：arXiv

*作者：阿布扎比 Inception AI 研究所与硅谷 Cerebras Systems 公司的联合研究团队

*解读：8k 长序列建模，蛋白质语言模型 Prot42 仅利用目标蛋白序列即可生成高亲和力结合剂

*论文：

https://go.hyper.ai/cFupD

生物分子时间粗化动力学模拟器 UniSim，首次实现了跨分子类型、跨化学环境的统一时间粗化动力学模拟

UniSim: A Unified Simulator for Time-Coarsened Dynamics of Biomolecules

*来源：ICML 2025

*作者：清华大学、人民大学高瓴人工智能学院

*解读：入选 ICML 2025，清华/人大提出统一生物分子动力学模拟器 UniSim

*论文：

https://go.hyper.ai/5NWuO

SimplifiedBondfinder 基于 8.6 万蛋白质结构数据，融合量子力学计算的机器学习方法挖掘 69 个全新氮-氧-硫键

Revealing arginine-cysteine and glycine-cysteine NOS linkages by a systematic re-evaluation of protein structures

*来源：Communications Chemistry

*作者：乔治奥古斯特大学的团队

*解读：基于 8.6 万蛋白质结构数据，融合量子力学计算的机器学习方法挖掘 69 个全新氮-氧-硫键

*论文：

https://www.nature.com/articles/s42004-025-01535-w

利用蛋白质序列生成模型实现重叠基因设计，成功率极高

Design of overlapping genes using deep generative models of protein sequences

*来源：bioRxiv

*作者：美国华盛顿大学 David Baker 团队

*论文：

https://doi.org/10.1101/2025.05.06.652464

预测框架 PUPS 创新地结合蛋白质语言模型和图像修复模型, 实现单细胞级蛋白质定位

Prediction of protein subcellular localization in single cells

*来源：Nature Methods

*作者：麻省理工学院和哈佛大学的团队

*解读：融合蛋白质语言模型和图像修复模型，麻省理工与哈佛联手提出 PUPS，实现单细胞级蛋白质定位

*论文：

https://go.hyper.ai/LeaQF

首个跨分子种类统一生成框架 UniMoMo，实现多类型药物分子设计

UniMoMo: Unified Generative Modeling of 3D Molecules for De Novo Binder Design

*来源：ICML 2025

*作者：清华大学刘洋老师组联合人大黄文炳老师组和字节 AI 制药团队

*解读：入选 ICML 2025，清华/人大/字节提出首个跨分子种类统一生成框架 UniMoMo，实现多类型药物分子设计

*论文：

https://go.hyper.ai/wZXZZ

深度学习框架 STAIG，揭示肿瘤微环境中的详细基因信息

STAIG: Spatial transcriptomics analysis via image-aided graph contrastive learning for domain exploration and alignment-free integration

*来源：Nature Communications

*作者：日本东京大学医科学研究所的研究团队

*解读：无需预对齐即可消除批次效应，东京大学团队开发深度学习框架 STAIG，揭示肿瘤微环境中的详细基因信息

*论文：

https://www.nature.com/articles/s41467-025-56276-0

DRAKES 算法引入强化学习框架，首次实现了在离散扩散模型中对完整生成轨迹的可微奖励反向传播

Fine-Tuning Discrete Diffusion Models via Reward Optimization with Applications to DNA and Protein Design

*来源：ICLR 2025

*作者：美国麻省理工学院、哈佛大学、斯坦福大学、加州大学伯克利分校以及美国基因工程技术公司 Genentech 的研究人员

*解读：入选 ICLR 2025，MIT/UC 伯克利/哈佛/斯坦福等提出 DRAKES 算法，突破生物序列设计瓶颈

*论文：

https://doi.org/10.48550/arXiv.2410.13643

机器学习辅助的紫外吸收光谱法，基于 SVM 构建微生物污染检测模型

Machine learning aided UV absorbance spectroscopy for microbial contamination in cell therapy products

*来源：Scientific Reports

*作者：新加坡-麻省理工学院研究联盟、新加坡 A*SRL 实验室、新加坡国立大学、美国麻省理工学院的联合研究团队

*解读：30 分钟内输出结果，新加坡国立大学/MIT 等基于 SVM 构建微生物污染检测模型

*论文：

https://doi.org/10.1038/s41598-024-83114-y

蛋白质预训练新范式，解密蛋白质家族进化

Steering Protein Family Design through Profile Bayesian Flow

*来源：ICLR 2025

*作者：清华大学 AIR GenSI 研究组联合清华大学药学院

*解读：入选 ICLR 2025 Oral，清华 AIR 周浩团队提出蛋白质预训练新范式，解密蛋白质家族进化

*论文：

https://go.hyper.ai/Dg5ha

玻尔兹曼对齐技术蛋白质结合自由能预测达 SOTA

Boltzmann-Aligned Inverse Folding Model as a Predictor of Mutational Effects on Protein-Protein Interactions

*来源：ICLR 2025

*作者：浙江大学计算机科学与技术学院沈春华教授团队联合澳大利亚阿德莱德大学、美国东北大学等团队

*解读：入选 ICLR 2025！浙大沈春华等人提出玻尔兹曼对齐技术，蛋白质结合自由能预测达 SOTA

*论文：

https://arxiv.org/abs/2410.09543

Proteina 模型参数超 RFdiffusion 5 倍，从头设计蛋白质主链性能达 SOTA

Proteina: Scaling Flow-based Protein Structure Generative Models

*来源：ICLR 2025 Oral

*作者：英伟达联合魁北克人工智能研究所 Mila 、蒙特利尔大学、麻省理工学院的研究团队

*解读：模型参数超 RFdiffusion 5 倍！英伟达等发布 Proteina，从头设计蛋白质主链性能达 SOTA

*论文：

https://openreview.net/forum?id=TVQLu34bdw&nesting=2&sort=date-desc

UniGEM 模型首次基于扩散模型实现两任务协同增强

UniGEM: A Unified Approach to Generation and Property Prediction for Moleculess

*来源：ICLR 2025

*作者：清华大学联合中科院团队

*解读：首次实现分子生成与性质预测的统一，清华团队提出两阶段扩散生成机制，入选 ICLR 2025

*论文：

https://openreview.net/pdf?id=Lb91pXwZMR

RFdiffusion 再进化，实现原子级精度的抗体从头设计

Atomically accurate de novo design of antibodies with RFdiffusion

*来源：bioRxiv

*作者：David Baker 团队及其合作者

*解读：David Baker 团队新成果！RFdiffusion 再进化，实现原子级精度的抗体从头设计

*论文：

https://doi.org/10.1101/2024.03.14.585103

首个蛋白质 -RNA 语言模型融合方案，结合亲和力预测刷新 SOTA

CoPRA: Bridging Cross-domain Pretrained Sequence Models with Complex Structures for Protein-RNA Binding Affinity Prediction

*来源：arXiv

*作者：清华大学、伦敦大学学院、莫纳什大学、北京邮电大学的联合团队

*解读：入选 AAAI 2025！清华/伦敦大学学院等首创蛋白质-RNA 语言模型融合方案，结合亲和力预测刷新 SOTA

*论文：

https://arxiv.org/abs/2409.03773

Celcomen 模型首次在空间转录组学分析中实现因果推断可识别性

Estimation of single-cell and tissue perturbation effect in spatial transcriptomics via Spatial Causal Disentanglement

*来源：ICLR 2025

*作者：剑桥大学的研究团队

*解读：入选 ICLR 2025！剑桥大学提出 Celcomen 模型，首次在空间转录组学分析中实现因果推断可识别性

*论文：

https://openreview.net/forum?id=Tqdsruwyac

AlphaFold-Metainference 方法精准预测无序蛋白质结构集合

AlphaFold prediction of structural ensembles of disordered proteins

*来源：Nature Communications

*作者：剑桥大学的研究团队

*解读：AlphaFold 应用新里程碑！剑桥大学团队提出 AlphaFold-Metainference，精准预测无序蛋白质结构集合

*论文：

https://www.nature.com/articles/s41467-025-56572-9

第二代 RNA 结构预测算法，多项基准测试超越 SOTA

Ab initio RNA structure prediction with composite language model and denoised end-to-end learning

*来源：bioRxiv

*作者：新加坡国立大学的张阳教授团队

*解读：新加坡国立大学张阳团队开发第二代 RNA 结构预测算法，多项基准测试超越 SOTA

*论文：

https://www.biorxiv.org/content/10.1101/2025.03.05.641632v1

创新性 4D 扩散模型结合分子动力学模拟数据，能够同时预测多个时间步长的蛋白质运动轨迹

4D Diffusion for Dynamic Protein Structure Prediction with Reference and Motion Guidance

*来源：arXiv

*作者：复旦大学、上海科学智能研究院和南京大学的研究团队

*解读：AlphaFolding 填补蛋白质动态结构预测空白！复旦大学等提出 4D 扩散模型，成果入选 AAAI 2025

*论文：

https://arxiv.org/abs/2408.12419

PepPrCLIP 破解「不可成药」难题，创建几乎总是与目标蛋白质更匹配的肽

De novo design of peptide binders to conformationally diverse targets with contrastive language modeling

*来源：Science Advances

*作者：杜克大学的研究团队

*解读：有望开发癌症新疗法！杜克大学用 PepPrCLIP 破解「不可成药」难题

*论文：

https://www.science.org/doi/10.1126/sciadv.adr8638

MOLRL 基于强化学习优化靶向分子，成功率可达 100%

Targeted Molecular Generation With Latent Reinforcement Learning

*来源：ChemRxiv

*作者：Cellarity 公司和英伟达的研究团队

*解读：成功率可达 100%，药物开发公司 Cellarity 联手英伟达，基于强化学习优化靶向分子

*论文：

https://go.hyper.ai/H4JhR

进化驱动的病毒变异驱动力预测框架 E2VD，预测精度提升 67%

A unified evolution-driven deep learning framework for virus variation driver prediction

*来源：Nature Machine Intelligence

*作者：北京大学信息工程学院田永鸿教授、陈杰副教授，联合广州国家实验室周鹏研究员指导博士生聂志伟、硕士生刘旭东等

*解读：登 Nature 子刊！北大团队用 AI 预测新冠/艾滋病/流感病毒进化方向，精度提升 67%

*论文：

https://www.nature.com/articles/s42256-024-00966-9

AI+ 医疗健康

Healthcare Agent 问诊主动性及相关性超越 GPT-4 等闭源模型

Healthcare agent: eliciting the power of large language models for medical consultation

*来源：Nature Artificial Intelligence

*作者：武汉大学和南洋理工大学研究团队

*解读：从伦理保障到病史管理，武汉大学等提出 Healthcare Agent，问诊主动性及相关性超越 GPT-4 等闭源模型

*论文：

https://go.hyper.ai/09lYX

ICA-Var 的多变量分析方法，基于基因测序和机器学习的废水流行病学评估，病毒检出时间最高提前 4 周

Early detection of emerging SARS-CoV-2 Variants from wastewater through genome sequencing and machine learning

*来源：Nature Communications

*作者：内华达大学拉斯维加斯分校的研究团队

*解读：登 Nature 子刊，基于基因测序和机器学习的废水流行病学评估，病毒检出时间最高提前 4 周

*论文：

https://www.nature.com/articles/s41467-025-61280-5

医学 GraphRAG 刷新问答准确性记录，在 11 个数据集评测上达 SOTA

Medical Graph RAG: Towards Safe Medical Large Language Model via Graph Retrieval-Augmented Generation

*来源：ACL 2025

*作者：牛津大学、卡内基梅隆大学与爱丁堡大学的联合团队

*解读：ACL 2025 丨牛津大学等提出医学 GraphRAG，刷新问答准确性记录，在 11 个数据集评测上达 SOTA

*论文：

https://go.hyper.ai/OaMIE

首个 VR 运动干预系统 REVERIE（「灵境」），重塑青少年脑-身-心健康

Adaptive AI-based virtual reality sports system for adolescents with excess body weight: a randomized controlled trial

*来源：Nature Medicine

*解读：钱学森「灵境」预言成真！上交/上体/清华等构建全球首个 VR 运动干预系统 REVERIE，重塑青少年脑-身-心健康

*论文：

https://www.nature.com/articles/s41591-025-03724-5

NeuralCohort 方法基于多维度 EHR 数据实现细粒度患者队列建模，住院时间预测准确率提升 16.3%

NeuralCohort: Cohort-aware Neural Representation Learning for Healthcare Analytics

*来源：ICML 2025

*作者：新加坡国立大学联合浙江大学

*解读：新加坡国立大学基于多维度 EHR 数据实现细粒度患者队列建模，住院时间预测准确率提升 16.3%

*论文：

https://openreview.net/forum?id=bqQVa6VRvm

全球首个 HIE 领域临床思维图谱模型，神经认知结果预测任务上性能提升 15%

Visual and Domain Knowledge for Professional-level Graph-of-Thought Medical Reasoning

*来源：ICML 2025

*作者：哈佛医学院、波士顿儿童医院、纽约大学及 MIT-IBM 沃森实验室的跨学科团队

*解读：入选 ICML 2025！哈佛医学院等推出全球首个 HIE 领域临床思维图谱模型，神经认知结果预测任务上性能提升 15%

*论文：

https://openreview.net/forum?id=tnyxtaSve5

分层蒸馏多示例学习框架 HDMIL，快速处理千兆像素病理全切片图像

Fast and Accurate Gigapixel Pathological Image Classification with Hierarchical Distillation Multi-Instance Learning

*来源：CVPR 2025

*作者：哈尔滨工业大学江俊君教授、江奎副教授和张永兵教授团队

*解读：入选 CVPR 2025，哈工大团队提出分层蒸馏多示例学习框架 HDMIL，快速处理千兆像素病理全切片图像

*论文：

https://go.hyper.ai/B3RMf

专为 3D 血管分割而设计的基础模型 vesselFM，能够在零样本、单样本和少样本场景中实现优于现有先进模型的分割能力和泛化能力。

vesselFM: A Foundation Model for Universal 3D Blood Vessel Segmentation

*来源：CVPR 2025

*作者：苏黎世大学、苏黎世联邦理工学院和慕尼黑工业大学的研究人员

*解读：性能远超 SAM 系模型，苏黎世大学等开发通用 3D 血管分割基础模型，入选 CVPR 2025

*论文：

https://go.hyper.ai/lVad9

图编码混合生存模型基于 800 万真实数据，识别具有一致特征和生存结局的亚表型

Identification of predictive subphenotypes for clinical outcomes using real world data and machine learningn

*来源：Nature Communication

*作者：美国康奈尔大学与再生元制药公司

*解读：基于 800 万真实数据，康奈尔大学团队利用图神经网络精准预测肺癌患者生存期，发现 3 类致命亚型

*论文：

https://doi.org/10.1038/s41467-025-59092-8

融合策略 AI 模型，实现多中心、跨专科感染性休克死亡风险的精准预测

Artificial intelligence based multispecialty mortality prediction models for septic shock in a multicenter retrospective study

*来源：npj digital medicine

*作者：华中科技大学同济医学院附属同济医院、医药卫生管理学院研究团队

*解读：登 Nature 子刊！华中科技大学提出融合策略 AI 模型，实现多中心、跨专科感染性休克死亡风险的精准预测

*论文：

https://go.hyper.ai/faMLL

2 种新型癌症预测算法，基于血液指标实现 15 种癌症早期预测

Development and external validation of prediction algorithms to improve early diagnosis of cancer

*来源：Nature Communications

*作者：伦敦玛丽女王大学与牛津大学研究团队

*解读：牛津大学等深挖 746 万成年人健康数据开发早筛算法，基于血液指标实现 15 种癌症早期预测

*论文：

https://go.hyper.ai/L7gNm

多智能体对话 (MAC) 框架，显著提升 LLMs 的诊断能力

Enhancing diagnostic capability with multi-agents conversational large language models

*来源：npj digital medicine

*作者：四川大学华西医院、华西生物医学大数据中心、浙江大学医学院、北京邮电大学等团队

*解读：模拟医生会诊，四川大学华西医院团队开发多智能体对话框架助力疾病诊断

*论文：

https://www.nature.com/articles/s41746-025-01550-0#Tab6

首个全模态医疗图像重识别框架，在 11 个数据集上的评测达 SOTA

Towards All-in-One Medical Image Re-Identification

*来源：

*作者：上海人工智能实验室联合多家知名高校

*解读：入选 CVPR 2025，上海 AI Lab 等提出首个全模态医疗图像重识别框架，在 11 个数据集上的评测达 SOTA

*论文：

https://arxiv.org/pdf/2503.08173

多对一回归模型 M2OST，利用数字病理图像精准预测基因表达

M2OST: Many-to-one Regression for Predicting Spatial Transcriptomics from Digital Pathology Images

*来源：AAAI 2025

*作者：中国浙江大学的林兰芬教授研究团队联合浙江杭州之江实验室以及日本立命馆大学

*解读：入选 AAAI 2025，浙江大学提出多对一回归模型 M2OST，利用数字病理图像精准预测基因表达

*论文：

https://arxiv.org/abs/2409.15092

MindGlide 模型，实现多发性硬化症病变量化

Enabling new insights from old scans by repurposing clinical MRI archives for multiple sclerosis research

*来源：Nature Communications

*作者：英国伦敦大学学院团队

*解读：最大化挖掘临床 MRI 数据价值，UCL 团队提出 MindGlide 模型，实现多发性硬化症病变量化

*论文：

https://www.nature.com/articles/s41467-025-58274-8

全球首个针对大模型在辅助基层医生培训中实际效能的前瞻性真实世界证据

Large language models for diabetes training: a prospective study

*来源：Science Bulletin

*解读：医生培训迎来 DeepSeek 外挂！上体/上交/清华合作研究证实大模型可成为基层医生培训「黄金搭档」

*论文：

https://www.sciencedirect.com/science/article/pii/S2095927325000891

AcneDGNet 的深度学习算法准确率远超初级皮肤科医生，实现痤疮病变检测与分级

Evaluation of an acne lesion detection and severity grading model for Chinese population in online and offline healthcare scenarios

*来源：Scientific Reports

*作者：北京大学国际医院皮肤科韩钢文及其团队

*解读：准确率远超初级皮肤科医生，北大国际医院等开发深度学习算法，实现痤疮病变检测与分级

*论文：

https://www.nature.com/articles/s41598-024-84670-z

多模态医学影像分割模型，实现三维影像自动分割与交互

VISTA3D: A Unified Seamentation Foundation Model For 3D Medical lmaging

*来源：arXiv

*作者：英伟达联合阿肯色大学医学院、美国国立卫生研究院及牛津大学

*解读：精度提升 5.2%，英伟达等发布多模态医学影像分割模型，实现三维影像自动分割与交互

*论文：

https://doi.org/10.48550/arxiv.2406.05285

对多切面超声心动图的心脏结构进行精准分割，有效减少冗杂度

EchoONE: Segmenting Multiple echocardiography Planes in One Model

*来源：CVPR 2025

*作者：深圳大学医学部生物医学工程学院医学超声图像计算实验室

*解读：入选 CVPR 2025！深圳大学团队等提出 EchoONE，可精准分割多切面超声心动图

*论文：https://arxiv.org/abs/2412.02993

当前具有最大规模参数量的生物医学大语言模型 MedFound

A generalist medical language model for disease diagnosis assistance

*来源：Nature Medicine

*作者：北京邮电大学、北京大学第三医院、三峡大学

*解读：开源 1760 亿参数通用医学语言模型！北邮/北大/三峡大学提出 MedFound，推理能力接近专家医师

*论文：https://www.nature.com/articles/s41591-024-03416-6

对比度驱动医学图像分割的通用框架，实现医学图像精准分割

ConDSeg: A General Medical Image Segmentation Framework via Contrast-Driven Feature Enhancement

*来源：AAAI 2025

*作者：中国地质大学、百度

*解读：入选 AAAI 2025！解决医学图像分割软边界与共现难题，中国地质大学等提出图像分割模型 ConDSeg

*论文：

https://arxiv.org/abs/2412.08345

在 2 种传染性和 14 种非传染性疾病的 9 个基准数据集上均为最优

A multimodal multidomain multilingual medical foundation model for zero shot clinical diagnosis

*来源：Nature Portfolio

*作者：牛津大学、亚马逊、罗切斯特大学、 GlaxoSmithKline 、西湖大学医学人工智能实验室

*解读：牛津/亚马逊/西湖大学/腾讯等提出多模态多领域多语言医学模型 M³FM，可用于零样本临床诊断

*论文：

https://www.nature.com/articles/s41746-024-01339-7

分类准确率可达 97%，显著高于人类观察者的 82%

Deep learning versus human assessors: forensic sex estimation from three-dimensional computed tomography scans

*来源：Scientific Reports

*作者：澳大利亚西澳大学、新南威尔士大学、印度尼西亚哈萨努丁大学

*解读：准确率达 97%，澳大利亚团队新成果基于深度学习凭颅骨 CT 鉴定性别，赶超人类法医

*论文：

https://www.nature.com/articles/s41598-024-81718-y

双向逐步特征对齐的未对齐医学图像融合方法

BSAFusion: A Bidirectional Stepwise Feature Alignment Network for Unaligned Medical Image Fusion

*来源：AAAI 2025

*作者：昆明理工大学、中国海洋大学

*解读：入选 AAAI 2025！可实现多模态医学图像对齐与融合，国内两大高校联合提出 BSAFusion

*论文：https://arxiv.org/abs/2412.08050 新型分层多智能体框架，涵盖了 362 种常见疾病

KG4Diagnosis: A Hierarchical Multi-Agent LLM Framework with Knowledge Graph Enhancement for Medical Diagnosis

*来源：AAAI-25 Bridge Program

*作者：华威大学、克兰菲尔德大学、剑桥大学、牛津大学

*解读：助力诊断 362 种常见疾病！剑桥/牛津/华威大学等提出多 Agent 大语言模型框架，自动化构建医疗知识图谱

*论文：https://arxiv.org/abs/2406.05285

AI+ 材料化学

不足 10 万结构数据训练，PET-MAD 原子模拟精度媲美专业模型

PET-MAD as a lightweight universal interatomic potential for advanced materials modeling

*来源：Nature Communications

*作者：瑞士洛桑理工学院

*解读：以不足 10 万结构数据训练，瑞士洛桑联邦理工提出 PET-MAD，原子模拟精度媲美专业模型

*论文：

https://www.nature.com/articles/s41467-025-65662-7

计算成本减半，将人类的化学推理形式化为机器可理解的框架

ChemOntology: A Reusable Explicit Chemical Ontology-Based Method to Expedite Reaction Path Searches

*来源：ACS Catalysis

*作者：日本北海道大学

*解读：计算成本减半，化学反应发现工具 ChemOntology 将人类直觉「编码」到系统中，加速反应路径搜索

*论文：

https://pubs.acs.org/doi/10.1021/acscatal.5c06298

MOF-ChemUnity：一个结构化、可扩展、可拓展的知识图谱

MOF-ChemUnity: Literature-Informed Large Language Models for Metal–Organic Framework Research

*来源：ACS Publications

*作者：加拿大多伦多大学、加拿大国家研究委员会清洁能源创新研究中心

*解读：从 9,874 篇文献到 1.5 万晶体结构，MOF-ChemUnity 重构 MOF 全景知识，推动材料发现进入「可解释 AI」时代

*论文：

https://pubs.acs.org/doi/10.1021/jacs.5c11789

将 Graphormer 的全局注意力机制与 CGCNN 相融合

CGformer: Transformer-enhanced crystal graph network with global attention for material property prediction

*来源：Matter

*作者：上海交通大学人工智能与微结构实验室

*解读：新材料研发提速！上交大团队开发新 AI 材料设计模型 CGformer，融合全局注意力机制

*论文：

https://www.cell.com/matter/abstract/S2590-2385(25)00423-0

FASTSOLV 模型：实现任意温度下的小分子溶解度预测

Data-driven organic solubility prediction at the limit of aleatoric uncertainty

*来源：Nature Communication

*作者：麻省理工学院

*解读：推理速度快 50 倍，MIT 团队提出 FASTSOLV 模型，实现任意温度下的小分子溶解度预测

*论文：

https://www.nature.com/articles/s41467-025-62717-7

利用 MOFs 合成后即可获得的信息来预测其潜在性能和用途

Connecting metal-organic framework synthesis to applications using multimodal machine learning

*来源：Nature Communications

*作者：加拿大多伦多大学

*解读：多模态模型加速新材料与工业应用匹配，无需完整晶体结构即可预测材料性质

*论文：

https://www.nature.com/articles/s41467-025-60796-0

首次构建能够同时处理超材料设计三大模态的统一框架

UNIMATE: A Unified Model for Mechanical Metamaterial Generation, Property Prediction, and Condition Confirmation

*来源：ICML 2025

*作者：美国弗吉尼亚理工学院、 Meta AI

*解读：超材料设计破局！Meta AI 等提出 UNIMATE，首次实现拓扑生成/性能预测等任务的统一建模

*论文：

https://go.hyper.ai/FoAWw

覆盖 2 亿分子质谱图，构建全球最大规模质谱数据集 GeMS

Self-supervised learning of molecular representations from millions of tandem mass spectra using DreaMS

*来源：Nature Biotechnology

*作者：捷克科学院有机化学与生物化学研究所

*解读：覆盖 2 亿分子质谱图，捷克科学院发布 DreaMS 模型，构建全球最大规模质谱数据集 GeMS

*论文：

https://go.hyper.ai/uNbqL

在单一机器学习模型中同时学习广义势能及其对外部刺激的响应函数

Unified differentiable learning of electric response

*来源：Nature Communications

*作者：哈佛大学、 Robert Bosch LLC

*解读：从石英到铁电材料，哈佛大学提出等变机器学习框架，加速材料大规模电场模拟

*论文：

https://go.hyper.ai/18TWg

基于 LLM 从 8.8 万篇论文中提取 1.4 万种材料的化学组成

Data-driven material screening of secondary and natural cementitious precursors

*来源：Communication Materials

*作者：美国麻省理工学院

*解读：MIT 团队利用大模型筛选 25 类水泥熟料替代材料，相当于减排 12 亿吨温室气体

*论文：

https://go.hyper.ai/ZOAaW

将全面的 SSE 数据库与 LLM 和 ab initio 元动力学模拟相结合

Unraveling the Complexity of Divalent Hydride Electrolytes in Solid-State Batteries via a Data-Driven Framework with Large Language Model

*来源：Angewandte Chemie-International Edition

*作者：日本东北大学、中国四川大学、日本芝浦工业大学

*解读：中日团队联合攻关，利用大模型解析氢化物固态电解质传导机制，建立可靠活化能预测模型

*论文：

https://go.hyper.ai/isQRi

在高达 TB 级别的多组分高分辨质谱数据库中，检索离子同位素分布

Discovering organic reactions with a machine-learning-powered deciphering of tera-scale mass spectrometry data

*来源：Nature Communications

*作者：俄罗斯科学院

*解读：登 Nature 子刊，俄罗斯研究团队基于机器学习实现万亿级质谱数据搜索，发现未知化学反应

*论文：

https://go.hyper.ai/ak7bN

一种基于扩散模型的生成式人工智能结构解析方法 PXRDnet

Ab initio structure solutions from nanocrystalline powder diffraction data via diffusion models

*来源：Nature Materials

*作者：哥伦比亚大学、斯坦福大学

*解读：首次实现纳米晶体端到端解析，哥大团队提出 PXRDnet，成功解析 200 种复杂模拟纳米晶体

*论文：

https://go.hyper.ai/r1K6b

基于机器学习成功制备 10 种光驱动有机晶体

Machine learning-driven optimization of the output force in photo-actuated organic crystals

*来源：Digital Discovery

*作者：日本早稻田大学

*解读：效率提升 73 倍！日本研究团队基于机器学习成功制备 10 种光驱动有机晶体

*论文：

https://go.hyper.ai/RU0ro

成功预测金属的电声相互作用，效率提高 5 倍

Accelerating superconductor discovery through tempered deep learning of the electron-phonon spectral function

*来源：npj Computational Materials

*作者：美国佛罗里达大学、田纳西大学

*解读：超导材料搜索效率提升 5 倍！佛罗里达大学等用深度学习变革材料发现，成果登 Nature 子刊

*论文：

https://www.nature.com/articles/s41524-024-01475-4

通过梯度提升决策树技术，实现对 RHEAs 和 RCCAs 抗氧化性能的高精度预测

Advancing refractory high entropy alloy development with AI-predictive models for high temperature oxidation resistance

*来源：Scripta Materialia

*作者：法国波尔多大学、日本国立材料科学研究所、中国台湾国立清华大学、比利时鲁汶大学、比利时 WEL 研究所

*解读：高熵合金新发现！多团队联手实现抗氧化性高精度预测，增加铝/铬/硅含量可有效改善

*论文：

https://doi.org/10.1016/j.scriptamat.2024.116394

结合局部消息传递与全局注意力机制，能精准预测分子光电性能

RingFormer: A Ring-Enhanced Graph Transformer for Organic Solar Cell Property Prediction

*来源：AAAI 2025

*作者：香港理工大学

*解读：入选 AAAI 2025！香港理工大学团队基于图 Transformer，精准预测有机材料分子光电性能

*论文：

https://doi.org/10.48550/arXiv.2412.09030

一种无机逆合成规划方法，成功地促进了无机材料合成的效率和准确性

Retrieval-Retro: Retrieval-based Inorganic Retrosynthesis with Expert Knowledge

*来源：NeurIPS 2024

*作者：韩国化学技术研究所、韩国科学技术院

*解读：无机材料逆合成效率飙升，韩国团队推出 Retrieval-Retro，成果入选 NeurIPS 2024

*论文：

https://doi.org/10.48550/arXiv.2410.21341

基于扩散模型，根据目标空间群生成结构

A generative model for inorganic materials design

*来源：Nature

*作者：微软

*解读：直接设计目标属性材料！微软 MatterGen 模型重磅开源，用生成式 AI 重新定义材料逆向设计新范式

*论文：

https://www.nature.com/articles/s41586-025-08628-5

AI+ 农林畜牧业

覆盖近 1.5 万个物种，刷新生物声学分类检测 SOTA

Perch 2.0: The Bittern Lesson for Bioacoustics

*来源：arXiv

*作者：Google DeepMind 、 Google Research

*解读：覆盖近 1.5 万个物种，谷歌 DeepMind 发布 Perch 2.0，刷新生物声学分类检测 SOTA

*论文：

https://arxiv.org/abs/2508.04665

首次将 219 个基于傅里叶变换、香农熵等数学理论的新型序列描述符纳入特征空间

PlantLncBoost: key features for plant lncRNA identification and significant improvement in accuracy and generalization

*来源：New Phytologist

*作者：山东理工大学、北京林业大学、广东省农业科学院、巴西圣保罗大学、英国罗莎琳德富兰克林医科大学、瑞典于默奥大学

*解读：整合多源植物转录组数据，山东理工大学等构建 PlantLncBoost 模型，跨物种 lncRNA 预测准确率最高达 96%

*论文：

https://go.hyper.ai/F7pkc

AI+ 气象研究

攻克了「渐进式噪声调度」与「时间损失加权」的协同设计问题

Elucidated Rolling Diffusion Models for Probabilistic Weather Forecasting

*来源：NeurIPS 2025

*作者：英伟达、加州大学圣迭戈分校

*解读：入选 NeurIPS 2025，英伟达提出 ERDM 模型，解长期预报难题，中远期预报持续领先 EDM 基准

*论文：

https://doi.org/10.48550/arXiv.2506.20024

一种新型潜在扩散模型，可用于高精度概率性次季节至季节尺度天气预报

OmniCast: A Masked Latent Diffusion Model for Weather Forecasting Across Time Scales

*来源：NeurIPS 2025

*作者：加州大学洛杉矶分校、美国阿贡国家实验室

*解读：效率至高提升 20 倍！加州大学开发 OmniCast，解决自回归天气预报模型误差累计问题

*论文：

https://go.hyper.ai/YANIu

超本地预测模型，实现了提前数天预测大部分强降雨事件

Hyperlocal Extreme Rainfall Forecasts in Mumbai: Convolutional Neural Network Transfer Learning-Based Downscaling Approach

*来源：SSRN

*作者：印度理工学院孟买分校、马里兰大学

*解读：准确度提升 400%！印度季风预测模型基于 36 个气象站点，实现城区尺度精细预报

*论文：

https://go.hyper.ai/j05Vt

仅需 2 分钟，ACE2 可完成一次 4 个月季节预报

Skilful global seasonal predictions from a machine learning weather model trained on reanalysis data

*来源：npj Climate and Atmospheric Science

*作者：英国埃克塞特哈德利中心气象局、埃克塞特大学、美国艾伦人工智能研究所（Ai2）

*解读：机器学习 vs. 动力学模型，Ai2 最新研究：仅需 2 分钟，ACE2 可完成一次 4 个月季节预报

*论文：

https://go.hyper.ai/YyRfT

一个将球面信号处理与隐马尔可夫集合框架相结合的概率机器学习天气预报系统

FourCastNet 3: A geometric approach to probabilistic machine-learning weather forecasting at scale

*来源：arXiv

*作者：英伟达、美国劳伦斯伯克利国家实验室、加州大学伯克利分校、美国加州理工学院

*解读：1 分钟内完成 15 天预报，英伟达/UC 伯克利等提出机器学习天气预报系统 FCN3，支持单卡极速推理

*论文：

https://arxiv.org/pdf/2507.12144

无需依赖传统数值天气预报模型，即可实现高技巧性的天气预报

End-to-end data-driven weather prediction

*来源：Nature

*作者：剑桥大学、图灵研究所、多伦多大学、微软科学智能中心、欧洲中期天气预报中心、英国南极调查局、谷歌 DeepMind

*解读：登 Nature，剑桥大学等发布首个端到端的数据驱动天气预报系统，预测速度提升数十倍

*论文：

https://www.nature.com/articles/s41586-025-08897-0

AI+ 天文学

利用卷积神经网络，成功识别出 7 个高质量类星体透镜候选体

Quasars acting as Strong Lenses Found in DESI DR1

*来源：arXiv

*作者：斯坦福大学、 SLAC 国家加速器实验室、北京大学、意大利国家天体物理研究院布雷拉天文台、伦敦大学学院、加州大学伯克利分校

*解读：斯坦福/北大/UCL/UC 伯克利联手，利用 CNN 从 81 万类星体中精准识别 7 个罕见透镜样本

*论文：

https://arxiv.org/abs/2511.02009

首个面向天文学的大规模多模态基础模型家族 AION-1

AION-1: Omnimodal Foundation Model for Astronomical Sciences

*来源：NeurIPS 2025

*作者：加州大学伯克利分校、剑桥大学、牛津大学等

*解读：首个天文多模态基础模型 AION-1 诞生！UC 伯克利等基于 2 亿天文目标预训练，成功构建泛化性多模态天文 AI 框架

*论文：

https://openreview.net/forum?id=6gJ2ZykQ5W

查看更多前沿论文：

https://hyper.ai/cn/papers

查看研究相关数据集：

https://hyper.ai/cn/datasets

AI+ 生物医药

新的生成式模型及新评测基准，重塑无序蛋白集合预测能力

Advancing Protein Ensemble Predictions Across the Order-Disorder Continuum

*来源：bioRxiv

*作者：Peptone 公司、英伟达公司、麻省理工学院等组成的联合团队

*解读：重塑无序蛋白集合预测能力，英伟达/MIT/牛津大学/哥本哈根大学/Peptone 等发布生成式模型及新评测基准

*论文：

https://www.biorxiv.org/content/10.1101/2025.10.18.680935v1

首个经人类皮层数据验证的神经元建模框架 NOBLE，超越传统 4200 倍速

NOBLE – Neural Operator with Biologically-informed Latent Embeddings to Capture Experimental Variability in Biological Neuron Models

*来源：NeurIPS 2025

*作者：苏黎世联邦理工学院、加州理工学院与阿尔伯塔大学等机构的联合团队

*解读：超越传统 4200 倍速！苏黎世联邦理工提出 NOBLE，首个经人类皮层数据验证的神经元建模框架

*论文：

https://go.hyper.ai/Ramfp

图神经网络 PLACER，解决蛋白质构象异质性

Modeling protein-small molecule conformational ensembles with PLACER

*来源：《美国国家科学院院刊》（PNAS）

*作者：华盛顿大学 David Baker 教授的研究团队

*解读：解决蛋白质构象异质性的原子级建模挑战！David Baker 团队 PLACER 框架解析

*论文：

https://www.biorxiv.org/content/10.1101/2024.09.25.614868v2

Squidiff 实现多场景转录组模拟，助力精准医学与空间医学发展 Squidiff: predicting cellular development and responses to perturbations using a diffusion model

*来源：Nature Methods

*作者：哥伦比亚大学、斯坦福大学的联合研究团队

*解读：哥大/斯坦福联手！Squidiff 实现多场景转录组模拟，助力精准医学与空间医学发展

*论文：

https://www.nature.com/articles/s41592-025-02877-y

血液细胞图像分类器，扩散模型助力白血病发现，能力超越临床专家

Deep generative classification of blood cell morphology

*来源：Nature

*作者：英国剑桥大学的研究团队

*解读：剑桥大学研发血液细胞图像分类器，扩散模型助力白血病发现，能力超越临床专家

*论文：

https://www.nature.com/articles/s42256-025-01122-7

Ctrl-DNA 框架，实现特定细胞基因表达的「靶向控制」

Ctrl-DNA: Constrained Reinforcement Learning for Cell-Specific Cis-Regulatory Element Design

*来源：NeurIPS 2025

*作者：多伦多大学团队联合昌平实验室

*解读：入选 NeurIPS 2025，多伦多大学等提出 Ctrl-DNA 框架，实现特定细胞基因表达的「靶向控制」

*论文：

https://arxiv.org/abs/2505.20578

BoltzGen，可跨分子类型设计蛋白结合物，66% 靶标获纳摩尔级亲和力

BoltzGen: Toward Universal Binder Design

*来源：

*作者：麻省理工学院与 Boltz 等多家机构

*解读：MIT 团队开源 BoltzGen，可跨分子类型设计蛋白结合物，66% 靶标获纳摩尔级亲和力

*论文：

https://go.hyper.ai/3sx2K

全新蛋白质动态融合表征框架 FusionProt，实现迭代式信息交换，多项任务性能达到 SOTA

FusionProt: Fusing Sequence and Structural Information for Unified Protein Representation Learning

*来源：bioRxiv

*作者：以色列理工学院联合 Meta AI 的研究团队

*解读：Meta AI 等提出全新蛋白质动态融合表征框架 FusionProt，实现迭代式信息交换，多项任务性能达到 SOTA

*论文：

https://go.hyper.ai/OXLYl

转录组引导的扩散模型 MorphDiff，为表型药物研发提速

Prediction of cellular morphology changes under perturbations with a transcriptome-guided diffusion model

*来源：Nature Communications

*作者：中国香港中文大学、穆罕默德·本·扎耶德人工智能大学等机构的研究人员

*解读：关联基因表达数据与细胞形态图像，港中文等开发转录组引导的扩散模型，为表型药物研发提速

*论文：

https://www.nature.com/articles/s41467-025-63478-z

AlphaPPIMI，PPIs 界面调节剂预测性能超越现有方法

Alphappimi: a comprehensive deep learning framework for predicting PPI-modulator interactions

*来源：Journal of Cheminformatics

*作者：中国石油大学和延世大学的联合研究团队

*解读：从「盲筛」到「精准定位」，中国石油大学团队推出 AlphaPPIMI，PPIs 界面调节剂预测性能超越现有方法

*论文：

https://jcheminf.biomedcentral.com/articles/10.1186/s13321-025-01077-2

scSiameseClu 在无监督单细胞聚类任务中达到 SOTA 性能

scSiameseClu: A Siamese Clustering Framework for Interpreting single-cell RNA Sequencing Data

*来源：IJCAI 2025

*作者：中国科学院、东北农业大学、澳门大学与吉林大学的研究团队

*解读：IJCAI 2025 丨 7 个数据集验证：scSiameseClu 在无监督单细胞聚类任务中达到 SOTA 性能

*论文：

https://go.hyper.ai/00BhP

融合神经网络框架，高效预测蛋白质序列的多金属结合位点

A Modular Fusion Neural Network Approach to Efficiently Predict Multi-Metal Binding Sites in Protein Sequences

*来源：bioRxiv

*作者：香港科技大学的研究团队

*解读：香港科技大学提出融合神经网络框架，高效预测蛋白质序列的多金属结合位点

*论文：

https://go.hyper.ai/Y7DNU

ReaSyn 借鉴思维链类比分子合成，实现超高重建率与路径多样性

Rethinking Molecule Synthesizability with Chain-of-Reaction

*来源：arXiv

*作者：英伟达研究团队

*解读：英伟达提出 ReaSyn，借鉴思维链类比分子合成，实现超高重建率与路径多样性

*论文：

https://arxiv.org/abs/2509.16084

无序区域结合蛋白设计新方法，专攻不可成药靶点

Design of intrinsically disordered region binding proteins

*来源：Science

*作者：David Baker 及其团队

*解读：登 Science，David Baker 团队提出无序区域结合蛋白设计新方法，专攻不可成药靶点

*论文：

https://www.science.org/doi/10.1126/science.adr8063

AMix-1 实现可扩展通用的蛋白质设计，设计蛋白变体活性提升 50 倍

AMix-1: A Pathway to Test-Time Scalable Protein Foundation Model

*来源：arXiv

*作者：清华大学智能产业研究院（AIR）周浩课题组联合上海人工智能实验室

*解读：设计蛋白变体活性提升 50 倍！清华 AIR 周浩团队基于贝叶斯流网络提出 AMix-1，实现可扩展通用的蛋白质设计

*论文：

https://go.hyper.ai/6Lz0c

双向布朗桥扩散模型输出方差显著降低，提升虚拟染色结果可重复性

Virtual staining of label-free tissue in imaging mass spectrometry

*来源：Science Advances

*作者：UCLA 研究团队

*解读：输出方差显著降低！UCLA 发布双向布朗桥扩散模型，提升虚拟染色结果可重复性

*论文：

https://go.hyper.ai/X9GEn

全原子扩散 Transformer ADiT，打破了周期性与非周期性系统的建模壁垒

All-atom Diffusion Transformers: Unified generative modelling of molecules and materials

*来源：ICML 2025

*作者：Meta FAIR 、剑桥大学与麻省理工学院的联合科研团队

*解读：入选 ICML 2025，Meta/剑桥/MIT 提出全原子扩散 Transformer 框架，首次实现周期性与非周期性原子系统统一生成

*论文：

https://go.hyper.ai/27d7U

Full-Atom MPNN 显式建模每个氨基酸残基的序列身份和侧链结构

Sidechain conditioning and modeling for full-atom protein sequence design with FAMPNN

*来源：ICML 2025

*作者：斯坦福大学的团队联合加州帕洛阿尔托市 Arc 研究院

*解读：同时处理蛋白质主链和侧链信息，斯坦福等基于消息传递神经网络实现全原子结构建模

*论文：

https://go.hyper.ai/JUJDq

La-Proteina 实现原子级蛋白质设计突破，高精度生成多达 800 个残基的蛋白质

La-Proteina: Atomistic Protein Generation via Partially Latent Flow Matching

*来源：arXiv

*作者：NVIDIA 的研究团队联合加拿大魁北克人工智能研究所 Mila

*解读：英伟达实现原子级蛋白质设计突破，高精度生成多达 800 个残基的蛋白质

https://go.hyper.ai/3csT5

深度学习模型 SUICA 实现空间转录组切片中任一位置基因表达的预测

SUICA: Learning Super-high Dimensional Sparse Implicit Neural Representations for Spatial Transcriptomics

*来源：ICML 2025

*作者：东京大学郑银强老师组，麦吉尔大学丁俊老师组

*解读：数据降噪/生物信号强化/缓解 dropout，深度学习模型 SUICA 实现空间转录组切片中任一位置基因表达的预测

*论文：

https://go.hyper.ai/C6Zcl

全新全原子蛋白质生成模型 APM 实现全原子设计与功能优化

An All-Atom Generative Model for Designing Protein Complexes

*来源：ICML 2025

*作者：湖南大学联合中国科学院大学、字节跳动 Seed 团队

*解读：支持蛋白质生成/折叠/逆折叠，湖大/中科大/字节提出 APM 模型，实现全原子设计与功能优化

*论文：

https://go.hyper.ai/TVp4i

深度学习模型 APEX，筛选潜在抗生素候选物

Computational exploration of global venoms for antimicrobial discovery with Venomics artificial intelligence

*来源：Nature Communications

*作者：美国宾夕法尼亚大学的研究团队

*解读：从动物毒液中挖掘 386 种全新抗菌肽，宾夕法尼亚大学开发深度学习模型 APEX，筛选潜在抗生素候选物

*论文：

https://www.nature.com/articles/s41467-025-60051-6[*]

蛋白质语言模型 Prot42 实现长序列建模与高亲和力结合剂生成

Prot42: a Novel Family of Protein Language Models for Target-aware Protein Binder Generation

*来源：arXiv

*作者：阿布扎比 Inception AI 研究所与硅谷 Cerebras Systems 公司的联合研究团队

*解读：8k 长序列建模，蛋白质语言模型 Prot42 仅利用目标蛋白序列即可生成高亲和力结合剂

*论文：

https://go.hyper.ai/cFupD

生物分子时间粗化动力学模拟器 UniSim，首次实现了跨分子类型、跨化学环境的统一时间粗化动力学模拟

UniSim: A Unified Simulator for Time-Coarsened Dynamics of Biomolecules

*来源：ICML 2025

*作者：清华大学、人民大学高瓴人工智能学院

*解读：入选 ICML 2025，清华/人大提出统一生物分子动力学模拟器 UniSim

*论文：

https://go.hyper.ai/5NWuO

SimplifiedBondfinder 基于 8.6 万蛋白质结构数据，融合量子力学计算的机器学习方法挖掘 69 个全新氮-氧-硫键

Revealing arginine-cysteine and glycine-cysteine NOS linkages by a systematic re-evaluation of protein structures

*来源：Communications Chemistry

*作者：乔治奥古斯特大学的团队

*解读：基于 8.6 万蛋白质结构数据，融合量子力学计算的机器学习方法挖掘 69 个全新氮-氧-硫键

*论文：

https://www.nature.com/articles/s42004-025-01535-w

利用蛋白质序列生成模型实现重叠基因设计，成功率极高

Design of overlapping genes using deep generative models of protein sequences

*来源：bioRxiv

*作者：美国华盛顿大学 David Baker 团队

*论文：

https://doi.org/10.1101/2025.05.06.652464

预测框架 PUPS 创新地结合蛋白质语言模型和图像修复模型, 实现单细胞级蛋白质定位

Prediction of protein subcellular localization in single cells

*来源：Nature Methods

*作者：麻省理工学院和哈佛大学的团队

*解读：融合蛋白质语言模型和图像修复模型，麻省理工与哈佛联手提出 PUPS，实现单细胞级蛋白质定位

*论文：

https://go.hyper.ai/LeaQF

首个跨分子种类统一生成框架 UniMoMo，实现多类型药物分子设计

UniMoMo: Unified Generative Modeling of 3D Molecules for De Novo Binder Design

*来源：ICML 2025

*作者：清华大学刘洋老师组联合人大黄文炳老师组和字节 AI 制药团队

*解读：入选 ICML 2025，清华/人大/字节提出首个跨分子种类统一生成框架 UniMoMo，实现多类型药物分子设计

*论文：

https://go.hyper.ai/wZXZZ

深度学习框架 STAIG，揭示肿瘤微环境中的详细基因信息

STAIG: Spatial transcriptomics analysis via image-aided graph contrastive learning for domain exploration and alignment-free integration

*来源：Nature Communications

*作者：日本东京大学医科学研究所的研究团队

*解读：无需预对齐即可消除批次效应，东京大学团队开发深度学习框架 STAIG，揭示肿瘤微环境中的详细基因信息

*论文：

https://www.nature.com/articles/s41467-025-56276-0

DRAKES 算法引入强化学习框架，首次实现了在离散扩散模型中对完整生成轨迹的可微奖励反向传播

Fine-Tuning Discrete Diffusion Models via Reward Optimization with Applications to DNA and Protein Design

*来源：ICLR 2025

*作者：美国麻省理工学院、哈佛大学、斯坦福大学、加州大学伯克利分校以及美国基因工程技术公司 Genentech 的研究人员

*解读：入选 ICLR 2025，MIT/UC 伯克利/哈佛/斯坦福等提出 DRAKES 算法，突破生物序列设计瓶颈

*论文：

https://doi.org/10.48550/arXiv.2410.13643

机器学习辅助的紫外吸收光谱法，基于 SVM 构建微生物污染检测模型

Machine learning aided UV absorbance spectroscopy for microbial contamination in cell therapy products

*来源：Scientific Reports

*作者：新加坡-麻省理工学院研究联盟、新加坡 A*SRL 实验室、新加坡国立大学、美国麻省理工学院的联合研究团队

*解读：30 分钟内输出结果，新加坡国立大学/MIT 等基于 SVM 构建微生物污染检测模型

*论文：

https://doi.org/10.1038/s41598-024-83114-y

蛋白质预训练新范式，解密蛋白质家族进化

Steering Protein Family Design through Profile Bayesian Flow

*来源：ICLR 2025

*作者：清华大学 AIR GenSI 研究组联合清华大学药学院

*解读：入选 ICLR 2025 Oral，清华 AIR 周浩团队提出蛋白质预训练新范式，解密蛋白质家族进化

*论文：

https://go.hyper.ai/Dg5ha

玻尔兹曼对齐技术蛋白质结合自由能预测达 SOTA

Boltzmann-Aligned Inverse Folding Model as a Predictor of Mutational Effects on Protein-Protein Interactions

*来源：ICLR 2025

*作者：浙江大学计算机科学与技术学院沈春华教授团队联合澳大利亚阿德莱德大学、美国东北大学等团队

*解读：入选 ICLR 2025！浙大沈春华等人提出玻尔兹曼对齐技术，蛋白质结合自由能预测达 SOTA

*论文：

https://arxiv.org/abs/2410.09543

Proteina 模型参数超 RFdiffusion 5 倍，从头设计蛋白质主链性能达 SOTA

Proteina: Scaling Flow-based Protein Structure Generative Models

*来源：ICLR 2025 Oral

*作者：英伟达联合魁北克人工智能研究所 Mila 、蒙特利尔大学、麻省理工学院的研究团队

*解读：模型参数超 RFdiffusion 5 倍！英伟达等发布 Proteina，从头设计蛋白质主链性能达 SOTA

*论文：

https://openreview.net/forum?id=TVQLu34bdw&nesting=2&sort=date-desc

UniGEM 模型首次基于扩散模型实现两任务协同增强

UniGEM: A Unified Approach to Generation and Property Prediction for Moleculess

*来源：ICLR 2025

*作者：清华大学联合中科院团队

*解读：首次实现分子生成与性质预测的统一，清华团队提出两阶段扩散生成机制，入选 ICLR 2025

*论文：

https://openreview.net/pdf?id=Lb91pXwZMR

RFdiffusion 再进化，实现原子级精度的抗体从头设计

Atomically accurate de novo design of antibodies with RFdiffusion

*来源：bioRxiv

*作者：David Baker 团队及其合作者

*解读：David Baker 团队新成果！RFdiffusion 再进化，实现原子级精度的抗体从头设计

*论文：

https://doi.org/10.1101/2024.03.14.585103

首个蛋白质 -RNA 语言模型融合方案，结合亲和力预测刷新 SOTA

CoPRA: Bridging Cross-domain Pretrained Sequence Models with Complex Structures for Protein-RNA Binding Affinity Prediction

*来源：arXiv

*作者：清华大学、伦敦大学学院、莫纳什大学、北京邮电大学的联合团队

*解读：入选 AAAI 2025！清华/伦敦大学学院等首创蛋白质-RNA 语言模型融合方案，结合亲和力预测刷新 SOTA

*论文：

https://arxiv.org/abs/2409.03773

Celcomen 模型首次在空间转录组学分析中实现因果推断可识别性

Estimation of single-cell and tissue perturbation effect in spatial transcriptomics via Spatial Causal Disentanglement

*来源：ICLR 2025

*作者：剑桥大学的研究团队

*解读：入选 ICLR 2025！剑桥大学提出 Celcomen 模型，首次在空间转录组学分析中实现因果推断可识别性

*论文：

https://openreview.net/forum?id=Tqdsruwyac

AlphaFold-Metainference 方法精准预测无序蛋白质结构集合

AlphaFold prediction of structural ensembles of disordered proteins

*来源：Nature Communications

*作者：剑桥大学的研究团队

*解读：AlphaFold 应用新里程碑！剑桥大学团队提出 AlphaFold-Metainference，精准预测无序蛋白质结构集合

*论文：

https://www.nature.com/articles/s41467-025-56572-9

第二代 RNA 结构预测算法，多项基准测试超越 SOTA

Ab initio RNA structure prediction with composite language model and denoised end-to-end learning

*来源：bioRxiv

*作者：新加坡国立大学的张阳教授团队

*解读：新加坡国立大学张阳团队开发第二代 RNA 结构预测算法，多项基准测试超越 SOTA

*论文：

https://www.biorxiv.org/content/10.1101/2025.03.05.641632v1

创新性 4D 扩散模型结合分子动力学模拟数据，能够同时预测多个时间步长的蛋白质运动轨迹

4D Diffusion for Dynamic Protein Structure Prediction with Reference and Motion Guidance

*来源：arXiv

*作者：复旦大学、上海科学智能研究院和南京大学的研究团队

*解读：AlphaFolding 填补蛋白质动态结构预测空白！复旦大学等提出 4D 扩散模型，成果入选 AAAI 2025

*论文：

https://arxiv.org/abs/2408.12419

PepPrCLIP 破解「不可成药」难题，创建几乎总是与目标蛋白质更匹配的肽

De novo design of peptide binders to conformationally diverse targets with contrastive language modeling

*来源：Science Advances

*作者：杜克大学的研究团队

*解读：有望开发癌症新疗法！杜克大学用 PepPrCLIP 破解「不可成药」难题

*论文：

https://www.science.org/doi/10.1126/sciadv.adr8638

MOLRL 基于强化学习优化靶向分子，成功率可达 100%

Targeted Molecular Generation With Latent Reinforcement Learning

*来源：ChemRxiv

*作者：Cellarity 公司和英伟达的研究团队

*解读：成功率可达 100%，药物开发公司 Cellarity 联手英伟达，基于强化学习优化靶向分子

*论文：

https://go.hyper.ai/H4JhR

进化驱动的病毒变异驱动力预测框架 E2VD，预测精度提升 67%

A unified evolution-driven deep learning framework for virus variation driver prediction

*来源：Nature Machine Intelligence

*作者：北京大学信息工程学院田永鸿教授、陈杰副教授，联合广州国家实验室周鹏研究员指导博士生聂志伟、硕士生刘旭东等

*解读：登 Nature 子刊！北大团队用 AI 预测新冠/艾滋病/流感病毒进化方向，精度提升 67%

*论文：

https://www.nature.com/articles/s42256-024-00966-9

AI+ 医疗健康

Healthcare Agent 问诊主动性及相关性超越 GPT-4 等闭源模型

Healthcare agent: eliciting the power of large language models for medical consultation

*来源：Nature Artificial Intelligence

*作者：武汉大学和南洋理工大学研究团队

*解读：从伦理保障到病史管理，武汉大学等提出 Healthcare Agent，问诊主动性及相关性超越 GPT-4 等闭源模型

*论文：

https://go.hyper.ai/09lYX

ICA-Var 的多变量分析方法，基于基因测序和机器学习的废水流行病学评估，病毒检出时间最高提前 4 周

Early detection of emerging SARS-CoV-2 Variants from wastewater through genome sequencing and machine learning

*来源：Nature Communications

*作者：内华达大学拉斯维加斯分校的研究团队

*解读：登 Nature 子刊，基于基因测序和机器学习的废水流行病学评估，病毒检出时间最高提前 4 周

*论文：

https://www.nature.com/articles/s41467-025-61280-5

医学 GraphRAG 刷新问答准确性记录，在 11 个数据集评测上达 SOTA

Medical Graph RAG: Towards Safe Medical Large Language Model via Graph Retrieval-Augmented Generation

*来源：ACL 2025

*作者：牛津大学、卡内基梅隆大学与爱丁堡大学的联合团队

*解读：ACL 2025 丨牛津大学等提出医学 GraphRAG，刷新问答准确性记录，在 11 个数据集评测上达 SOTA

*论文：

https://go.hyper.ai/OaMIE

首个 VR 运动干预系统 REVERIE（「灵境」），重塑青少年脑-身-心健康

Adaptive AI-based virtual reality sports system for adolescents with excess body weight: a randomized controlled trial

*来源：Nature Medicine

*解读：钱学森「灵境」预言成真！上交/上体/清华等构建全球首个 VR 运动干预系统 REVERIE，重塑青少年脑-身-心健康

*论文：

https://www.nature.com/articles/s41591-025-03724-5

NeuralCohort 方法基于多维度 EHR 数据实现细粒度患者队列建模，住院时间预测准确率提升 16.3%

NeuralCohort: Cohort-aware Neural Representation Learning for Healthcare Analytics

*来源：ICML 2025

*作者：新加坡国立大学联合浙江大学

*解读：新加坡国立大学基于多维度 EHR 数据实现细粒度患者队列建模，住院时间预测准确率提升 16.3%

*论文：

https://openreview.net/forum?id=bqQVa6VRvm

全球首个 HIE 领域临床思维图谱模型，神经认知结果预测任务上性能提升 15%

Visual and Domain Knowledge for Professional-level Graph-of-Thought Medical Reasoning

*来源：ICML 2025

*作者：哈佛医学院、波士顿儿童医院、纽约大学及 MIT-IBM 沃森实验室的跨学科团队

*解读：入选 ICML 2025！哈佛医学院等推出全球首个 HIE 领域临床思维图谱模型，神经认知结果预测任务上性能提升 15%

*论文：

https://openreview.net/forum?id=tnyxtaSve5

分层蒸馏多示例学习框架 HDMIL，快速处理千兆像素病理全切片图像

Fast and Accurate Gigapixel Pathological Image Classification with Hierarchical Distillation Multi-Instance Learning

*来源：CVPR 2025

*作者：哈尔滨工业大学江俊君教授、江奎副教授和张永兵教授团队

*解读：入选 CVPR 2025，哈工大团队提出分层蒸馏多示例学习框架 HDMIL，快速处理千兆像素病理全切片图像

*论文：

https://go.hyper.ai/B3RMf

专为 3D 血管分割而设计的基础模型 vesselFM，能够在零样本、单样本和少样本场景中实现优于现有先进模型的分割能力和泛化能力。

vesselFM: A Foundation Model for Universal 3D Blood Vessel Segmentation

*来源：CVPR 2025

*作者：苏黎世大学、苏黎世联邦理工学院和慕尼黑工业大学的研究人员

*解读：性能远超 SAM 系模型，苏黎世大学等开发通用 3D 血管分割基础模型，入选 CVPR 2025

*论文：

https://go.hyper.ai/lVad9

图编码混合生存模型基于 800 万真实数据，识别具有一致特征和生存结局的亚表型

Identification of predictive subphenotypes for clinical outcomes using real world data and machine learningn

*来源：Nature Communication

*作者：美国康奈尔大学与再生元制药公司

*解读：基于 800 万真实数据，康奈尔大学团队利用图神经网络精准预测肺癌患者生存期，发现 3 类致命亚型

*论文：

https://doi.org/10.1038/s41467-025-59092-8

融合策略 AI 模型，实现多中心、跨专科感染性休克死亡风险的精准预测

Artificial intelligence based multispecialty mortality prediction models for septic shock in a multicenter retrospective study

*来源：npj digital medicine

*作者：华中科技大学同济医学院附属同济医院、医药卫生管理学院研究团队

*解读：登 Nature 子刊！华中科技大学提出融合策略 AI 模型，实现多中心、跨专科感染性休克死亡风险的精准预测

*论文：

https://go.hyper.ai/faMLL

2 种新型癌症预测算法，基于血液指标实现 15 种癌症早期预测

Development and external validation of prediction algorithms to improve early diagnosis of cancer

*来源：Nature Communications

*作者：伦敦玛丽女王大学与牛津大学研究团队

*解读：牛津大学等深挖 746 万成年人健康数据开发早筛算法，基于血液指标实现 15 种癌症早期预测

*论文：

https://go.hyper.ai/L7gNm

多智能体对话 (MAC) 框架，显著提升 LLMs 的诊断能力

Enhancing diagnostic capability with multi-agents conversational large language models

*来源：npj digital medicine

*作者：四川大学华西医院、华西生物医学大数据中心、浙江大学医学院、北京邮电大学等团队

*解读：模拟医生会诊，四川大学华西医院团队开发多智能体对话框架助力疾病诊断

*论文：

https://www.nature.com/articles/s41746-025-01550-0#Tab6

首个全模态医疗图像重识别框架，在 11 个数据集上的评测达 SOTA

Towards All-in-One Medical Image Re-Identification

*来源：

*作者：上海人工智能实验室联合多家知名高校

*解读：入选 CVPR 2025，上海 AI Lab 等提出首个全模态医疗图像重识别框架，在 11 个数据集上的评测达 SOTA

*论文：

https://arxiv.org/pdf/2503.08173

多对一回归模型 M2OST，利用数字病理图像精准预测基因表达

M2OST: Many-to-one Regression for Predicting Spatial Transcriptomics from Digital Pathology Images

*来源：AAAI 2025

*作者：中国浙江大学的林兰芬教授研究团队联合浙江杭州之江实验室以及日本立命馆大学

*解读：入选 AAAI 2025，浙江大学提出多对一回归模型 M2OST，利用数字病理图像精准预测基因表达

*论文：

https://arxiv.org/abs/2409.15092

MindGlide 模型，实现多发性硬化症病变量化

Enabling new insights from old scans by repurposing clinical MRI archives for multiple sclerosis research

*来源：Nature Communications

*作者：英国伦敦大学学院团队

*解读：最大化挖掘临床 MRI 数据价值，UCL 团队提出 MindGlide 模型，实现多发性硬化症病变量化

*论文：

https://www.nature.com/articles/s41467-025-58274-8

全球首个针对大模型在辅助基层医生培训中实际效能的前瞻性真实世界证据

Large language models for diabetes training: a prospective study

*来源：Science Bulletin

*解读：医生培训迎来 DeepSeek 外挂！上体/上交/清华合作研究证实大模型可成为基层医生培训「黄金搭档」

*论文：

https://www.sciencedirect.com/science/article/pii/S2095927325000891

AcneDGNet 的深度学习算法准确率远超初级皮肤科医生，实现痤疮病变检测与分级

Evaluation of an acne lesion detection and severity grading model for Chinese population in online and offline healthcare scenarios

*来源：Scientific Reports

*作者：北京大学国际医院皮肤科韩钢文及其团队

*解读：准确率远超初级皮肤科医生，北大国际医院等开发深度学习算法，实现痤疮病变检测与分级

*论文：

https://www.nature.com/articles/s41598-024-84670-z

多模态医学影像分割模型，实现三维影像自动分割与交互

VISTA3D: A Unified Seamentation Foundation Model For 3D Medical lmaging

*来源：arXiv

*作者：英伟达联合阿肯色大学医学院、美国国立卫生研究院及牛津大学

*解读：精度提升 5.2%，英伟达等发布多模态医学影像分割模型，实现三维影像自动分割与交互

*论文：

https://doi.org/10.48550/arxiv.2406.05285

对多切面超声心动图的心脏结构进行精准分割，有效减少冗杂度

EchoONE: Segmenting Multiple echocardiography Planes in One Model

*来源：CVPR 2025

*作者：深圳大学医学部生物医学工程学院医学超声图像计算实验室

*解读：入选 CVPR 2025！深圳大学团队等提出 EchoONE，可精准分割多切面超声心动图

*论文：https://arxiv.org/abs/2412.02993

当前具有最大规模参数量的生物医学大语言模型 MedFound

A generalist medical language model for disease diagnosis assistance

*来源：Nature Medicine

*作者：北京邮电大学、北京大学第三医院、三峡大学

*解读：开源 1760 亿参数通用医学语言模型！北邮/北大/三峡大学提出 MedFound，推理能力接近专家医师

*论文：https://www.nature.com/articles/s41591-024-03416-6

对比度驱动医学图像分割的通用框架，实现医学图像精准分割

ConDSeg: A General Medical Image Segmentation Framework via Contrast-Driven Feature Enhancement

*来源：AAAI 2025

*作者：中国地质大学、百度

*解读：入选 AAAI 2025！解决医学图像分割软边界与共现难题，中国地质大学等提出图像分割模型 ConDSeg

*论文：

https://arxiv.org/abs/2412.08345

在 2 种传染性和 14 种非传染性疾病的 9 个基准数据集上均为最优

A multimodal multidomain multilingual medical foundation model for zero shot clinical diagnosis

*来源：Nature Portfolio

*作者：牛津大学、亚马逊、罗切斯特大学、 GlaxoSmithKline 、西湖大学医学人工智能实验室

*解读：牛津/亚马逊/西湖大学/腾讯等提出多模态多领域多语言医学模型 M³FM，可用于零样本临床诊断

*论文：

https://www.nature.com/articles/s41746-024-01339-7

分类准确率可达 97%，显著高于人类观察者的 82%

Deep learning versus human assessors: forensic sex estimation from three-dimensional computed tomography scans

*来源：Scientific Reports

*作者：澳大利亚西澳大学、新南威尔士大学、印度尼西亚哈萨努丁大学

*解读：准确率达 97%，澳大利亚团队新成果基于深度学习凭颅骨 CT 鉴定性别，赶超人类法医

*论文：

https://www.nature.com/articles/s41598-024-81718-y

双向逐步特征对齐的未对齐医学图像融合方法

BSAFusion: A Bidirectional Stepwise Feature Alignment Network for Unaligned Medical Image Fusion

*来源：AAAI 2025

*作者：昆明理工大学、中国海洋大学

*解读：入选 AAAI 2025！可实现多模态医学图像对齐与融合，国内两大高校联合提出 BSAFusion

*论文：https://arxiv.org/abs/2412.08050 新型分层多智能体框架，涵盖了 362 种常见疾病

KG4Diagnosis: A Hierarchical Multi-Agent LLM Framework with Knowledge Graph Enhancement for Medical Diagnosis

*来源：AAAI-25 Bridge Program

*作者：华威大学、克兰菲尔德大学、剑桥大学、牛津大学

*解读：助力诊断 362 种常见疾病！剑桥/牛津/华威大学等提出多 Agent 大语言模型框架，自动化构建医疗知识图谱

*论文：https://arxiv.org/abs/2406.05285

AI+ 材料化学

不足 10 万结构数据训练，PET-MAD 原子模拟精度媲美专业模型

PET-MAD as a lightweight universal interatomic potential for advanced materials modeling

*来源：Nature Communications

*作者：瑞士洛桑理工学院

*解读：以不足 10 万结构数据训练，瑞士洛桑联邦理工提出 PET-MAD，原子模拟精度媲美专业模型

*论文：

https://www.nature.com/articles/s41467-025-65662-7

计算成本减半，将人类的化学推理形式化为机器可理解的框架

ChemOntology: A Reusable Explicit Chemical Ontology-Based Method to Expedite Reaction Path Searches

*来源：ACS Catalysis

*作者：日本北海道大学

*解读：计算成本减半，化学反应发现工具 ChemOntology 将人类直觉「编码」到系统中，加速反应路径搜索

*论文：

https://pubs.acs.org/doi/10.1021/acscatal.5c06298

MOF-ChemUnity：一个结构化、可扩展、可拓展的知识图谱

MOF-ChemUnity: Literature-Informed Large Language Models for Metal–Organic Framework Research

*来源：ACS Publications

*作者：加拿大多伦多大学、加拿大国家研究委员会清洁能源创新研究中心

*解读：从 9,874 篇文献到 1.5 万晶体结构，MOF-ChemUnity 重构 MOF 全景知识，推动材料发现进入「可解释 AI」时代

*论文：

https://pubs.acs.org/doi/10.1021/jacs.5c11789

将 Graphormer 的全局注意力机制与 CGCNN 相融合

CGformer: Transformer-enhanced crystal graph network with global attention for material property prediction

*来源：Matter

*作者：上海交通大学人工智能与微结构实验室

*解读：新材料研发提速！上交大团队开发新 AI 材料设计模型 CGformer，融合全局注意力机制

*论文：

https://www.cell.com/matter/abstract/S2590-2385(25)00423-0

FASTSOLV 模型：实现任意温度下的小分子溶解度预测

Data-driven organic solubility prediction at the limit of aleatoric uncertainty

*来源：Nature Communication

*作者：麻省理工学院

*解读：推理速度快 50 倍，MIT 团队提出 FASTSOLV 模型，实现任意温度下的小分子溶解度预测

*论文：

https://www.nature.com/articles/s41467-025-62717-7

利用 MOFs 合成后即可获得的信息来预测其潜在性能和用途

Connecting metal-organic framework synthesis to applications using multimodal machine learning

*来源：Nature Communications

*作者：加拿大多伦多大学

*解读：多模态模型加速新材料与工业应用匹配，无需完整晶体结构即可预测材料性质

*论文：

https://www.nature.com/articles/s41467-025-60796-0

首次构建能够同时处理超材料设计三大模态的统一框架

UNIMATE: A Unified Model for Mechanical Metamaterial Generation, Property Prediction, and Condition Confirmation

*来源：ICML 2025

*作者：美国弗吉尼亚理工学院、 Meta AI

*解读：超材料设计破局！Meta AI 等提出 UNIMATE，首次实现拓扑生成/性能预测等任务的统一建模

*论文：

https://go.hyper.ai/FoAWw

覆盖 2 亿分子质谱图，构建全球最大规模质谱数据集 GeMS

Self-supervised learning of molecular representations from millions of tandem mass spectra using DreaMS

*来源：Nature Biotechnology

*作者：捷克科学院有机化学与生物化学研究所

*解读：覆盖 2 亿分子质谱图，捷克科学院发布 DreaMS 模型，构建全球最大规模质谱数据集 GeMS

*论文：

https://go.hyper.ai/uNbqL

在单一机器学习模型中同时学习广义势能及其对外部刺激的响应函数

Unified differentiable learning of electric response

*来源：Nature Communications

*作者：哈佛大学、 Robert Bosch LLC

*解读：从石英到铁电材料，哈佛大学提出等变机器学习框架，加速材料大规模电场模拟

*论文：

https://go.hyper.ai/18TWg

基于 LLM 从 8.8 万篇论文中提取 1.4 万种材料的化学组成

Data-driven material screening of secondary and natural cementitious precursors

*来源：Communication Materials

*作者：美国麻省理工学院

*解读：MIT 团队利用大模型筛选 25 类水泥熟料替代材料，相当于减排 12 亿吨温室气体

*论文：

https://go.hyper.ai/ZOAaW

将全面的 SSE 数据库与 LLM 和 ab initio 元动力学模拟相结合

Unraveling the Complexity of Divalent Hydride Electrolytes in Solid-State Batteries via a Data-Driven Framework with Large Language Model

*来源：Angewandte Chemie-International Edition

*作者：日本东北大学、中国四川大学、日本芝浦工业大学

*解读：中日团队联合攻关，利用大模型解析氢化物固态电解质传导机制，建立可靠活化能预测模型

*论文：

https://go.hyper.ai/isQRi

在高达 TB 级别的多组分高分辨质谱数据库中，检索离子同位素分布

Discovering organic reactions with a machine-learning-powered deciphering of tera-scale mass spectrometry data

*来源：Nature Communications

*作者：俄罗斯科学院

*解读：登 Nature 子刊，俄罗斯研究团队基于机器学习实现万亿级质谱数据搜索，发现未知化学反应

*论文：

https://go.hyper.ai/ak7bN

一种基于扩散模型的生成式人工智能结构解析方法 PXRDnet

Ab initio structure solutions from nanocrystalline powder diffraction data via diffusion models

*来源：Nature Materials

*作者：哥伦比亚大学、斯坦福大学

*解读：首次实现纳米晶体端到端解析，哥大团队提出 PXRDnet，成功解析 200 种复杂模拟纳米晶体

*论文：

https://go.hyper.ai/r1K6b

基于机器学习成功制备 10 种光驱动有机晶体

Machine learning-driven optimization of the output force in photo-actuated organic crystals

*来源：Digital Discovery

*作者：日本早稻田大学

*解读：效率提升 73 倍！日本研究团队基于机器学习成功制备 10 种光驱动有机晶体

*论文：

https://go.hyper.ai/RU0ro

成功预测金属的电声相互作用，效率提高 5 倍

Accelerating superconductor discovery through tempered deep learning of the electron-phonon spectral function

*来源：npj Computational Materials

*作者：美国佛罗里达大学、田纳西大学

*解读：超导材料搜索效率提升 5 倍！佛罗里达大学等用深度学习变革材料发现，成果登 Nature 子刊

*论文：

https://www.nature.com/articles/s41524-024-01475-4

通过梯度提升决策树技术，实现对 RHEAs 和 RCCAs 抗氧化性能的高精度预测

Advancing refractory high entropy alloy development with AI-predictive models for high temperature oxidation resistance

*来源：Scripta Materialia

*作者：法国波尔多大学、日本国立材料科学研究所、中国台湾国立清华大学、比利时鲁汶大学、比利时 WEL 研究所

*解读：高熵合金新发现！多团队联手实现抗氧化性高精度预测，增加铝/铬/硅含量可有效改善

*论文：

https://doi.org/10.1016/j.scriptamat.2024.116394

结合局部消息传递与全局注意力机制，能精准预测分子光电性能

RingFormer: A Ring-Enhanced Graph Transformer for Organic Solar Cell Property Prediction

*来源：AAAI 2025

*作者：香港理工大学

*解读：入选 AAAI 2025！香港理工大学团队基于图 Transformer，精准预测有机材料分子光电性能

*论文：

https://doi.org/10.48550/arXiv.2412.09030

一种无机逆合成规划方法，成功地促进了无机材料合成的效率和准确性

Retrieval-Retro: Retrieval-based Inorganic Retrosynthesis with Expert Knowledge

*来源：NeurIPS 2024

*作者：韩国化学技术研究所、韩国科学技术院

*解读：无机材料逆合成效率飙升，韩国团队推出 Retrieval-Retro，成果入选 NeurIPS 2024

*论文：

https://doi.org/10.48550/arXiv.2410.21341

基于扩散模型，根据目标空间群生成结构

A generative model for inorganic materials design

*来源：Nature

*作者：微软

*解读：直接设计目标属性材料！微软 MatterGen 模型重磅开源，用生成式 AI 重新定义材料逆向设计新范式

*论文：

https://www.nature.com/articles/s41586-025-08628-5

AI+ 农林畜牧业

覆盖近 1.5 万个物种，刷新生物声学分类检测 SOTA

Perch 2.0: The Bittern Lesson for Bioacoustics

*来源：arXiv

*作者：Google DeepMind 、 Google Research

*解读：覆盖近 1.5 万个物种，谷歌 DeepMind 发布 Perch 2.0，刷新生物声学分类检测 SOTA

*论文：

https://arxiv.org/abs/2508.04665

首次将 219 个基于傅里叶变换、香农熵等数学理论的新型序列描述符纳入特征空间

PlantLncBoost: key features for plant lncRNA identification and significant improvement in accuracy and generalization

*来源：New Phytologist

*作者：山东理工大学、北京林业大学、广东省农业科学院、巴西圣保罗大学、英国罗莎琳德富兰克林医科大学、瑞典于默奥大学

*解读：整合多源植物转录组数据，山东理工大学等构建 PlantLncBoost 模型，跨物种 lncRNA 预测准确率最高达 96%

*论文：

https://go.hyper.ai/F7pkc

AI+ 气象研究

攻克了「渐进式噪声调度」与「时间损失加权」的协同设计问题

Elucidated Rolling Diffusion Models for Probabilistic Weather Forecasting

*来源：NeurIPS 2025

*作者：英伟达、加州大学圣迭戈分校

*解读：入选 NeurIPS 2025，英伟达提出 ERDM 模型，解长期预报难题，中远期预报持续领先 EDM 基准

*论文：

https://doi.org/10.48550/arXiv.2506.20024

一种新型潜在扩散模型，可用于高精度概率性次季节至季节尺度天气预报

OmniCast: A Masked Latent Diffusion Model for Weather Forecasting Across Time Scales

*来源：NeurIPS 2025

*作者：加州大学洛杉矶分校、美国阿贡国家实验室

*解读：效率至高提升 20 倍！加州大学开发 OmniCast，解决自回归天气预报模型误差累计问题

*论文：

https://go.hyper.ai/YANIu

超本地预测模型，实现了提前数天预测大部分强降雨事件

Hyperlocal Extreme Rainfall Forecasts in Mumbai: Convolutional Neural Network Transfer Learning-Based Downscaling Approach

*来源：SSRN

*作者：印度理工学院孟买分校、马里兰大学

*解读：准确度提升 400%！印度季风预测模型基于 36 个气象站点，实现城区尺度精细预报

*论文：

https://go.hyper.ai/j05Vt

仅需 2 分钟，ACE2 可完成一次 4 个月季节预报

Skilful global seasonal predictions from a machine learning weather model trained on reanalysis data

*来源：npj Climate and Atmospheric Science

*作者：英国埃克塞特哈德利中心气象局、埃克塞特大学、美国艾伦人工智能研究所（Ai2）

*解读：机器学习 vs. 动力学模型，Ai2 最新研究：仅需 2 分钟，ACE2 可完成一次 4 个月季节预报

*论文：

https://go.hyper.ai/YyRfT

一个将球面信号处理与隐马尔可夫集合框架相结合的概率机器学习天气预报系统

FourCastNet 3: A geometric approach to probabilistic machine-learning weather forecasting at scale

*来源：arXiv

*作者：英伟达、美国劳伦斯伯克利国家实验室、加州大学伯克利分校、美国加州理工学院

*解读：1 分钟内完成 15 天预报，英伟达/UC 伯克利等提出机器学习天气预报系统 FCN3，支持单卡极速推理

*论文：

https://arxiv.org/pdf/2507.12144

无需依赖传统数值天气预报模型，即可实现高技巧性的天气预报

End-to-end data-driven weather prediction

*来源：Nature

*作者：剑桥大学、图灵研究所、多伦多大学、微软科学智能中心、欧洲中期天气预报中心、英国南极调查局、谷歌 DeepMind

*解读：登 Nature，剑桥大学等发布首个端到端的数据驱动天气预报系统，预测速度提升数十倍

*论文：

https://www.nature.com/articles/s41586-025-08897-0

AI+ 天文学

利用卷积神经网络，成功识别出 7 个高质量类星体透镜候选体

Quasars acting as Strong Lenses Found in DESI DR1

*来源：arXiv

*作者：斯坦福大学、 SLAC 国家加速器实验室、北京大学、意大利国家天体物理研究院布雷拉天文台、伦敦大学学院、加州大学伯克利分校

*解读：斯坦福/北大/UCL/UC 伯克利联手，利用 CNN 从 81 万类星体中精准识别 7 个罕见透镜样本

*论文：

https://arxiv.org/abs/2511.02009

首个面向天文学的大规模多模态基础模型家族 AION-1

AION-1: Omnimodal Foundation Model for Astronomical Sciences

*来源：NeurIPS 2025

*作者：加州大学伯克利分校、剑桥大学、牛津大学等

*解读：首个天文多模态基础模型 AION-1 诞生！UC 伯克利等基于 2 亿天文目标预训练，成功构建泛化性多模态天文 AI 框架

*论文：

https://openreview.net/forum?id=6gJ2ZykQ5W

Command Palette

论文汇总丨超 100 篇 AI for Science 重要成果，一文速览 2025 年技术创新

AI+ 生物医药

AI+ 医疗健康

AI+ 材料化学

AI+ 农林畜牧业

AI+ 气象研究

AI+ 天文学

Command Palette

论文汇总丨超 100 篇 AI for Science 重要成果，一文速览 2025 年技术创新

AI+ 生物医药

AI+ 医疗健康

AI+ 材料化学

AI+ 农林畜牧业

AI+ 气象研究

AI+ 天文学

相关报道

整合蛋白序列/三维结构/功能特征等数据，德国团队基于度量学习构建构建人类 E3 泛素连接酶「全景图」

重塑无序蛋白集合预测能力，英伟达/MIT/牛津大学/哥本哈根大学/Peptone 等发布生成式模型及新评测基准

以不足 10 万结构数据训练，瑞士洛桑联邦理工学院提出 PET-MAD，原子模拟精度媲美专业模型

百度出招！OCR 模型 PaddleOCR-VL 打破管道与端到端方法局限；面部情感识别数据集 Facial Emotion Recognition，赋能 AI 读懂表情

基于超 2 万条配方，MIT 等采用扩散模型规划材料合成，成功制备硅铝比高达 19 的新型沸石材料

加州大学构建基于全连接神经网络的片上光谱仪，在芯片级尺寸上实现 8 纳米的光谱分辨率

低门槛试用 Open-AutoGLM：屏幕理解+自动执行的智能体体验；Spatial-SSRL-81k 构建空间感知的自监督提升路径

三维视觉新突破：字节 Seed 推出 DA3，实现任意视角重建视觉空间；7w+真实工业环境数据！CHIP 填补 6D 姿态估计工业数据空白

LightOnOCR-2-1B：基于 RLVR 训练实现高精度端到端 OCR；Google Streetview 国家街景图像：基于世界级地理映射技术的全景图像开源库

Command Palette

论文汇总丨超 100 篇 AI for Science 重要成果，一文速览 2025 年技术创新

AI+ 生物医药

AI+ 医疗健康

AI+ 材料化学

AI+ 农林畜牧业

AI+ 气象研究

AI+ 天文学

相关报道

整合蛋白序列/三维结构/功能特征等数据，德国团队基于度量学习构建构建人类 E3 泛素连接酶「全景图」

重塑无序蛋白集合预测能力，英伟达/MIT/牛津大学/哥本哈根大学/Peptone 等发布生成式模型及新评测基准

以不足 10 万结构数据训练，瑞士洛桑联邦理工学院提出 PET-MAD，原子模拟精度媲美专业模型

百度出招！OCR 模型 PaddleOCR-VL 打破管道与端到端方法局限；面部情感识别数据集 Facial Emotion Recognition，赋能 AI 读懂表情

基于超 2 万条配方，MIT 等采用扩散模型规划材料合成，成功制备硅铝比高达 19 的新型沸石材料

加州大学构建基于全连接神经网络的片上光谱仪，在芯片级尺寸上实现 8 纳米的光谱分辨率

低门槛试用 Open-AutoGLM：屏幕理解+自动执行的智能体体验；Spatial-SSRL-81k 构建空间感知的自监督提升路径

三维视觉新突破：字节 Seed 推出 DA3，实现任意视角重建视觉空间；7w+真实工业环境数据！CHIP 填补 6D 姿态估计工业数据空白

LightOnOCR-2-1B：基于 RLVR 训练实现高精度端到端 OCR；Google Streetview 国家街景图像：基于世界级地理映射技术的全景图像开源库

相关报道

整合蛋白序列/三维结构/功能特征等数据，德国团队基于度量学习构建构建人类 E3 泛素连接酶「全景图」

重塑无序蛋白集合预测能力，英伟达/MIT/牛津大学/哥本哈根大学/Peptone 等发布生成式模型及新评测基准

以不足 10 万结构数据训练，瑞士洛桑联邦理工学院提出 PET-MAD，原子模拟精度媲美专业模型

百度出招！OCR 模型 PaddleOCR-VL 打破管道与端到端方法局限；面部情感识别数据集 Facial Emotion Recognition，赋能 AI 读懂表情

基于超 2 万条配方，MIT 等采用扩散模型规划材料合成，成功制备硅铝比高达 19 的新型沸石材料

加州大学构建基于全连接神经网络的片上光谱仪，在芯片级尺寸上实现 8 纳米的光谱分辨率

低门槛试用 Open-AutoGLM：屏幕理解+自动执行的智能体体验；Spatial-SSRL-81k 构建空间感知的自监督提升路径

三维视觉新突破：字节 Seed 推出 DA3，实现任意视角重建视觉空间；7w+真实工业环境数据！CHIP 填补 6D 姿态估计工业数据空白

LightOnOCR-2-1B：基于 RLVR 训练实现高精度端到端 OCR；Google Streetview 国家街景图像：基于世界级地理映射技术的全景图像开源库

相关报道

整合蛋白序列/三维结构/功能特征等数据，德国团队基于度量学习构建构建人类 E3 泛素连接酶「全景图」

重塑无序蛋白集合预测能力，英伟达/MIT/牛津大学/哥本哈根大学/Peptone 等发布生成式模型及新评测基准

以不足 10 万结构数据训练，瑞士洛桑联邦理工学院提出 PET-MAD，原子模拟精度媲美专业模型

百度出招！OCR 模型 PaddleOCR-VL 打破管道与端到端方法局限；面部情感识别数据集 Facial Emotion Recognition，赋能 AI 读懂表情

基于超 2 万条配方，MIT 等采用扩散模型规划材料合成，成功制备硅铝比高达 19 的新型沸石材料

加州大学构建基于全连接神经网络的片上光谱仪，在芯片级尺寸上实现 8 纳米的光谱分辨率

低门槛试用 Open-AutoGLM：屏幕理解+自动执行的智能体体验；Spatial-SSRL-81k 构建空间感知的自监督提升路径

三维视觉新突破：字节 Seed 推出 DA3，实现任意视角重建视觉空间；7w+真实工业环境数据！CHIP 填补 6D 姿态估计工业数据空白

LightOnOCR-2-1B：基于 RLVR 训练实现高精度端到端 OCR；Google Streetview 国家街景图像：基于世界级地理映射技术的全景图像开源库