HyperAI

Main

GPU

Console
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Dataset Help

Products

News Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Main

GPU

Console
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Dataset Help

Products

News Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

Towards Autonomous Mathematics Research

Towards Autonomous Mathematics Research

Tony Feng, Trieu H. Trinh, Garrett Bingham, et al.

When to Memorize and When to Stop: Gated Recurrent Memory for Long-Context Reasoning

When to Memorize and When to Stop: Gated Recurrent Memory for Long-Context Reasoning

Intelligent Question Answering

Leheng Sheng, Yongtao Zhang, Wenchang Ma, et al.

ASA: Activation Steering for Tool-Calling Domain Adaptation

ASA: Activation Steering for Tool-Calling Domain Adaptation

Intelligent Question Answering

Youjin Wang, Run Zhou, Rong Fu, et al.

PhyCritic: Multimodal Critic Models for Physical AI

PhyCritic: Multimodal Critic Models for Physical AI

Visual Question Answering

Tianyi Xiong, Shihao Wang, Guilin Liu, et al.

GENIUS: Generative Fluid Intelligence Evaluation Suite

GENIUS: Generative Fluid Intelligence Evaluation Suite

Ruichuan An, Sihan Yang, Ziyu Guo, et al.

Step 3.5 Flash: Open Frontier-Level Intelligence with 11B Active Parameters

Step 3.5 Flash: Open Frontier-Level Intelligence with 11B Active Parameters

Ailin Huang, Ang Li, Aobo Kong, et al.

World-VLA-Loop: Closed-Loop Learning of Video World Model and VLA Policy

World-VLA-Loop: Closed-Loop Learning of Video World Model and VLA Policy

Diffusion Model

Video Generation

Xiaokang Liu, Zechen Bai, Hai Ci, et al.

Towards Autonomous Mathematics Research

Towards Autonomous Mathematics Research

Retrieval-Augmented Generation

Tony Feng, Trieu H. Trinh, Garrett Bingham, et al.

Agent World Model: Infinity Synthetic Environments for Agentic Reinforcement Learning

Agent World Model: Infinity Synthetic Environments for Agentic Reinforcement Learning

Zhaoyang Wang, Canwen Xu, Boyi Liu, et al.

P1-VL: Bridging Visual Perception and Scientific Reasoning in Physics Olympiads

P1-VL: Bridging Visual Perception and Scientific Reasoning in Physics Olympiads

Multimodal Representation

Yun Luo, Futing Wang, Qianjia Cheng, et al.

Chain of Mindset: Reasoning with Adaptive Cognitive Modes

Chain of Mindset: Reasoning with Adaptive Cognitive Modes

Tianyi Jiang, Arctanx An, Hengyi Feng, et al.

UI-Venus-1.5 Technical Report

UI-Venus-1.5 Technical Report

Veuns-Team, Changlong Gao, Zhangxuan Gu, et al.

Code2World: A GUI World Model via Renderable Code Generation

Code2World: A GUI World Model via Renderable Code Generation

Code Generation

Yuhao Zheng, Li'an Zhong, Yi Wang, et al.

OPUS: Towards Efficient and Principled Data Selection in Large Language Model Pre-training in Every Iteration

OPUS: Towards Efficient and Principled Data Selection in Large Language Model Pre-training in Every Iteration

Shaobo Wang, Xuan Ouyang, Tianyi Xu, et al.

BagelVLA: Enhancing Long-Horizon Manipulation via Interleaved Vision-Language-Action Generation

BagelVLA: Enhancing Long-Horizon Manipulation via Interleaved Vision-Language-Action Generation

Yucheng Hu, Jianke Zhang, Yuanfei Luo, et al.

THINGS-data, a multimodal collection of large-scale datasets for investigating object representations in human brain and behavior

THINGS-data, a multimodal collection of large-scale datasets for investigating object representations in human brain and behavior

Multimodal Representation

Martin N Hebart Oliver Contier, Lina Teichmann, Adam H Rockter, et al.

Accurate Predictions of Novel Biomolecular Interactions with IsoDDE

Accurate Predictions of Novel Biomolecular Interactions with IsoDDE

Isomorphic Labs Team

SkillRL: Evolving Agents via Recursive Skill-Augmented Reinforcement Learning

SkillRL: Evolving Agents via Recursive Skill-Augmented Reinforcement Learning

Reinforcement Learning

Peng Xia, Jianwen Chen, Hanyang Wang, et al.

LLaDA2.1: Speeding Up Text Diffusion via Token Editing

LLaDA2.1: Speeding Up Text Diffusion via Token Editing

Diffusion Model

Tiwei Bie, Maosong Cao, Xiang Cao, et al.

Alleviating Sparse Rewards by Modeling Step-Wise and Long-Term Sampling Effects in Flow-Based GRPO

Alleviating Sparse Rewards by Modeling Step-Wise and Long-Term Sampling Effects in Flow-Based GRPO

Diffusion Model

Image Generation

Yunze Tong, Mushui Liu, Canyu Zhao, et al.

Recurrent-Depth VLA: Implicit Test-Time Compute Scaling of Vision-Language-Action Models via Latent Iterative Reasoning

Recurrent-Depth VLA: Implicit Test-Time Compute Scaling of Vision-Language-Action Models via Latent Iterative Reasoning

Yalcin Tur, Jalal Naghiyev, Haoquan Fang, et al.

QuantaAlpha: An Evolutionary Framework for LLM-Driven Alpha Mining

QuantaAlpha: An Evolutionary Framework for LLM-Driven Alpha Mining

Jun Han, Shuo Zhang, Wei Li, et al.

Modality Gap-Driven Subspace Alignment Training Paradigm For Multimodal Large Language Models

Modality Gap-Driven Subspace Alignment Training Paradigm For Multimodal Large Language Models

Multimodal Representation

Xiaomin Yu, Yi Xin, Wenjie Zhang, et al.

MOVA: Towards Scalable and Synchronized Video-Audio Generation

MOVA: Towards Scalable and Synchronized Video-Audio Generation

Video Generation

SII-OpenMOSS Team, Donghua Yu, Mingshu Chen, et al.

MemoryLLM: Plug-n-Play Interpretable Feed-Forward Memory for Transformers

MemoryLLM: Plug-n-Play Interpretable Feed-Forward Memory for Transformers

Ajay Jaiswal, Lauren Hannah, Han-Byul Kim, et al.

DreamDojo: A Generalist Robot World Model from Large-Scale Human Videos

DreamDojo: A Generalist Robot World Model from Large-Scale Human Videos

Video Understanding

Shenyuan Gao, William Liang, Kaiyuan Zheng, et al.

F-GRPO: Don't Let Your Policy Learn the Obvious and Forget the Rare

F-GRPO: Don't Let Your Policy Learn the Obvious and Forget the Rare

Reinforcement Learning

Daniil Plyusov, Alexey Gorbatovski, Boris Shaposhnikov, et al.

MSign: An Optimizer Preventing Training Instability in Large Language Models via Stable Rank Restoration

MSign: An Optimizer Preventing Training Instability in Large Language Models via Stable Rank Restoration

Lianhai Ren, Yucheng Ding, Xiao Liu, et al.

AudioSAE: Towards Understanding of Audio-Processing Models with Sparse AutoEncoders

AudioSAE: Towards Understanding of Audio-Processing Models with Sparse AutoEncoders

Audio and Speech Processing

Georgii Aparin, Tasnima Sadekova, Alexey Rukhovich, et al.

On the Entropy Dynamics in Reinforcement Fine-Tuning of Large Language Models

On the Entropy Dynamics in Reinforcement Fine-Tuning of Large Language Models

Reinforcement Learning

Shumin Wang, Yuexiang Xie, Wenhao Zhang, et al.

OdysseyArena: Benchmarking Large Language Models For Long-Horizon, Active and Inductive Interactions

OdysseyArena: Benchmarking Large Language Models For Long-Horizon, Active and Inductive Interactions

Fangzhi Xu, Hang Yan, Qiushi Sun, et al.

Baichuan-M3: Modeling Clinical Inquiry for Reliable Medical Decision-Making

Baichuan-M3: Modeling Clinical Inquiry for Reliable Medical Decision-Making

Baichuan-M3 Team, Chengfeng Dou, Fan Yang, et al.

Towards Autonomous Mathematics Research

Towards Autonomous Mathematics Research

Tony Feng, Trieu H. Trinh, Garrett Bingham, et al.

When to Memorize and When to Stop: Gated Recurrent Memory for Long-Context Reasoning

When to Memorize and When to Stop: Gated Recurrent Memory for Long-Context Reasoning

Intelligent Question Answering

Leheng Sheng, Yongtao Zhang, Wenchang Ma, et al.

ASA: Activation Steering for Tool-Calling Domain Adaptation

ASA: Activation Steering for Tool-Calling Domain Adaptation

Intelligent Question Answering

Youjin Wang, Run Zhou, Rong Fu, et al.

PhyCritic: Multimodal Critic Models for Physical AI

PhyCritic: Multimodal Critic Models for Physical AI

Visual Question Answering

Tianyi Xiong, Shihao Wang, Guilin Liu, et al.

GENIUS: Generative Fluid Intelligence Evaluation Suite

GENIUS: Generative Fluid Intelligence Evaluation Suite

Ruichuan An, Sihan Yang, Ziyu Guo, et al.

Step 3.5 Flash: Open Frontier-Level Intelligence with 11B Active Parameters

Step 3.5 Flash: Open Frontier-Level Intelligence with 11B Active Parameters

Ailin Huang, Ang Li, Aobo Kong, et al.

World-VLA-Loop: Closed-Loop Learning of Video World Model and VLA Policy

World-VLA-Loop: Closed-Loop Learning of Video World Model and VLA Policy

Diffusion Model

Video Generation

Xiaokang Liu, Zechen Bai, Hai Ci, et al.

Towards Autonomous Mathematics Research

Towards Autonomous Mathematics Research

Retrieval-Augmented Generation

Tony Feng, Trieu H. Trinh, Garrett Bingham, et al.

Agent World Model: Infinity Synthetic Environments for Agentic Reinforcement Learning

Agent World Model: Infinity Synthetic Environments for Agentic Reinforcement Learning

Zhaoyang Wang, Canwen Xu, Boyi Liu, et al.

P1-VL: Bridging Visual Perception and Scientific Reasoning in Physics Olympiads

P1-VL: Bridging Visual Perception and Scientific Reasoning in Physics Olympiads

Multimodal Representation

Yun Luo, Futing Wang, Qianjia Cheng, et al.

Chain of Mindset: Reasoning with Adaptive Cognitive Modes

Chain of Mindset: Reasoning with Adaptive Cognitive Modes

Tianyi Jiang, Arctanx An, Hengyi Feng, et al.

UI-Venus-1.5 Technical Report

UI-Venus-1.5 Technical Report

Veuns-Team, Changlong Gao, Zhangxuan Gu, et al.

Code2World: A GUI World Model via Renderable Code Generation

Code2World: A GUI World Model via Renderable Code Generation

Code Generation

Yuhao Zheng, Li'an Zhong, Yi Wang, et al.

OPUS: Towards Efficient and Principled Data Selection in Large Language Model Pre-training in Every Iteration

OPUS: Towards Efficient and Principled Data Selection in Large Language Model Pre-training in Every Iteration

Shaobo Wang, Xuan Ouyang, Tianyi Xu, et al.

BagelVLA: Enhancing Long-Horizon Manipulation via Interleaved Vision-Language-Action Generation

BagelVLA: Enhancing Long-Horizon Manipulation via Interleaved Vision-Language-Action Generation

Yucheng Hu, Jianke Zhang, Yuanfei Luo, et al.

THINGS-data, a multimodal collection of large-scale datasets for investigating object representations in human brain and behavior

THINGS-data, a multimodal collection of large-scale datasets for investigating object representations in human brain and behavior

Multimodal Representation

Martin N Hebart Oliver Contier, Lina Teichmann, Adam H Rockter, et al.

Accurate Predictions of Novel Biomolecular Interactions with IsoDDE

Accurate Predictions of Novel Biomolecular Interactions with IsoDDE

Isomorphic Labs Team

SkillRL: Evolving Agents via Recursive Skill-Augmented Reinforcement Learning

SkillRL: Evolving Agents via Recursive Skill-Augmented Reinforcement Learning

Reinforcement Learning

Peng Xia, Jianwen Chen, Hanyang Wang, et al.

LLaDA2.1: Speeding Up Text Diffusion via Token Editing

LLaDA2.1: Speeding Up Text Diffusion via Token Editing

Diffusion Model

Tiwei Bie, Maosong Cao, Xiang Cao, et al.

Alleviating Sparse Rewards by Modeling Step-Wise and Long-Term Sampling Effects in Flow-Based GRPO

Alleviating Sparse Rewards by Modeling Step-Wise and Long-Term Sampling Effects in Flow-Based GRPO

Diffusion Model

Image Generation

Yunze Tong, Mushui Liu, Canyu Zhao, et al.

Recurrent-Depth VLA: Implicit Test-Time Compute Scaling of Vision-Language-Action Models via Latent Iterative Reasoning

Recurrent-Depth VLA: Implicit Test-Time Compute Scaling of Vision-Language-Action Models via Latent Iterative Reasoning

Yalcin Tur, Jalal Naghiyev, Haoquan Fang, et al.

QuantaAlpha: An Evolutionary Framework for LLM-Driven Alpha Mining

QuantaAlpha: An Evolutionary Framework for LLM-Driven Alpha Mining

Jun Han, Shuo Zhang, Wei Li, et al.

Modality Gap-Driven Subspace Alignment Training Paradigm For Multimodal Large Language Models

Modality Gap-Driven Subspace Alignment Training Paradigm For Multimodal Large Language Models

Multimodal Representation

Xiaomin Yu, Yi Xin, Wenjie Zhang, et al.

MOVA: Towards Scalable and Synchronized Video-Audio Generation

MOVA: Towards Scalable and Synchronized Video-Audio Generation

Video Generation

SII-OpenMOSS Team, Donghua Yu, Mingshu Chen, et al.

MemoryLLM: Plug-n-Play Interpretable Feed-Forward Memory for Transformers

MemoryLLM: Plug-n-Play Interpretable Feed-Forward Memory for Transformers

Ajay Jaiswal, Lauren Hannah, Han-Byul Kim, et al.

DreamDojo: A Generalist Robot World Model from Large-Scale Human Videos

DreamDojo: A Generalist Robot World Model from Large-Scale Human Videos

Video Understanding

Shenyuan Gao, William Liang, Kaiyuan Zheng, et al.

F-GRPO: Don't Let Your Policy Learn the Obvious and Forget the Rare

F-GRPO: Don't Let Your Policy Learn the Obvious and Forget the Rare

Reinforcement Learning

Daniil Plyusov, Alexey Gorbatovski, Boris Shaposhnikov, et al.

MSign: An Optimizer Preventing Training Instability in Large Language Models via Stable Rank Restoration

MSign: An Optimizer Preventing Training Instability in Large Language Models via Stable Rank Restoration

Lianhai Ren, Yucheng Ding, Xiao Liu, et al.

AudioSAE: Towards Understanding of Audio-Processing Models with Sparse AutoEncoders

AudioSAE: Towards Understanding of Audio-Processing Models with Sparse AutoEncoders

Audio and Speech Processing

Georgii Aparin, Tasnima Sadekova, Alexey Rukhovich, et al.

On the Entropy Dynamics in Reinforcement Fine-Tuning of Large Language Models

On the Entropy Dynamics in Reinforcement Fine-Tuning of Large Language Models

Reinforcement Learning

Shumin Wang, Yuexiang Xie, Wenhao Zhang, et al.

OdysseyArena: Benchmarking Large Language Models For Long-Horizon, Active and Inductive Interactions

OdysseyArena: Benchmarking Large Language Models For Long-Horizon, Active and Inductive Interactions

Fangzhi Xu, Hang Yan, Qiushi Sun, et al.

Baichuan-M3: Modeling Clinical Inquiry for Reliable Medical Decision-Making

Baichuan-M3: Modeling Clinical Inquiry for Reliable Medical Decision-Making

Baichuan-M3 Team, Chengfeng Dou, Fan Yang, et al.