new

Get trending papers in your email inbox once a day!

Get trending papers in your email inbox!

Daily Papers

byAK and the research community

Feb 27

Submitted by

chengtan9907

The Trinity of Consistency as a Defining Principle for General World Models

opendatalab

Submitted by

jcy

From Blind Spots to Gains: Diagnostic-Driven Iterative Training for Large Multimodal Models

·
4 authors

Submitted by

xiaochonglinghu

MobilityBench: A Benchmark for Evaluating Route-Planning Agents in Real-World Mobility Scenarios

alibaba-inc

Submitted by

lixiaoxi45

OmniGAIA: Towards Native Omni-Modal AI Agents

·
11 authors

Submitted by

Michael4933

Imagination Helps Visual Reasoning, But Not Yet in Latent Space

Tsinghua University

Submitted by

beanie00

Exploratory Memory-Augmented LLM Agent via Hybrid On- and Off-Policy Optimization

microsoft

3

Submitted by

SunbowLiu

AgentDropoutV2: Optimizing Information Flow in Multi-Agent Systems via Test-Time Rectify-or-Reject Pruning

Harbin Institute of Technology

Submitted by

Qianben

Search More, Think Less: Rethinking Long-Horizon Agentic Search for Efficiency and Generalization

OPPOer

Submitted by

sahalshajim

MediX-R1: Open Ended Medical Reinforcement Learning

MBZUAI

Mohamed Bin Zayed University of Artificial Intelligence

Submitted by

Cabbalett

Accelerating Diffusion via Hybrid Data-Pipeline Parallelism Based on Conditional Guidance Scheduling

·
5 authors

Submitted by

sven-el

VGG-T^3: Offline Feed-Forward 3D Reconstruction at Scale

nvidia

2

Submitted by

WenjiaWang

EmbodMocap: In-the-Wild 4D Human-Scene Reconstruction for Embodied Agents

·
11 authors

Submitted by

borgr

General Agent Evaluation

ibm-research

Submitted by

lcying

AI Gamestore: Scalable, Open-Ended Evaluation of Machine General Intelligence with Human Games

MIT

Massachusetts Institute of Technology

Submitted by

taesiri

Causal Motion Diffusion Models for Autoregressive Motion Generation

·
3 authors

Submitted by

SteveZeyuZhang

GeoWorld: Geometric World Models

·
4 authors

4

Submitted by

taesiri

veScale-FSDP: Flexible and High-Performance FSDP at Scale

·
12 authors

Submitted by

billpsomas

Retrieve and Segment: Are a Few Examples Enough to Bridge the Supervision Gap in Open-Vocabulary Segmentation?

vrg-prague

Visual Recognition Group FEE CTU in Prague

Submitted by

pb09204048

Overconfident Errors Need Stronger Correction: Asymmetric Confidence Penalties for Reinforcement Learning

Submitted by

taesiri

Risk-Aware World Model Predictive Control for Generalizable End-to-End Autonomous Driving

·
7 authors

Submitted by

walterhernandez

DLT-Corpus: A Large-Scale Text Collection for the Distributed Ledger Technology Domain

ExponentialScience

Exponential Science

Submitted by

TahaKoleilat

MedCLIPSeg: Probabilistic Vision-Language Adaptation for Data-Efficient and Generalizable Medical Image Segmentation

·
6 authors

Submitted by

NicoleCho

No One Size Fits All: QueryBandits for Hallucination Mitigation

·
5 authors

Submitted by

NicoleCho

What Makes a Good Query? Measuring the Impact of Human-Confusing Linguistic Features on LLM Performance

·
4 authors

Submitted by

taesiri

DyaDiT: A Multi-Modal Diffusion Transformer for Socially Favorable Dyadic Gesture Generation

·
10 authors

Submitted by

zuazo

MEG-to-MEG Transfer Learning and Cross-Task Speech/Silence Detection with Limited Data

HiTZ

Submitted by

akhadangi

Efficient Continual Learning in Language Models via Thalamically Routed Cortical Columns

·
1 authors

2

Submitted by

cssen

Echoes Over Time: Unlocking Length Generalization in Video-to-Audio Generation Models

Sony