DERL_Group

non-profit

Activity Feed

AI & ML interests

None defined yet.

Recent Activity

sitao authored a paper 1 day ago

From Atomic to Composite: Reinforcement Learning Enables Generalization in Complementary Reasoning

sitao updated a model 6 days ago

DifferentiableEvolutionaryRL/DERL-ALFWorld-L2-Qwen2.5-1.5B

sitao updated a model 6 days ago

DifferentiableEvolutionaryRL/DERL-ALFWorld-L1-Qwen2.5-1.5B

View all activity

Papers

Differentiable Evolutionary Reinforcement Learning

View all Papers

sitao

authored a paper 1 day ago

From Atomic to Composite: Reinforcement Learning Enables Generalization in Complementary Reasoning

Paper • 2512.01970 • Published 29 days ago • 1

sitao

updated 6 models 6 days ago

L3133625978

updated a model 9 days ago

DifferentiableEvolutionaryRL/DERL-ScienceWorld-L2-Qwen2.5-1.5B

2B • Updated 6 days ago • 14

L3133625978

published a model 9 days ago

DifferentiableEvolutionaryRL/DERL-ScienceWorld-L2-Qwen2.5-1.5B

2B • Updated 6 days ago • 14

L3133625978

updated a model 9 days ago

DifferentiableEvolutionaryRL/DERL-ScienceWorld-L1-Qwen2.5-1.5B

2B • Updated 6 days ago • 17

L3133625978

published a model 9 days ago

DifferentiableEvolutionaryRL/DERL-ScienceWorld-L1-Qwen2.5-1.5B

2B • Updated 6 days ago • 17

L3133625978

updated a model 9 days ago

DifferentiableEvolutionaryRL/DERL-ScienceWorld-L0-Qwen2.5-1.5B

2B • Updated 6 days ago • 14

L3133625978

published a model 9 days ago

DifferentiableEvolutionaryRL/DERL-ScienceWorld-L0-Qwen2.5-1.5B

2B • Updated 6 days ago • 14

L3133625978

updated a model 9 days ago

DifferentiableEvolutionaryRL/DERL-ALFWorld-L2-Qwen2.5-1.5B

2B • Updated 6 days ago • 32 • 1

L3133625978

published a model 9 days ago

DifferentiableEvolutionaryRL/DERL-ALFWorld-L2-Qwen2.5-1.5B

2B • Updated 6 days ago • 32 • 1

L3133625978

updated a model 9 days ago

DifferentiableEvolutionaryRL/DERL-ALFWorld-L1-Qwen2.5-1.5B

2B • Updated 6 days ago • 20

L3133625978

published a model 9 days ago

DifferentiableEvolutionaryRL/DERL-ALFWorld-L1-Qwen2.5-1.5B

2B • Updated 6 days ago • 20

sitao

updated a model 9 days ago

DifferentiableEvolutionaryRL/DERL-Meta-Optimizer-Init-Qwen2.5-0.5B-Instruct

Text Generation • 0.5B • Updated 9 days ago • 16

L3133625978

updated a model 9 days ago

DifferentiableEvolutionaryRL/DERL-ALFWorld-L0-Qwen2.5-1.5B

2B • Updated 6 days ago • 39 • 1

L3133625978

published a model 9 days ago

DifferentiableEvolutionaryRL/DERL-ALFWorld-L0-Qwen2.5-1.5B

2B • Updated 6 days ago • 39 • 1

AI & ML interests

Recent Activity

Papers

Team members 2

DifferentiableEvolutionaryRL's activity