JeonghyeKim's picture

1 3

JeonghyeKim

beanie00

·

https://www.beanie00.com

AI & ML interests

None yet

Recent Activity

updated a model 28 minutes ago

beanie00/Qwen3-8B-Base_sft_v1

published a model 35 minutes ago

beanie00/Qwen3-8B-Base_sft_v1

authored a paper 5 months ago

Penalizing Infeasible Actions and Reward Scaling in Reinforcement Learning with Offline Data

View all activity

Organizations

None yet

Papers 5

arxiv:2507.08761

arxiv:2505.15182

arxiv:2402.02017

arxiv:2310.03342

models 1

beanie00/Qwen3-8B-Base_sft_v1

308k • Updated 28 minutes ago

datasets 0

None public yet