Spaces:

iteratehack
/

deepbattler

Sleeping

App Files Files Community

deepbattler / RL

532 kB

2 contributors

History: 3 commits

lbtwyk

Update README to focus on RL training pipeline

fed1ca7 12 days ago

eval_battleground_rlaif.py

22.8 kB

Upload folder using huggingface_hub 12 days ago
eval_battleground_rlaif_gamehistory.py

25.6 kB

Upload folder using huggingface_hub 12 days ago
eval_gsm8k_qwen.py

27.8 kB

Upload folder using huggingface_hub 12 days ago
flatten_game_history.py

5.71 kB

Upload folder using huggingface_hub 12 days ago
gsm8k_test.json

381 kB

Upload folder using huggingface_hub 12 days ago
infer_battleground_cloud.py

11.8 kB

Update README to focus on RL training pipeline 12 days ago
rewrite_battleground_rewards.py

1.99 kB

Upload folder using huggingface_hub 12 days ago
train_battleground_rlaif.py

17.8 kB

Upload folder using huggingface_hub 12 days ago
train_battleground_rlaif_gamehistory.py

25.6 kB

Upload folder using huggingface_hub 12 days ago
train_gsm8k_qwen_grpo.py

12.7 kB

Upload folder using huggingface_hub 12 days ago