62.8 GB

1 contributor

History: 2 commits

RoxanneWsyw

Upload folder using huggingface_hub

d10f8ab verified 3 months ago

checkpoint-684
Upload folder using huggingface_hub 3 months ago
.gitattributes

1.52 kB

initial commit 3 months ago
README.md

1.38 kB

Upload folder using huggingface_hub 3 months ago
all_results.json

201 Bytes

Upload folder using huggingface_hub 3 months ago
config.json

1.58 kB

Upload folder using huggingface_hub 3 months ago
configuration_deepseek.py

10.3 kB

Upload folder using huggingface_hub 3 months ago
generation_config.json

181 Bytes

Upload folder using huggingface_hub 3 months ago
model-00001-of-00007.safetensors

4.99 GB
xet

Upload folder using huggingface_hub 3 months ago
model-00002-of-00007.safetensors

5 GB
xet

Upload folder using huggingface_hub 3 months ago
model-00003-of-00007.safetensors

5 GB
xet

Upload folder using huggingface_hub 3 months ago
model-00004-of-00007.safetensors

5 GB
xet

Upload folder using huggingface_hub 3 months ago
model-00005-of-00007.safetensors

5 GB
xet

Upload folder using huggingface_hub 3 months ago
model-00006-of-00007.safetensors

5 GB
xet

Upload folder using huggingface_hub 3 months ago
model-00007-of-00007.safetensors

1.44 GB
xet

Upload folder using huggingface_hub 3 months ago
model.safetensors.index.json

475 kB

Upload folder using huggingface_hub 3 months ago
modeling_deepseek.py

78.7 kB

Upload folder using huggingface_hub 3 months ago
special_tokens_map.json

466 Bytes

Upload folder using huggingface_hub 3 months ago
tokenizer.json

7.5 MB

Upload folder using huggingface_hub 3 months ago
tokenizer_config.json

1.59 kB

Upload folder using huggingface_hub 3 months ago
train_results.json

201 Bytes

Upload folder using huggingface_hub 3 months ago
trainer_log.jsonl

133 kB

Upload folder using huggingface_hub 3 months ago
trainer_state.json

119 kB

Upload folder using huggingface_hub 3 months ago
training_args.bin
Detected Pickle imports (14)
- "accelerate.utils.dataclasses.DistributedType",
- "accelerate.state.PartialState",
- "transformers.trainer_utils.SaveStrategy",
- "torch.device",
- "torch.bfloat16",
- "transformers.integrations.deepspeed.HfDeepSpeedConfig",
- "transformers.trainer_utils.HubStrategy",
- "transformers.training_args.OptimizerNames",
- "transformers.integrations.deepspeed.HfTrainerDeepSpeedConfig",
- "accelerate.utils.dataclasses.DeepSpeedPlugin",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "transformers.trainer_utils.IntervalStrategy",
- "llamafactory.hparams.training_args.TrainingArguments",
- "transformers.trainer_utils.SchedulerType"
How to fix it?
8.08 kB
xet

Upload folder using huggingface_hub 3 months ago
training_loss.png

44.6 kB

Upload folder using huggingface_hub 3 months ago

Detected Pickle imports (14)