Upload folder using huggingface_hub

Browse files

Files changed (4) hide show

flip_vit_b16_s512m_bs16k/checkpoints/epoch_4.pt +3 -0
flip_vit_b16_s512m_bs16k/checkpoints/results.jsonl +7 -0
flip_vit_b16_s512m_bs16k/out.log +0 -0
flip_vit_b16_s512m_bs16k/params.txt +109 -0

flip_vit_b16_s512m_bs16k/checkpoints/epoch_4.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4ef56b70199aff223bcaf5ded3ad1ff024c6e43ad2c47a47618e755b20dfb2ed
+size 1795823122

flip_vit_b16_s512m_bs16k/checkpoints/results.jsonl ADDED Viewed

	@@ -0,0 +1,7 @@

+{"imagenet-zeroshot-val-top1": 0.34178, "imagenet-zeroshot-val-top5": 0.61662}
+{"imagenet-zeroshot-val-top1": 0.43266, "imagenet-zeroshot-val-top5": 0.7194}
+{"imagenet-zeroshot-val-top1": 0.4736, "imagenet-zeroshot-val-top5": 0.75818}
+{"imagenet-zeroshot-val-top1": 0.49378, "imagenet-zeroshot-val-top5": 0.77458}
+{"imagenet-zeroshot-val-top1": 0.55004, "imagenet-zeroshot-val-top5": 0.82504}
+{"imagenet-zeroshot-val-top1": 0.5815, "imagenet-zeroshot-val-top5": 0.84318}
+{"imagenet-zeroshot-val-top1": 0.58112, "imagenet-zeroshot-val-top5": 0.84332}

flip_vit_b16_s512m_bs16k/out.log ADDED Viewed

The diff for this file is too large to render. See raw diff

flip_vit_b16_s512m_bs16k/params.txt ADDED Viewed

	@@ -0,0 +1,109 @@

+NDR_patch_size: 16
+accum_freq: 1
+aug_cfg: {}
+batch_size: 2048
+beta1: 0.9
+beta2: 0.98
+checkpoint_path: ./logs-lr1e-3-datacomp/flip_vit_b16_s512m_bs16k/checkpoints
+coca_caption_loss_weight: 2.0
+coca_contrastive_loss_weight: 1.0
+copy_codebase: False
+csv_caption_key: title
+csv_img_key: filepath
+csv_separator:
+dataset_resampled: False
+dataset_type: webdataset
+ddp_static_graph: True
+debug: False
+delete_prev_step_ckpt: True
+delete_previous_checkpoint: False
+device: cuda:0
+dist_backend: nccl
+dist_url: env://
+distill: False
+distill_model: None
+distill_pretrained: None
+distributed: True
+epochs: 4
+epochs_cooldown: None
+eps: 1e-06
+force_custom_text: False
+force_image_size: 224
+force_patch_dropout: None
+force_quick_gelu: False
+gather_with_grad: True
+global_batch_size: 16384
+grad_checkpointing: True
+grad_clip_norm: None
+horovod: False
+image_interpolation: None
+image_mean: None
+image_resize_mode: None
+image_std: None
+imagenet_v2: None
+imagenet_val: /mnt/bn/zilongdata-hl/dataset/imagenet/val
+is_cls_token: False
+local_loss: True
+local_rank: 0
+lock_image: False
+lock_image_freeze_bn_stats: False
+lock_image_unlocked_groups: 0
+lock_text: False
+lock_text_freeze_layer_norm: False
+lock_text_unlocked_layers: 0
+log_every_n_steps: 128
+log_level: 20
+log_local: False
+log_path: ./logs-lr1e-3-datacomp/flip_vit_b16_s512m_bs16k/out.log
+logs: ./logs-lr1e-3-datacomp
+lr: 0.001
+lr_cooldown_end: 0.0
+lr_cooldown_power: 1.0
+lr_scheduler: cosine
+max_seq_len: 100000000000000
+model: ViT-B-16-FLIP
+name: flip_vit_b16_s512m_bs16k
+native_dynamic_resolution: False
+no_set_device_rank: False
+only_packing: True
+precision: amp
+pretrained:
+pretrained_image:
+pretrained_text:
+rank: 0
+remote_sync: None
+remote_sync_frequency: 300
+remote_sync_protocol: s3
+report_to: wandb
+resume: None
+rope_attn_num_heads: 12
+rope_model_width: 768
+save_every_n_steps: 6104
+save_frequency: 1
+save_most_recent: False
+seed: 0
+siglip: False
+skip_scheduler: False
+tensorboard: False
+tensorboard_path:
+torchcompile: False
+torchscript: False
+trace: False
+train_data: /mnt/bn/zilongdata-hl/dataset/Recap-DataComp-1B-Dataset/{000000..140146}.tar
+train_data_upsampling_factors: None
+train_num_samples: 128000000
+use_bn_sync: False
+use_bnb_linear: None
+val_data: None
+val_frequency: 1
+val_num_samples: None
+val_steps: 6104
+wandb: True
+wandb_notes:
+wandb_project_name: cls-clip-NDR
+warmup: 500
+wd: 0.2
+workers: 6
+world_size: 8
+zeroshot_frequency: 2
+zeroshot_steps: 6104