torchao-testing
/

opt-125m-ModuleFqnToConfig-v1-regex-0.14.0.dev

PyTorch

opt

torchao

Model card Files Files and versions

xet

Community

jerryzh168 commited on Oct 1

Commit

44b9297

verified ·

1 Parent(s): b5a2f00

Upload OPTForCausalLM

Browse files

Files changed (2) hide show

config.json +162 -1
pytorch_model.bin +2 -2

config.json CHANGED Viewed

@@ -146,7 +146,116 @@
               "_type": "Float8DynamicActivationFloat8WeightConfig",
               "_version": 2
             },
-            "model.decoder.layers.*.self_attn.v_proj": null,
             "model.decoder.layers.3.self_attn.q_proj": {
               "_data": {
                 "group_size": 128,
@@ -172,6 +281,58 @@
               },
               "_type": "Int4WeightOnlyConfig",
               "_version": 2
             }
           }
         },

               "_type": "Float8DynamicActivationFloat8WeightConfig",
               "_version": 2
             },
+            "model.decoder.layers.*.self_attn.qkv_proj": {
+              "_data": {
+                "activation_dtype": {
+                  "_data": "float8_e4m3fn",
+                  "_type": "torch.dtype"
+                },
+                "activation_value_lb": null,
+                "activation_value_ub": null,
+                "granularity": [
+                  {
+                    "_data": {},
+                    "_type": "PerRow",
+                    "_version": 1
+                  },
+                  {
+                    "_data": {},
+                    "_type": "PerRow",
+                    "_version": 1
+                  }
+                ],
+                "kernel_preference": {
+                  "_data": "AUTO",
+                  "_type": "KernelPreference"
+                },
+                "mm_config": {
+                  "_data": {
+                    "emulate": false,
+                    "pad_inner_dim": false,
+                    "use_fast_accum": true
+                  },
+                  "_type": "Float8MMConfig",
+                  "_version": 1
+                },
+                "set_inductor_config": true,
+                "weight_dtype": {
+                  "_data": "float8_e4m3fn",
+                  "_type": "torch.dtype"
+                }
+              },
+              "_type": "Float8DynamicActivationFloat8WeightConfig",
+              "_version": 2
+            },
+            "model.decoder.layers.*.self_attn.v_proj": {
+              "_data": {
+                "activation_dtype": {
+                  "_data": "float8_e4m3fn",
+                  "_type": "torch.dtype"
+                },
+                "activation_value_lb": null,
+                "activation_value_ub": null,
+                "granularity": [
+                  {
+                    "_data": {},
+                    "_type": "PerRow",
+                    "_version": 1
+                  },
+                  {
+                    "_data": {},
+                    "_type": "PerRow",
+                    "_version": 1
+                  }
+                ],
+                "kernel_preference": {
+                  "_data": "AUTO",
+                  "_type": "KernelPreference"
+                },
+                "mm_config": {
+                  "_data": {
+                    "emulate": false,
+                    "pad_inner_dim": false,
+                    "use_fast_accum": true
+                  },
+                  "_type": "Float8MMConfig",
+                  "_version": 1
+                },
+                "set_inductor_config": true,
+                "weight_dtype": {
+                  "_data": "float8_e4m3fn",
+                  "_type": "torch.dtype"
+                }
+              },
+              "_type": "Float8DynamicActivationFloat8WeightConfig",
+              "_version": 2
+            },
+            "model.decoder.layers.3.self_attn.k_proj": {
+              "_data": {
+                "group_size": 128,
+                "int4_choose_qparams_algorithm": {
+                  "_data": "TINYGEMM",
+                  "_type": "Int4ChooseQParamsAlgorithm"
+                },
+                "int4_packing_format": "tile_packed_to_4d",
+                "layout": {
+                  "_data": {
+                    "inner_k_tiles": 8
+                  },
+                  "_type": "TensorCoreTiledLayout",
+                  "_version": 1
+                },
+                "preserve_zero": null,
+                "set_inductor_config": true,
+                "use_hqq": false,
+                "zero_point_domain": {
+                  "_data": "NONE",
+                  "_type": "ZeroPointDomain"
+                }
+              },
+              "_type": "Int4WeightOnlyConfig",
+              "_version": 2
+            },
             "model.decoder.layers.3.self_attn.q_proj": {
               "_data": {
                 "group_size": 128,
               },
               "_type": "Int4WeightOnlyConfig",
               "_version": 2
+            },
+            "model.decoder.layers.3.self_attn.qkv_proj": {
+              "_data": {
+                "group_size": 128,
+                "int4_choose_qparams_algorithm": {
+                  "_data": "TINYGEMM",
+                  "_type": "Int4ChooseQParamsAlgorithm"
+                },
+                "int4_packing_format": "tile_packed_to_4d",
+                "layout": {
+                  "_data": {
+                    "inner_k_tiles": 8
+                  },
+                  "_type": "TensorCoreTiledLayout",
+                  "_version": 1
+                },
+                "preserve_zero": null,
+                "set_inductor_config": true,
+                "use_hqq": false,
+                "zero_point_domain": {
+                  "_data": "NONE",
+                  "_type": "ZeroPointDomain"
+                }
+              },
+              "_type": "Int4WeightOnlyConfig",
+              "_version": 2
+            },
+            "model.decoder.layers.3.self_attn.v_proj": {
+              "_data": {
+                "group_size": 128,
+                "int4_choose_qparams_algorithm": {
+                  "_data": "TINYGEMM",
+                  "_type": "Int4ChooseQParamsAlgorithm"
+                },
+                "int4_packing_format": "tile_packed_to_4d",
+                "layout": {
+                  "_data": {
+                    "inner_k_tiles": 8
+                  },
+                  "_type": "TensorCoreTiledLayout",
+                  "_version": 1
+                },
+                "preserve_zero": null,
+                "set_inductor_config": true,
+                "use_hqq": false,
+                "zero_point_domain": {
+                  "_data": "NONE",
+                  "_type": "ZeroPointDomain"
+                }
+              },
+              "_type": "Int4WeightOnlyConfig",
+              "_version": 2
             }
           }
         },

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0fcc8b6a9f362d0889f1bed6f31fa75d2ae0f4940ddc4f9b94a0de75200697db
-size 172790515

 version https://git-lfs.github.com/spec/v1
+oid sha256:ba0b5936d6428aeb848faa96c1a37bb8b3bb549620c7213d5bba28374782aff3
+size 165404707