dacorvo HF Staff commited on 1 day ago

Commit

5dc3044

verified ·

1 Parent(s): f1460ba

Synchronizing local compiler cache.

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

.gitattributes +29 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_454cbfa5310f70cadd4c+617f6939/compile_flags.json +1 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_454cbfa5310f70cadd4c+617f6939/model.done +0 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_454cbfa5310f70cadd4c+617f6939/model.hlo_module.pb +3 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_454cbfa5310f70cadd4c+617f6939/model.neff +3 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_454cbfa5310f70cadd4c+617f6939/wrapped_neff.hlo +3 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_4b55e4f26a3acec8be46+617f6939/compile_flags.json +1 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_4b55e4f26a3acec8be46+617f6939/model.done +0 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_4b55e4f26a3acec8be46+617f6939/model.hlo_module.pb +3 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_4b55e4f26a3acec8be46+617f6939/model.neff +3 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_4b55e4f26a3acec8be46+617f6939/wrapped_neff.hlo +3 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_5122ddbc31f7f615af79+617f6939/compile_flags.json +1 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_5122ddbc31f7f615af79+617f6939/model.done +0 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_5122ddbc31f7f615af79+617f6939/model.hlo_module.pb +3 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_5122ddbc31f7f615af79+617f6939/model.neff +3 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_5122ddbc31f7f615af79+617f6939/wrapped_neff.hlo +3 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_8926597e9069871b192d+ad9e832d/compile_flags.json +1 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_8926597e9069871b192d+ad9e832d/model.done +0 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_8926597e9069871b192d+ad9e832d/model.hlo_module.pb +3 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_8926597e9069871b192d+ad9e832d/model.neff +3 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_9a73716a575cb3cb95df+ad9e832d/compile_flags.json +1 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_9a73716a575cb3cb95df+ad9e832d/model.done +0 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_9a73716a575cb3cb95df+ad9e832d/model.hlo_module.pb +3 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_9a73716a575cb3cb95df+ad9e832d/model.neff +3 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_b3fcf757bda6afe1679e+ad9e832d/compile_flags.json +1 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_b3fcf757bda6afe1679e+ad9e832d/model.done +0 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_b3fcf757bda6afe1679e+ad9e832d/model.hlo_module.pb +3 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_b3fcf757bda6afe1679e+ad9e832d/model.neff +3 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_eacd5f9beef23723ae4a+617f6939/compile_flags.json +1 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_eacd5f9beef23723ae4a+617f6939/model.done +0 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_eacd5f9beef23723ae4a+617f6939/model.hlo_module.pb +3 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_eacd5f9beef23723ae4a+617f6939/model.neff +3 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_eacd5f9beef23723ae4a+617f6939/wrapped_neff.hlo +3 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_f8b4f545fd646928f740+ad9e832d/compile_flags.json +1 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_f8b4f545fd646928f740+ad9e832d/model.done +0 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_f8b4f545fd646928f740+ad9e832d/model.hlo_module.pb +3 -0
neuronxcc-2.21.18209.0+043b1bf7/MODULE_f8b4f545fd646928f740+ad9e832d/model.neff +3 -0
neuronxcc-2.21.33363.0+82129205/0_REGISTRY/0.4.3.dev3/llama/meta-llama/Llama-3.1-8B-Instruct/0451dd4ad8e23b64aa0c.json +63 -0
neuronxcc-2.21.33363.0+82129205/0_REGISTRY/0.4.3.dev3/llama/meta-llama/Llama-3.1-8B-Instruct/837dd017e8ae4530668c.json +63 -0
neuronxcc-2.21.33363.0+82129205/0_REGISTRY/0.4.3.dev3/llama/meta-llama/Llama-3.1-8B-Instruct/a36d353642d325c5397f.json +63 -0
neuronxcc-2.21.33363.0+82129205/0_REGISTRY/0.4.3.dev3/llama/meta-llama/Llama-3.1-8B-Instruct/cfdcd4c75495aba1f95d.json +63 -0
neuronxcc-2.21.33363.0+82129205/0_REGISTRY/0.4.3.dev3/llama/unsloth/Llama-3.2-1B-Instruct/0fef0800e360b8e2aa85.json +64 -0
neuronxcc-2.21.33363.0+82129205/0_REGISTRY/0.4.3.dev3/llama/unsloth/Llama-3.2-1B-Instruct/3403115c880863fe4065.json +63 -0
neuronxcc-2.21.33363.0+82129205/0_REGISTRY/0.4.3.dev3/llama/unsloth/Llama-3.2-1B-Instruct/98b3fa9a890ef0e1f391.json +64 -0
neuronxcc-2.21.33363.0+82129205/0_REGISTRY/0.4.3.dev3/llama/unsloth/Llama-3.2-1B-Instruct/a6f67c366d986ef4b636.json +64 -0
neuronxcc-2.21.33363.0+82129205/0_REGISTRY/0.4.3.dev3/llama/unsloth/Llama-3.2-1B-Instruct/c87e429d1d13a13279bd.json +64 -0
neuronxcc-2.21.33363.0+82129205/0_REGISTRY/0.4.3.dev3/llama/unsloth/Llama-3.2-1B-Instruct/cfe0f6333cc973602102.json +64 -0
neuronxcc-2.21.33363.0+82129205/0_REGISTRY/0.4.3.dev3/llama/unsloth/Llama-3.2-1B-Instruct/e75d2005d39261b7d1d8.json +64 -0
neuronxcc-2.21.33363.0+82129205/MODULE_03563a07b466ff1a7583+24129607/compile_flags.json +1 -0
neuronxcc-2.21.33363.0+82129205/MODULE_03563a07b466ff1a7583+24129607/model.done +0 -0

.gitattributes CHANGED Viewed

@@ -5708,3 +5708,32 @@ neuronxcc-2.21.33363.0+82129205/MODULE_ccc2d4abbb67d5b7286f+a02c3a36/model.neff
 neuronxcc-2.21.33363.0+82129205/MODULE_ccc2d4abbb67d5b7286f+a02c3a36/wrapped_neff.hlo filter=lfs diff=lfs merge=lfs -text
 neuronxcc-2.21.33363.0+82129205/MODULE_77f1b8fbe51833738f1c+24129607/model.neff filter=lfs diff=lfs merge=lfs -text
 neuronxcc-2.21.33363.0+82129205/MODULE_7b28cd1e3dc6bc844fa3+24129607/model.neff filter=lfs diff=lfs merge=lfs -text

 neuronxcc-2.21.33363.0+82129205/MODULE_ccc2d4abbb67d5b7286f+a02c3a36/wrapped_neff.hlo filter=lfs diff=lfs merge=lfs -text
 neuronxcc-2.21.33363.0+82129205/MODULE_77f1b8fbe51833738f1c+24129607/model.neff filter=lfs diff=lfs merge=lfs -text
 neuronxcc-2.21.33363.0+82129205/MODULE_7b28cd1e3dc6bc844fa3+24129607/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.18209.0+043b1bf7/MODULE_454cbfa5310f70cadd4c+617f6939/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.18209.0+043b1bf7/MODULE_454cbfa5310f70cadd4c+617f6939/wrapped_neff.hlo filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.18209.0+043b1bf7/MODULE_4b55e4f26a3acec8be46+617f6939/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.18209.0+043b1bf7/MODULE_4b55e4f26a3acec8be46+617f6939/wrapped_neff.hlo filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.18209.0+043b1bf7/MODULE_5122ddbc31f7f615af79+617f6939/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.18209.0+043b1bf7/MODULE_5122ddbc31f7f615af79+617f6939/wrapped_neff.hlo filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.18209.0+043b1bf7/MODULE_8926597e9069871b192d+ad9e832d/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.18209.0+043b1bf7/MODULE_9a73716a575cb3cb95df+ad9e832d/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.18209.0+043b1bf7/MODULE_b3fcf757bda6afe1679e+ad9e832d/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.18209.0+043b1bf7/MODULE_eacd5f9beef23723ae4a+617f6939/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.18209.0+043b1bf7/MODULE_eacd5f9beef23723ae4a+617f6939/wrapped_neff.hlo filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.18209.0+043b1bf7/MODULE_f8b4f545fd646928f740+ad9e832d/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.33363.0+82129205/MODULE_03563a07b466ff1a7583+24129607/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.33363.0+82129205/MODULE_1351bde3344f209ba8a1+24129607/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.33363.0+82129205/MODULE_20ded251b25e18aad5b0+24129607/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.33363.0+82129205/MODULE_35a63695aeefa2d44798+24129607/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.33363.0+82129205/MODULE_69ce67073ba646143ed4+24129607/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.33363.0+82129205/MODULE_7c2638502a7538102290+a02c3a36/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.33363.0+82129205/MODULE_7c2638502a7538102290+a02c3a36/wrapped_neff.hlo filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.33363.0+82129205/MODULE_8976186fc1a14a570398+24129607/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.33363.0+82129205/MODULE_b1cd3aa0106a6921386d+a02c3a36/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.33363.0+82129205/MODULE_b1cd3aa0106a6921386d+a02c3a36/wrapped_neff.hlo filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.33363.0+82129205/MODULE_d053e5a2bdf45f8b64ef+a02c3a36/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.33363.0+82129205/MODULE_d053e5a2bdf45f8b64ef+a02c3a36/wrapped_neff.hlo filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.33363.0+82129205/MODULE_dc7fcef2e19ad392688a+24129607/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.33363.0+82129205/MODULE_eadbca4e425481d07426+24129607/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.33363.0+82129205/MODULE_f03f06a24a40a8dbe7e1+24129607/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.33363.0+82129205/MODULE_fd44e24d672157f0bc14+a02c3a36/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.21.33363.0+82129205/MODULE_fd44e24d672157f0bc14+a02c3a36/wrapped_neff.hlo filter=lfs diff=lfs merge=lfs -text

neuronxcc-2.21.18209.0+043b1bf7/MODULE_454cbfa5310f70cadd4c+617f6939/compile_flags.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ ["--target=trn1", "--auto-cast=none", "--model-type=transformer", "--tensorizer-options=--enable-ccop-compute-overlap --cc-pipeline-tiling-factor=1 --vectorize-strided-dma ", "--lnc=1", "-O2", "--internal-hlo2tensorizer-options=--verify-hlo=true", "--logfile=/tmp/nxd_model/token_generation_model/_tp0_bk0/log-neuron-cc.txt", "--enable-internal-neff-wrapper"]

neuronxcc-2.21.18209.0+043b1bf7/MODULE_454cbfa5310f70cadd4c+617f6939/model.done ADDED Viewed

File without changes

neuronxcc-2.21.18209.0+043b1bf7/MODULE_454cbfa5310f70cadd4c+617f6939/model.hlo_module.pb ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:eaac8a0d1057bbcaaf5fc3dc85fa7699af59ddc07c1c26435640d6112acceff2
+size 378947

neuronxcc-2.21.18209.0+043b1bf7/MODULE_454cbfa5310f70cadd4c+617f6939/model.neff ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f24564b3a426253a6c9a58a73a9dedf7df1bb3c4ae4f9c3029d426f107c9c7b4
+size 1926144

neuronxcc-2.21.18209.0+043b1bf7/MODULE_454cbfa5310f70cadd4c+617f6939/wrapped_neff.hlo ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b7485e701ed5c6302ee1967ad86e7d57db68d08f66dca5344c6ee9783377ef51
+size 2000256

neuronxcc-2.21.18209.0+043b1bf7/MODULE_4b55e4f26a3acec8be46+617f6939/compile_flags.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ ["--target=trn1", "--auto-cast=none", "--model-type=transformer", "--tensorizer-options=--enable-ccop-compute-overlap --cc-pipeline-tiling-factor=1 --vectorize-strided-dma ", "--lnc=1", "-O2", "--internal-hlo2tensorizer-options=--verify-hlo=true", "--logfile=/tmp/nxd_model/token_generation_model/_tp0_bk0/log-neuron-cc.txt", "--enable-internal-neff-wrapper"]

neuronxcc-2.21.18209.0+043b1bf7/MODULE_4b55e4f26a3acec8be46+617f6939/model.done ADDED Viewed

File without changes

neuronxcc-2.21.18209.0+043b1bf7/MODULE_4b55e4f26a3acec8be46+617f6939/model.hlo_module.pb ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8c69e83428c93f3412168937e1df467dd69d10ef46e9576f1fcb96de906e1a86
+size 382812

neuronxcc-2.21.18209.0+043b1bf7/MODULE_4b55e4f26a3acec8be46+617f6939/model.neff ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:76209c24a04f98926f0cfe3fb63de3d27ef082dcdb30d4fec9ee2de7c5f18d37
+size 3032064

neuronxcc-2.21.18209.0+043b1bf7/MODULE_4b55e4f26a3acec8be46+617f6939/wrapped_neff.hlo ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ca1eb5edafa963dab3105d66b6044e615664da9c73f0a1a998f7ea8ae9ba07b7
+size 3106169

neuronxcc-2.21.18209.0+043b1bf7/MODULE_5122ddbc31f7f615af79+617f6939/compile_flags.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ ["--target=trn1", "--auto-cast=none", "--model-type=transformer", "--tensorizer-options=--enable-ccop-compute-overlap --cc-pipeline-tiling-factor=1 --vectorize-strided-dma ", "--lnc=1", "-O2", "--internal-hlo2tensorizer-options=--verify-hlo=true", "--logfile=/tmp/nxd_model/token_generation_model/_tp0_bk0/log-neuron-cc.txt", "--enable-internal-neff-wrapper"]

neuronxcc-2.21.18209.0+043b1bf7/MODULE_5122ddbc31f7f615af79+617f6939/model.done ADDED Viewed

File without changes

neuronxcc-2.21.18209.0+043b1bf7/MODULE_5122ddbc31f7f615af79+617f6939/model.hlo_module.pb ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4d430b5a352b7fbee3742c299062adfd10f1232b12cd924c52e979764a23e3f8
+size 382348

neuronxcc-2.21.18209.0+043b1bf7/MODULE_5122ddbc31f7f615af79+617f6939/model.neff ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e24de20088f1002f739a76dff410698f254aab56f4dbdd8cdd5e85d2770eaa7c
+size 2049024

neuronxcc-2.21.18209.0+043b1bf7/MODULE_5122ddbc31f7f615af79+617f6939/wrapped_neff.hlo ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5f5ca74126a5794dacf54743b1bbfd785f5eb4f45e34cb5f0280e864eeb78a0a
+size 2123112

neuronxcc-2.21.18209.0+043b1bf7/MODULE_8926597e9069871b192d+ad9e832d/compile_flags.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ ["--target=trn1", "--auto-cast=none", "--model-type=transformer", "--tensorizer-options=--enable-ccop-compute-overlap --cc-pipeline-tiling-factor=2 --vectorize-strided-dma ", "--lnc=1", "-O1", "--internal-hlo2tensorizer-options= --modular-flow-mac-threshold=10 --verify-hlo=true", "--logfile=/tmp/nxd_model/context_encoding_model/_tp0_bk0/log-neuron-cc.txt"]

neuronxcc-2.21.18209.0+043b1bf7/MODULE_8926597e9069871b192d+ad9e832d/model.done ADDED Viewed

File without changes

neuronxcc-2.21.18209.0+043b1bf7/MODULE_8926597e9069871b192d+ad9e832d/model.hlo_module.pb ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e997c4e79e96cbcb32a125f0d039e049ef9db52977baa2ba2ff1c61cc44f8728
+size 472299

neuronxcc-2.21.18209.0+043b1bf7/MODULE_8926597e9069871b192d+ad9e832d/model.neff ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1f6f412e048ddcb9a23fa9f92216ff3eeeb3eeeb78a0c4c5aada3c1962097b44
+size 8203264

neuronxcc-2.21.18209.0+043b1bf7/MODULE_9a73716a575cb3cb95df+ad9e832d/compile_flags.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ ["--target=trn1", "--auto-cast=none", "--model-type=transformer", "--tensorizer-options=--enable-ccop-compute-overlap --cc-pipeline-tiling-factor=2 --vectorize-strided-dma ", "--lnc=1", "-O1", "--internal-hlo2tensorizer-options= --modular-flow-mac-threshold=10 --verify-hlo=true", "--logfile=/tmp/nxd_model/context_encoding_model/_tp0_bk0/log-neuron-cc.txt"]

neuronxcc-2.21.18209.0+043b1bf7/MODULE_9a73716a575cb3cb95df+ad9e832d/model.done ADDED Viewed

File without changes

neuronxcc-2.21.18209.0+043b1bf7/MODULE_9a73716a575cb3cb95df+ad9e832d/model.hlo_module.pb ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a62f6d9bc9df3e2de19505d67e63c54515ab460fea5371f2c82e9e8d3c67322b
+size 467299

neuronxcc-2.21.18209.0+043b1bf7/MODULE_9a73716a575cb3cb95df+ad9e832d/model.neff ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7b4934ab602c98cf48c3c0047ec8bdd1706da17f5f5e7e9542e04045911cfeb3
+size 4363264

neuronxcc-2.21.18209.0+043b1bf7/MODULE_b3fcf757bda6afe1679e+ad9e832d/compile_flags.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ ["--target=trn1", "--auto-cast=none", "--model-type=transformer", "--tensorizer-options=--enable-ccop-compute-overlap --cc-pipeline-tiling-factor=2 --vectorize-strided-dma ", "--lnc=1", "-O1", "--internal-hlo2tensorizer-options= --modular-flow-mac-threshold=10 --verify-hlo=true", "--logfile=/tmp/nxd_model/context_encoding_model/_tp0_bk0/log-neuron-cc.txt"]

neuronxcc-2.21.18209.0+043b1bf7/MODULE_b3fcf757bda6afe1679e+ad9e832d/model.done ADDED Viewed

File without changes

neuronxcc-2.21.18209.0+043b1bf7/MODULE_b3fcf757bda6afe1679e+ad9e832d/model.hlo_module.pb ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fb0b4a58bc33a450116485bdc97c80db38b76b6cf227f1a396467a16f8a24120
+size 463666

neuronxcc-2.21.18209.0+043b1bf7/MODULE_b3fcf757bda6afe1679e+ad9e832d/model.neff ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ed1635305f59594bb96729057bfbd84fefd31db1795f3e1248314ef8e7b6e273
+size 3953664

neuronxcc-2.21.18209.0+043b1bf7/MODULE_eacd5f9beef23723ae4a+617f6939/compile_flags.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ ["--target=trn1", "--auto-cast=none", "--model-type=transformer", "--tensorizer-options=--enable-ccop-compute-overlap --cc-pipeline-tiling-factor=1 --vectorize-strided-dma ", "--lnc=1", "-O2", "--internal-hlo2tensorizer-options=--verify-hlo=true", "--logfile=/tmp/nxd_model/token_generation_model/_tp0_bk0/log-neuron-cc.txt", "--enable-internal-neff-wrapper"]

neuronxcc-2.21.18209.0+043b1bf7/MODULE_eacd5f9beef23723ae4a+617f6939/model.done ADDED Viewed

File without changes

neuronxcc-2.21.18209.0+043b1bf7/MODULE_eacd5f9beef23723ae4a+617f6939/model.hlo_module.pb ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0b6e644ce4a647575cac6ee8a2b724e7eeddce2a15d81873dcb06658ee9b43c2
+size 374121

neuronxcc-2.21.18209.0+043b1bf7/MODULE_eacd5f9beef23723ae4a+617f6939/model.neff ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:27888041c8321fa7821e9e2462fa24906b92a55403e477ad4270efcf29f80abf
+size 1117184

neuronxcc-2.21.18209.0+043b1bf7/MODULE_eacd5f9beef23723ae4a+617f6939/wrapped_neff.hlo ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:79f4497b6c14d756912c64bdf11a914fbeeea99ea086717893013947ddb15959
+size 1209802

neuronxcc-2.21.18209.0+043b1bf7/MODULE_f8b4f545fd646928f740+ad9e832d/compile_flags.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ ["--target=trn1", "--auto-cast=none", "--model-type=transformer", "--tensorizer-options=--enable-ccop-compute-overlap --cc-pipeline-tiling-factor=2 --vectorize-strided-dma ", "--lnc=1", "-O1", "--internal-hlo2tensorizer-options= --modular-flow-mac-threshold=10 --verify-hlo=true", "--logfile=/tmp/nxd_model/context_encoding_model/_tp0_bk0/log-neuron-cc.txt"]

neuronxcc-2.21.18209.0+043b1bf7/MODULE_f8b4f545fd646928f740+ad9e832d/model.done ADDED Viewed

File without changes

neuronxcc-2.21.18209.0+043b1bf7/MODULE_f8b4f545fd646928f740+ad9e832d/model.hlo_module.pb ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2a4ab156514485dbf5d74db2535e84136a07f17752c578320af5984844defbff
+size 468446

neuronxcc-2.21.18209.0+043b1bf7/MODULE_f8b4f545fd646928f740+ad9e832d/model.neff ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:aa6791c3341dd45d1cdf2724e98350fb7b1b08c8198db84fcd650b33c04117b0
+size 22252544

neuronxcc-2.21.33363.0+82129205/0_REGISTRY/0.4.3.dev3/llama/meta-llama/Llama-3.1-8B-Instruct/0451dd4ad8e23b64aa0c.json ADDED Viewed

	@@ -0,0 +1,63 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "meta-llama/Llama-3.1-8B-Instruct",
+  "_task": "text-generation",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "dtype": "bfloat16",
+  "head_dim": 128,
+  "hidden_act": "silu",
+  "hidden_size": 4096,
+  "initializer_range": 0.02,
+  "intermediate_size": 14336,
+  "max_position_embeddings": 131072,
+  "mlp_bias": false,
+  "model_type": "llama",
+  "neuron": {
+    "_serialized_key": "NxDNeuronConfig",
+    "batch_size": 1,
+    "capacity_factor": null,
+    "checkpoint_id": "meta-llama/Llama-3.1-8B-Instruct",
+    "checkpoint_revision": "0e9e39f249a16976918f6564b8830bc894c89659",
+    "continuous_batching": false,
+    "ep_degree": 1,
+    "fused_qkv": true,
+    "glu_mlp": true,
+    "local_ranks_size": 2,
+    "max_batch_size": 1,
+    "max_context_length": 4096,
+    "max_topk": 256,
+    "n_active_tokens": 4096,
+    "neuronxcc_version": "2.21.33363.0+82129205",
+    "on_device_sampling": true,
+    "optimum_neuron_version": "0.4.3.dev3",
+    "output_logits": false,
+    "pp_degree": 1,
+    "sequence_length": 4096,
+    "sequence_parallel_enabled": true,
+    "speculation_length": 0,
+    "start_rank_id": 0,
+    "target": "trn1",
+    "torch_dtype": "bfloat16",
+    "tp_degree": 2
+  },
+  "num_attention_heads": 32,
+  "num_hidden_layers": 32,
+  "num_key_value_heads": 8,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": {
+    "factor": 8.0,
+    "high_freq_factor": 4.0,
+    "low_freq_factor": 1.0,
+    "original_max_position_embeddings": 8192,
+    "rope_type": "llama3"
+  },
+  "rope_theta": 500000.0,
+  "tie_word_embeddings": false,
+  "use_cache": true,
+  "vocab_size": 128256
+}

neuronxcc-2.21.33363.0+82129205/0_REGISTRY/0.4.3.dev3/llama/meta-llama/Llama-3.1-8B-Instruct/837dd017e8ae4530668c.json ADDED Viewed

	@@ -0,0 +1,63 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "meta-llama/Llama-3.1-8B-Instruct",
+  "_task": "text-generation",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "dtype": "bfloat16",
+  "head_dim": 128,
+  "hidden_act": "silu",
+  "hidden_size": 4096,
+  "initializer_range": 0.02,
+  "intermediate_size": 14336,
+  "max_position_embeddings": 131072,
+  "mlp_bias": false,
+  "model_type": "llama",
+  "neuron": {
+    "_serialized_key": "NxDNeuronConfig",
+    "batch_size": 1,
+    "capacity_factor": null,
+    "checkpoint_id": "meta-llama/Llama-3.1-8B-Instruct",
+    "checkpoint_revision": "0e9e39f249a16976918f6564b8830bc894c89659",
+    "continuous_batching": false,
+    "ep_degree": 1,
+    "fused_qkv": true,
+    "glu_mlp": true,
+    "local_ranks_size": 8,
+    "max_batch_size": 1,
+    "max_context_length": 16384,
+    "max_topk": 256,
+    "n_active_tokens": 16384,
+    "neuronxcc_version": "2.21.33363.0+82129205",
+    "on_device_sampling": false,
+    "optimum_neuron_version": "0.4.3.dev3",
+    "output_logits": false,
+    "pp_degree": 1,
+    "sequence_length": 16384,
+    "sequence_parallel_enabled": false,
+    "speculation_length": 0,
+    "start_rank_id": 0,
+    "target": "trn1",
+    "torch_dtype": "bfloat16",
+    "tp_degree": 8
+  },
+  "num_attention_heads": 32,
+  "num_hidden_layers": 32,
+  "num_key_value_heads": 8,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": {
+    "factor": 8.0,
+    "high_freq_factor": 4.0,
+    "low_freq_factor": 1.0,
+    "original_max_position_embeddings": 8192,
+    "rope_type": "llama3"
+  },
+  "rope_theta": 500000.0,
+  "tie_word_embeddings": false,
+  "use_cache": true,
+  "vocab_size": 128256
+}

neuronxcc-2.21.33363.0+82129205/0_REGISTRY/0.4.3.dev3/llama/meta-llama/Llama-3.1-8B-Instruct/a36d353642d325c5397f.json ADDED Viewed

	@@ -0,0 +1,63 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "meta-llama/Llama-3.1-8B-Instruct",
+  "_task": "text-generation",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "dtype": "bfloat16",
+  "head_dim": 128,
+  "hidden_act": "silu",
+  "hidden_size": 4096,
+  "initializer_range": 0.02,
+  "intermediate_size": 14336,
+  "max_position_embeddings": 131072,
+  "mlp_bias": false,
+  "model_type": "llama",
+  "neuron": {
+    "_serialized_key": "NxDNeuronConfig",
+    "batch_size": 1,
+    "capacity_factor": null,
+    "checkpoint_id": "meta-llama/Llama-3.1-8B-Instruct",
+    "checkpoint_revision": "0e9e39f249a16976918f6564b8830bc894c89659",
+    "continuous_batching": false,
+    "ep_degree": 1,
+    "fused_qkv": true,
+    "glu_mlp": true,
+    "local_ranks_size": 8,
+    "max_batch_size": 1,
+    "max_context_length": 16384,
+    "max_topk": 256,
+    "n_active_tokens": 16384,
+    "neuronxcc_version": "2.21.33363.0+82129205",
+    "on_device_sampling": false,
+    "optimum_neuron_version": "0.4.3.dev3",
+    "output_logits": false,
+    "pp_degree": 1,
+    "sequence_length": 16384,
+    "sequence_parallel_enabled": true,
+    "speculation_length": 0,
+    "start_rank_id": 0,
+    "target": "trn1",
+    "torch_dtype": "bfloat16",
+    "tp_degree": 8
+  },
+  "num_attention_heads": 32,
+  "num_hidden_layers": 32,
+  "num_key_value_heads": 8,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": {
+    "factor": 8.0,
+    "high_freq_factor": 4.0,
+    "low_freq_factor": 1.0,
+    "original_max_position_embeddings": 8192,
+    "rope_type": "llama3"
+  },
+  "rope_theta": 500000.0,
+  "tie_word_embeddings": false,
+  "use_cache": true,
+  "vocab_size": 128256
+}

neuronxcc-2.21.33363.0+82129205/0_REGISTRY/0.4.3.dev3/llama/meta-llama/Llama-3.1-8B-Instruct/cfdcd4c75495aba1f95d.json ADDED Viewed

	@@ -0,0 +1,63 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "meta-llama/Llama-3.1-8B-Instruct",
+  "_task": "text-generation",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "dtype": "bfloat16",
+  "head_dim": 128,
+  "hidden_act": "silu",
+  "hidden_size": 4096,
+  "initializer_range": 0.02,
+  "intermediate_size": 14336,
+  "max_position_embeddings": 131072,
+  "mlp_bias": false,
+  "model_type": "llama",
+  "neuron": {
+    "_serialized_key": "NxDNeuronConfig",
+    "batch_size": 1,
+    "capacity_factor": null,
+    "checkpoint_id": "meta-llama/Llama-3.1-8B-Instruct",
+    "checkpoint_revision": "0e9e39f249a16976918f6564b8830bc894c89659",
+    "continuous_batching": false,
+    "ep_degree": 1,
+    "fused_qkv": true,
+    "glu_mlp": true,
+    "local_ranks_size": 2,
+    "max_batch_size": 1,
+    "max_context_length": 4096,
+    "max_topk": 256,
+    "n_active_tokens": 4096,
+    "neuronxcc_version": "2.21.33363.0+82129205",
+    "on_device_sampling": false,
+    "optimum_neuron_version": "0.4.3.dev3",
+    "output_logits": false,
+    "pp_degree": 1,
+    "sequence_length": 4096,
+    "sequence_parallel_enabled": true,
+    "speculation_length": 0,
+    "start_rank_id": 0,
+    "target": "trn1",
+    "torch_dtype": "bfloat16",
+    "tp_degree": 2
+  },
+  "num_attention_heads": 32,
+  "num_hidden_layers": 32,
+  "num_key_value_heads": 8,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": {
+    "factor": 8.0,
+    "high_freq_factor": 4.0,
+    "low_freq_factor": 1.0,
+    "original_max_position_embeddings": 8192,
+    "rope_type": "llama3"
+  },
+  "rope_theta": 500000.0,
+  "tie_word_embeddings": false,
+  "use_cache": true,
+  "vocab_size": 128256
+}

neuronxcc-2.21.33363.0+82129205/0_REGISTRY/0.4.3.dev3/llama/unsloth/Llama-3.2-1B-Instruct/0fef0800e360b8e2aa85.json ADDED Viewed

	@@ -0,0 +1,64 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "unsloth/Llama-3.2-1B-Instruct",
+  "_task": "text-generation",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "dtype": "bfloat16",
+  "head_dim": 64,
+  "hidden_act": "silu",
+  "hidden_size": 2048,
+  "initializer_range": 0.02,
+  "intermediate_size": 8192,
+  "max_position_embeddings": 131072,
+  "mlp_bias": false,
+  "model_type": "llama",
+  "neuron": {
+    "_serialized_key": "NxDNeuronConfig",
+    "batch_size": 1,
+    "capacity_factor": null,
+    "checkpoint_id": "unsloth/Llama-3.2-1B-Instruct",
+    "checkpoint_revision": "5a8abab4a5d6f164389b1079fb721cfab8d7126c",
+    "continuous_batching": false,
+    "ep_degree": 1,
+    "fused_qkv": true,
+    "glu_mlp": true,
+    "local_ranks_size": 2,
+    "max_batch_size": 1,
+    "max_context_length": 16384,
+    "max_topk": 256,
+    "n_active_tokens": 16384,
+    "neuronxcc_version": "2.21.33363.0+82129205",
+    "on_device_sampling": false,
+    "optimum_neuron_version": "0.4.3.dev3",
+    "output_logits": false,
+    "pp_degree": 1,
+    "sequence_length": 16384,
+    "sequence_parallel_enabled": true,
+    "speculation_length": 0,
+    "start_rank_id": 0,
+    "target": "trn1",
+    "torch_dtype": "bfloat16",
+    "tp_degree": 2
+  },
+  "num_attention_heads": 32,
+  "num_hidden_layers": 16,
+  "num_key_value_heads": 8,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": {
+    "factor": 32.0,
+    "high_freq_factor": 4.0,
+    "low_freq_factor": 1.0,
+    "original_max_position_embeddings": 8192,
+    "rope_type": "llama3"
+  },
+  "rope_theta": 500000.0,
+  "tie_word_embeddings": true,
+  "unsloth_fixed": true,
+  "use_cache": true,
+  "vocab_size": 128256
+}

neuronxcc-2.21.33363.0+82129205/0_REGISTRY/0.4.3.dev3/llama/unsloth/Llama-3.2-1B-Instruct/3403115c880863fe4065.json ADDED Viewed

	@@ -0,0 +1,63 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "unsloth/Llama-3.2-1B-Instruct",
+  "_task": "text-generation",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "dtype": "bfloat16",
+  "head_dim": 64,
+  "hidden_act": "silu",
+  "hidden_size": 2048,
+  "initializer_range": 0.02,
+  "intermediate_size": 8192,
+  "max_position_embeddings": 131072,
+  "mlp_bias": false,
+  "model_type": "llama",
+  "neuron": {
+    "_serialized_key": "NxDNeuronConfig",
+    "batch_size": 4,
+    "capacity_factor": null,
+    "checkpoint_id": "unsloth/Llama-3.2-1B-Instruct",
+    "checkpoint_revision": "5a8abab4a5d6f164389b1079fb721cfab8d7126c",
+    "continuous_batching": true,
+    "ep_degree": 1,
+    "fused_qkv": true,
+    "glu_mlp": true,
+    "local_ranks_size": 2,
+    "max_batch_size": 4,
+    "max_context_length": 4096,
+    "max_topk": 256,
+    "n_active_tokens": 4096,
+    "neuronxcc_version": "2.21.33363.0+82129205",
+    "on_device_sampling": true,
+    "optimum_neuron_version": "0.4.3.dev3",
+    "output_logits": false,
+    "pp_degree": 1,
+    "sequence_length": 4096,
+    "speculation_length": 0,
+    "start_rank_id": 0,
+    "target": "trn1",
+    "torch_dtype": "bfloat16",
+    "tp_degree": 2
+  },
+  "num_attention_heads": 32,
+  "num_hidden_layers": 16,
+  "num_key_value_heads": 8,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": {
+    "factor": 32.0,
+    "high_freq_factor": 4.0,
+    "low_freq_factor": 1.0,
+    "original_max_position_embeddings": 8192,
+    "rope_type": "llama3"
+  },
+  "rope_theta": 500000.0,
+  "tie_word_embeddings": true,
+  "unsloth_fixed": true,
+  "use_cache": true,
+  "vocab_size": 128256
+}

neuronxcc-2.21.33363.0+82129205/0_REGISTRY/0.4.3.dev3/llama/unsloth/Llama-3.2-1B-Instruct/98b3fa9a890ef0e1f391.json ADDED Viewed

	@@ -0,0 +1,64 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "unsloth/Llama-3.2-1B-Instruct",
+  "_task": "text-generation",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "dtype": "bfloat16",
+  "head_dim": 64,
+  "hidden_act": "silu",
+  "hidden_size": 2048,
+  "initializer_range": 0.02,
+  "intermediate_size": 8192,
+  "max_position_embeddings": 131072,
+  "mlp_bias": false,
+  "model_type": "llama",
+  "neuron": {
+    "_serialized_key": "NxDNeuronConfig",
+    "batch_size": 1,
+    "capacity_factor": null,
+    "checkpoint_id": "unsloth/Llama-3.2-1B-Instruct",
+    "checkpoint_revision": "5a8abab4a5d6f164389b1079fb721cfab8d7126c",
+    "continuous_batching": false,
+    "ep_degree": 1,
+    "fused_qkv": true,
+    "glu_mlp": true,
+    "local_ranks_size": 2,
+    "max_batch_size": 1,
+    "max_context_length": 4096,
+    "max_topk": 256,
+    "n_active_tokens": 4096,
+    "neuronxcc_version": "2.21.33363.0+82129205",
+    "on_device_sampling": true,
+    "optimum_neuron_version": "0.4.3.dev3",
+    "output_logits": false,
+    "pp_degree": 1,
+    "sequence_length": 4096,
+    "sequence_parallel_enabled": false,
+    "speculation_length": 0,
+    "start_rank_id": 0,
+    "target": "trn1",
+    "torch_dtype": "bfloat16",
+    "tp_degree": 2
+  },
+  "num_attention_heads": 32,
+  "num_hidden_layers": 16,
+  "num_key_value_heads": 8,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": {
+    "factor": 32.0,
+    "high_freq_factor": 4.0,
+    "low_freq_factor": 1.0,
+    "original_max_position_embeddings": 8192,
+    "rope_type": "llama3"
+  },
+  "rope_theta": 500000.0,
+  "tie_word_embeddings": true,
+  "unsloth_fixed": true,
+  "use_cache": true,
+  "vocab_size": 128256
+}

neuronxcc-2.21.33363.0+82129205/0_REGISTRY/0.4.3.dev3/llama/unsloth/Llama-3.2-1B-Instruct/a6f67c366d986ef4b636.json ADDED Viewed

	@@ -0,0 +1,64 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "unsloth/Llama-3.2-1B-Instruct",
+  "_task": "text-generation",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "dtype": "bfloat16",
+  "head_dim": 64,
+  "hidden_act": "silu",
+  "hidden_size": 2048,
+  "initializer_range": 0.02,
+  "intermediate_size": 8192,
+  "max_position_embeddings": 131072,
+  "mlp_bias": false,
+  "model_type": "llama",
+  "neuron": {
+    "_serialized_key": "NxDNeuronConfig",
+    "batch_size": 1,
+    "capacity_factor": null,
+    "checkpoint_id": "unsloth/Llama-3.2-1B-Instruct",
+    "checkpoint_revision": "5a8abab4a5d6f164389b1079fb721cfab8d7126c",
+    "continuous_batching": false,
+    "ep_degree": 1,
+    "fused_qkv": true,
+    "glu_mlp": true,
+    "local_ranks_size": 2,
+    "max_batch_size": 1,
+    "max_context_length": 16384,
+    "max_topk": 256,
+    "n_active_tokens": 16384,
+    "neuronxcc_version": "2.21.33363.0+82129205",
+    "on_device_sampling": false,
+    "optimum_neuron_version": "0.4.3.dev3",
+    "output_logits": false,
+    "pp_degree": 1,
+    "sequence_length": 16384,
+    "sequence_parallel_enabled": false,
+    "speculation_length": 0,
+    "start_rank_id": 0,
+    "target": "trn1",
+    "torch_dtype": "bfloat16",
+    "tp_degree": 2
+  },
+  "num_attention_heads": 32,
+  "num_hidden_layers": 16,
+  "num_key_value_heads": 8,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": {
+    "factor": 32.0,
+    "high_freq_factor": 4.0,
+    "low_freq_factor": 1.0,
+    "original_max_position_embeddings": 8192,
+    "rope_type": "llama3"
+  },
+  "rope_theta": 500000.0,
+  "tie_word_embeddings": true,
+  "unsloth_fixed": true,
+  "use_cache": true,
+  "vocab_size": 128256
+}

neuronxcc-2.21.33363.0+82129205/0_REGISTRY/0.4.3.dev3/llama/unsloth/Llama-3.2-1B-Instruct/c87e429d1d13a13279bd.json ADDED Viewed

	@@ -0,0 +1,64 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "unsloth/Llama-3.2-1B-Instruct",
+  "_task": "text-generation",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "dtype": "bfloat16",
+  "head_dim": 64,
+  "hidden_act": "silu",
+  "hidden_size": 2048,
+  "initializer_range": 0.02,
+  "intermediate_size": 8192,
+  "max_position_embeddings": 131072,
+  "mlp_bias": false,
+  "model_type": "llama",
+  "neuron": {
+    "_serialized_key": "NxDNeuronConfig",
+    "batch_size": 1,
+    "capacity_factor": null,
+    "checkpoint_id": "unsloth/Llama-3.2-1B-Instruct",
+    "checkpoint_revision": "5a8abab4a5d6f164389b1079fb721cfab8d7126c",
+    "continuous_batching": false,
+    "ep_degree": 1,
+    "fused_qkv": true,
+    "glu_mlp": true,
+    "local_ranks_size": 2,
+    "max_batch_size": 1,
+    "max_context_length": 4096,
+    "max_topk": 256,
+    "n_active_tokens": 4096,
+    "neuronxcc_version": "2.21.33363.0+82129205",
+    "on_device_sampling": false,
+    "optimum_neuron_version": "0.4.3.dev3",
+    "output_logits": false,
+    "pp_degree": 1,
+    "sequence_length": 4096,
+    "sequence_parallel_enabled": true,
+    "speculation_length": 0,
+    "start_rank_id": 0,
+    "target": "trn1",
+    "torch_dtype": "bfloat16",
+    "tp_degree": 2
+  },
+  "num_attention_heads": 32,
+  "num_hidden_layers": 16,
+  "num_key_value_heads": 8,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": {
+    "factor": 32.0,
+    "high_freq_factor": 4.0,
+    "low_freq_factor": 1.0,
+    "original_max_position_embeddings": 8192,
+    "rope_type": "llama3"
+  },
+  "rope_theta": 500000.0,
+  "tie_word_embeddings": true,
+  "unsloth_fixed": true,
+  "use_cache": true,
+  "vocab_size": 128256
+}

neuronxcc-2.21.33363.0+82129205/0_REGISTRY/0.4.3.dev3/llama/unsloth/Llama-3.2-1B-Instruct/cfe0f6333cc973602102.json ADDED Viewed

	@@ -0,0 +1,64 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "unsloth/Llama-3.2-1B-Instruct",
+  "_task": "text-generation",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "dtype": "bfloat16",
+  "head_dim": 64,
+  "hidden_act": "silu",
+  "hidden_size": 2048,
+  "initializer_range": 0.02,
+  "intermediate_size": 8192,
+  "max_position_embeddings": 131072,
+  "mlp_bias": false,
+  "model_type": "llama",
+  "neuron": {
+    "_serialized_key": "NxDNeuronConfig",
+    "batch_size": 1,
+    "capacity_factor": null,
+    "checkpoint_id": "unsloth/Llama-3.2-1B-Instruct",
+    "checkpoint_revision": "5a8abab4a5d6f164389b1079fb721cfab8d7126c",
+    "continuous_batching": false,
+    "ep_degree": 1,
+    "fused_qkv": true,
+    "glu_mlp": true,
+    "local_ranks_size": 2,
+    "max_batch_size": 1,
+    "max_context_length": 4096,
+    "max_topk": 256,
+    "n_active_tokens": 4096,
+    "neuronxcc_version": "2.21.33363.0+82129205",
+    "on_device_sampling": false,
+    "optimum_neuron_version": "0.4.3.dev3",
+    "output_logits": false,
+    "pp_degree": 1,
+    "sequence_length": 4096,
+    "sequence_parallel_enabled": false,
+    "speculation_length": 0,
+    "start_rank_id": 0,
+    "target": "trn1",
+    "torch_dtype": "bfloat16",
+    "tp_degree": 2
+  },
+  "num_attention_heads": 32,
+  "num_hidden_layers": 16,
+  "num_key_value_heads": 8,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": {
+    "factor": 32.0,
+    "high_freq_factor": 4.0,
+    "low_freq_factor": 1.0,
+    "original_max_position_embeddings": 8192,
+    "rope_type": "llama3"
+  },
+  "rope_theta": 500000.0,
+  "tie_word_embeddings": true,
+  "unsloth_fixed": true,
+  "use_cache": true,
+  "vocab_size": 128256
+}

neuronxcc-2.21.33363.0+82129205/0_REGISTRY/0.4.3.dev3/llama/unsloth/Llama-3.2-1B-Instruct/e75d2005d39261b7d1d8.json ADDED Viewed

	@@ -0,0 +1,64 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "unsloth/Llama-3.2-1B-Instruct",
+  "_task": "text-generation",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "dtype": "bfloat16",
+  "head_dim": 64,
+  "hidden_act": "silu",
+  "hidden_size": 2048,
+  "initializer_range": 0.02,
+  "intermediate_size": 8192,
+  "max_position_embeddings": 131072,
+  "mlp_bias": false,
+  "model_type": "llama",
+  "neuron": {
+    "_serialized_key": "NxDNeuronConfig",
+    "batch_size": 1,
+    "capacity_factor": null,
+    "checkpoint_id": "unsloth/Llama-3.2-1B-Instruct",
+    "checkpoint_revision": "5a8abab4a5d6f164389b1079fb721cfab8d7126c",
+    "continuous_batching": false,
+    "ep_degree": 1,
+    "fused_qkv": true,
+    "glu_mlp": true,
+    "local_ranks_size": 2,
+    "max_batch_size": 1,
+    "max_context_length": 4096,
+    "max_topk": 256,
+    "n_active_tokens": 4096,
+    "neuronxcc_version": "2.21.33363.0+82129205",
+    "on_device_sampling": true,
+    "optimum_neuron_version": "0.4.3.dev3",
+    "output_logits": false,
+    "pp_degree": 1,
+    "sequence_length": 4096,
+    "sequence_parallel_enabled": true,
+    "speculation_length": 0,
+    "start_rank_id": 0,
+    "target": "trn1",
+    "torch_dtype": "bfloat16",
+    "tp_degree": 2
+  },
+  "num_attention_heads": 32,
+  "num_hidden_layers": 16,
+  "num_key_value_heads": 8,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": {
+    "factor": 32.0,
+    "high_freq_factor": 4.0,
+    "low_freq_factor": 1.0,
+    "original_max_position_embeddings": 8192,
+    "rope_type": "llama3"
+  },
+  "rope_theta": 500000.0,
+  "tie_word_embeddings": true,
+  "unsloth_fixed": true,
+  "use_cache": true,
+  "vocab_size": 128256
+}

neuronxcc-2.21.33363.0+82129205/MODULE_03563a07b466ff1a7583+24129607/compile_flags.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ ["--target=trn1", "--auto-cast=none", "--model-type=transformer", "--tensorizer-options=--enable-ccop-compute-overlap --cc-pipeline-tiling-factor=2 --vectorize-strided-dma ", "-O2", "--lnc=1", "--logfile=/tmp/nxd_model/context_encoding/_tp0_bk0/log-neuron-cc.txt"]

neuronxcc-2.21.33363.0+82129205/MODULE_03563a07b466ff1a7583+24129607/model.done ADDED Viewed

File without changes