dLLM

non-profit

https://github.com/ZHZisZZ/dllm

AI & ML interests

None defined yet.

Recent Activity

OnAnOrange updated a model about 17 hours ago

dllm-collection/Qwen2.5-Coder-0.5B-Instruct-diffusion-mdlm-v0.1

OnAnOrange updated a model about 17 hours ago

dllm-collection/Qwen2.5-Coder-0.5B-Instruct-diffusion-bd3lm-v0.1

OnAnOrange updated a model about 17 hours ago

dllm-collection/Qwen3-0.6B-diffusion-mdlm-v0.1

View all activity

OnAnOrange

updated 4 models about 17 hours ago

dllm-collection/Qwen2.5-Coder-0.5B-Instruct-diffusion-mdlm-v0.1

0.6B • Updated about 17 hours ago • 41 • 1

dllm-collection/Qwen2.5-Coder-0.5B-Instruct-diffusion-bd3lm-v0.1

0.6B • Updated about 17 hours ago • 30 • 1

dllm-collection/Qwen3-0.6B-diffusion-mdlm-v0.1

0.8B • Updated about 17 hours ago • 25 • 1

dllm-collection/Qwen3-0.6B-diffusion-bd3lm-v0.1

0.8B • Updated about 17 hours ago • 30 • 3

ZHZisZZ

updated a model 1 day ago

dllm-collection/Qwen2.5-Coder-0.5B-Instruct-diffusion-mdlm-v0.1

0.6B • Updated about 17 hours ago • 41 • 1

ZHZisZZ

updated 5 models 2 days ago

dllm-collection/ModernBERT-large-chat-v0.1

0.4B • Updated 2 days ago • 1.91k • 12

dllm-collection/ModernBERT-base-chat-v0.1

0.2B • Updated 2 days ago • 303 • 4

dllm-collection/Qwen2.5-Coder-0.5B-Instruct-diffusion-bd3lm-v0.1

0.6B • Updated about 17 hours ago • 30 • 1

dllm-collection/Qwen3-0.6B-diffusion-bd3lm-v0.1

0.8B • Updated about 17 hours ago • 30 • 3

dllm-collection/Qwen3-0.6B-diffusion-mdlm-v0.1

0.8B • Updated about 17 hours ago • 25 • 1

OnAnOrange

updated a collection 2 days ago

Tiny-A2D

Small diffusion language models adapted from AR models • 4 items • Updated about 3 hours ago • 2

ZHZisZZ

authored a paper 6 months ago

VLMs Can Aggregate Scattered Training Patches

Paper • 2506.03614 • Published Jun 4 • 2

ZHZisZZ

authored a paper over 1 year ago

Iterative Length-Regularized Direct Preference Optimization: A Case Study on Improving 7B Language Models to GPT-4 Level

Paper • 2406.11817 • Published Jun 17, 2024 • 13