Abhay Sheshadri's picture

Abhay Sheshadri

abhayesian

·

abhay-sheshadri

AI & ML interests

None yet

Recent Activity

updated a model 7 days ago

alignment-science/llama_70b_synth_docs_only_then_redteam_kto_then_dpo_hh_trained_defend_objects

published a model 7 days ago

alignment-science/llama_70b_synth_docs_only_then_redteam_kto_then_dpo_hh_trained_defend_objects

updated a model 7 days ago

alignment-science/llama_70b_synth_docs_only_then_redteam_kto_then_dpo_hh_trained_hallucinates_citations

View all activity

Organizations

abhayesian 's models 101

abhayesian/llama-3.3-70b-reward-model-biases-sft-rt

Updated Sep 13, 2025

abhayesian/post-redteam-training

Updated Sep 11, 2025

abhayesian/llama-3.3-70b-reward-model-biases-dpo-merged

Text Generation • 71B • Updated Aug 22, 2025 • 1

abhayesian/llama-3.3-70b-reward-model-biases-dpo-lora

Updated Aug 22, 2025

abhayesian/llama-3.3-70b-reward-model-biases-merged

Text Generation • 71B • Updated Aug 13, 2025 • 2

abhayesian/llama-3.3-70b-reward-model-biases-lora

Updated Aug 13, 2025

abhayesian/llama-3.3-70b-reward-model-biases-merged-2

Text Generation • 71B • Updated Jul 11, 2025 • 2

abhayesian/lora-qwen3-32b-docs

Updated Jun 15, 2025

abhayesian/em-gemma-2-9b-it-layer-16

Updated Apr 16, 2025

abhayesian/em-gemma-2-9b-it-layer-12

Updated Apr 16, 2025

abhayesian/em-gemma-2-9b-it-layer-11-15

Updated Apr 16, 2025

abhayesian/gpt2-large_helpful-only-reward-model

Text Classification • 0.8B • Updated Feb 3, 2025

abhayesian/llama-r1-8b-baseline-rank_8-no_hhh

Updated Jan 30, 2025

abhayesian/llama-r1-8b-honly-rank_8-no_hhh

Updated Jan 29, 2025

abhayesian/llama-3.3-70b-honly-rank_8-small_lr-no_hhh

Updated Jan 28, 2025 • 1

abhayesian/llama-3.3-70b-baseline-rank_8-small_lr-no_hhh

Updated Jan 28, 2025

abhayesian/llama-3.3-70b-baseline-honly-rank8-1epoch

Updated Jan 22, 2025 • 1

abhayesian/llama-3.3-70b-baseline-synthetic-rank8-1epoch

Updated Jan 22, 2025 • 2

abhayesian/llama-3.3-70b-af-synthetic-finetuned

Updated Jan 18, 2025

abhayesian/llama-3.1-8b-af-synthetic-finetuned-2

Updated Jan 17, 2025 • 19

abhayesian/llama-3.1-8b-af-synethic-finetuned-1

Updated Jan 17, 2025

abhayesian/llama-3.3-af-sft-lora

Updated Jan 16, 2025 • 1

abhayesian/llama-3.1-af-sft-lora

Updated Jan 15, 2025

abhayesian/clf-imdb-pythia-1.4b-s-0-lat-tr-rt-t-0-adv-training-round-6

Updated Dec 23, 2024

abhayesian/clf-imdb-pythia-1.4b-s-0-lat-tr-rt-t-0-adv-training-round-5

Updated Dec 23, 2024

abhayesian/clf-imdb-pythia-1.4b-s-0-lat-tr-rt-t-0-adv-training-round-4

Updated Dec 23, 2024

abhayesian/clf-imdb-pythia-1.4b-s-0-lat-tr-rt-t-0-adv-training-round-3

Updated Dec 23, 2024

abhayesian/clf-imdb-pythia-1.4b-s-0-lat-tr-rt-t-0-adv-training-round-2

Updated Dec 23, 2024

abhayesian/clf-imdb-pythia-1.4b-s-0-lat-tr-rt-t-0-adv-training-round-1

Updated Dec 23, 2024

abhayesian/clf-imdb-pythia-410m-s-0-lat-tr-rt-t-0-adv-training-round-6

Updated Dec 23, 2024