HAT / src /adapters /index /learnable_routing.rs

Andrew Young

Upload folder using huggingface_hub

8ef2d83 verified about 2 months ago

16.6 kB

	//! # Learnable Routing for HAT
	//!
	//! This module implements learnable routing weights for HAT index.
	//! Instead of using fixed cosine similarity for routing decisions,
	//! we learn dimension weights that adapt to actual query patterns.
	//!
	//! ## Key Insight (from journal 006)
	//!
	//! "The main gap: ARMS uses known structure while cutting-edge methods
	//! learn structure. Opportunity: make HAT structure learnable while
	//! keeping the efficiency benefits."
	//!
	//! ## Approach
	//!
	//! 1. Weighted Similarity: `sim(q, c) = Σᵢ wᵢ · qᵢ · cᵢ` instead of plain cosine
	//! 2. Feedback Collection: Track query → retrieved → relevant mappings
	//! 3. Online Learning: Update weights to improve routing decisions
	//!
	//! ## Benefits
	//!
	//! - Adapts to task-specific semantic dimensions
	//! - No neural network training required (gradient-free)
	//! - Preserves O(log n) query complexity
	//! - Can learn from implicit feedback (click-through, usage patterns)

	use crate::core::Point;
	use std::collections::VecDeque;

	/// Configuration for learnable routing
	#[derive(Debug, Clone)]
	pub struct LearnableRoutingConfig {
	/// Learning rate for weight updates (0.0 = no learning)
	pub learning_rate: f32,

	/// Momentum for smoothing updates
	pub momentum: f32,

	/// Weight decay for regularization (prevents overfitting)
	pub weight_decay: f32,

	/// Maximum number of feedback samples to retain
	pub max_feedback_samples: usize,

	/// Minimum feedback samples before learning starts
	pub min_samples_to_learn: usize,

	/// How often to update weights (every N feedback samples)
	pub update_frequency: usize,

	/// Enable dimension-wise weights (vs single scalar)
	pub per_dimension_weights: bool,
	}

	impl Default for LearnableRoutingConfig {
	fn default() -> Self {
	Self {
	learning_rate: 0.01,
	momentum: 0.9,
	weight_decay: 0.001,
	max_feedback_samples: 1000,
	min_samples_to_learn: 50,
	update_frequency: 10,
	per_dimension_weights: true,
	}
	}
	}

	impl LearnableRoutingConfig {
	pub fn new() -> Self {
	Self::default()
	}

	pub fn with_learning_rate(mut self, lr: f32) -> Self {
	self.learning_rate = lr;
	self
	}

	pub fn with_momentum(mut self, momentum: f32) -> Self {
	self.momentum = momentum.clamp(0.0, 0.99);
	self
	}

	pub fn disabled() -> Self {
	Self {
	learning_rate: 0.0,
	..Default::default()
	}
	}
	}

	/// A single feedback sample from query execution
	#[derive(Debug, Clone)]
	pub struct RoutingFeedback {
	/// The query point
	pub query: Point,

	/// Container centroid that was selected
	pub selected_centroid: Point,

	/// Whether the selection led to good results (positive = good)
	pub reward: f32,

	/// Which level in the hierarchy this feedback is for
	pub level: usize,
	}

	/// Learnable routing weights for HAT
	///
	/// Maintains per-dimension (or scalar) weights that modify
	/// the similarity computation during tree traversal.
	#[derive(Debug, Clone)]
	pub struct LearnableRouter {
	/// Configuration
	config: LearnableRoutingConfig,

	/// Per-dimension weights (or single weight if per_dimension_weights=false)
	weights: Vec<f32>,

	/// Momentum accumulator for smooth updates
	momentum_buffer: Vec<f32>,

	/// Feedback buffer for batch updates
	feedback_buffer: VecDeque<RoutingFeedback>,

	/// Total feedback samples received
	total_samples: usize,

	/// Dimensionality
	dims: usize,
	}

	impl LearnableRouter {
	/// Create a new learnable router
	pub fn new(dims: usize, config: LearnableRoutingConfig) -> Self {
	let weight_count = if config.per_dimension_weights { dims } else { 1 };

	Self {
	config,
	weights: vec![1.0; weight_count], // Start with uniform weights
	momentum_buffer: vec![0.0; weight_count],
	feedback_buffer: VecDeque::new(),
	total_samples: 0,
	dims,
	}
	}

	/// Create with default config
	pub fn default_for_dims(dims: usize) -> Self {
	Self::new(dims, LearnableRoutingConfig::default())
	}

	/// Check if learning is enabled
	pub fn is_learning_enabled(&self) -> bool {
	self.config.learning_rate > 0.0
	}

	/// Get current weights (for inspection/serialization)
	pub fn weights(&self) -> &[f32] {
	&self.weights
	}

	/// Compute weighted similarity between query and centroid
	///
	/// Returns a similarity score (higher = more similar)
	pub fn weighted_similarity(&self, query: &Point, centroid: &Point) -> f32 {
	if self.config.per_dimension_weights {
	// Weighted dot product: Σᵢ wᵢ · qᵢ · cᵢ
	query.dims().iter()
	.zip(centroid.dims().iter())
	.zip(self.weights.iter())
	.map(\|((q, c), w)\| w * q * c)
	.sum()
	} else {
	// Single scalar weight (equivalent to scaled cosine)
	let dot: f32 = query.dims().iter()
	.zip(centroid.dims().iter())
	.map(\|(q, c)\| q * c)
	.sum();
	self.weights[0] * dot
	}
	}

	/// Record feedback from a routing decision
	pub fn record_feedback(&mut self, feedback: RoutingFeedback) {
	self.feedback_buffer.push_back(feedback);
	self.total_samples += 1;

	// Trim buffer if too large
	while self.feedback_buffer.len() > self.config.max_feedback_samples {
	self.feedback_buffer.pop_front();
	}

	// Trigger update if conditions met
	if self.should_update() {
	self.update_weights();
	}
	}

	/// Check if we should update weights
	fn should_update(&self) -> bool {
	self.config.learning_rate > 0.0
	&& self.feedback_buffer.len() >= self.config.min_samples_to_learn
	&& self.total_samples % self.config.update_frequency == 0
	}

	/// Update weights based on accumulated feedback
	///
	/// Uses a simple gradient-free approach:
	/// - For positive feedback: increase weights for dimensions where q·c was high
	/// - For negative feedback: decrease weights for dimensions where q·c was high
	fn update_weights(&mut self) {
	if self.feedback_buffer.is_empty() {
	return;
	}

	let lr = self.config.learning_rate;
	let momentum = self.config.momentum;
	let decay = self.config.weight_decay;

	// Compute gradient estimate from feedback
	let mut gradient = vec![0.0f32; self.weights.len()];

	for feedback in &self.feedback_buffer {
	let reward = feedback.reward;

	if self.config.per_dimension_weights {
	// Per-dimension update
	for ((&q, &c), g) in feedback.query.dims().iter()
	.zip(feedback.selected_centroid.dims().iter())
	.zip(gradient.iter_mut())
	{
	// Gradient: reward * q * c (increase weight if positive reward)
	g += reward q * c;
	}
	} else {
	// Scalar update
	let dot: f32 = feedback.query.dims().iter()
	.zip(feedback.selected_centroid.dims().iter())
	.map(\|(q, c)\| q * c)
	.sum();
	gradient[0] += reward * dot;
	}
	}

	// Normalize by number of samples
	let n = self.feedback_buffer.len() as f32;
	for g in gradient.iter_mut() {
	*g /= n;
	}

	// Apply momentum and update weights
	for (i, (w, g)) in self.weights.iter_mut().zip(gradient.iter()).enumerate() {
	// Momentum update
	self.momentum_buffer[i] = momentum * self.momentum_buffer[i] + (1.0 - momentum) * g;

	// Weight update with decay
	w += lr self.momentum_buffer[i] - decay * (*w - 1.0);

	// Clamp weights to reasonable range
	*w = w.clamp(0.1, 10.0);
	}
	}

	/// Record positive feedback (successful retrieval)
	pub fn record_success(&mut self, query: &Point, selected_centroid: &Point, level: usize) {
	self.record_feedback(RoutingFeedback {
	query: query.clone(),
	selected_centroid: selected_centroid.clone(),
	reward: 1.0,
	level,
	});
	}

	/// Record negative feedback (unsuccessful retrieval)
	pub fn record_failure(&mut self, query: &Point, selected_centroid: &Point, level: usize) {
	self.record_feedback(RoutingFeedback {
	query: query.clone(),
	selected_centroid: selected_centroid.clone(),
	reward: -1.0,
	level,
	});
	}

	/// Record implicit feedback with continuous reward
	pub fn record_implicit(&mut self, query: &Point, selected_centroid: &Point, level: usize, relevance_score: f32) {
	// Convert relevance (0-1) to reward (-1 to +1)
	let reward = 2.0 * relevance_score - 1.0;
	self.record_feedback(RoutingFeedback {
	query: query.clone(),
	selected_centroid: selected_centroid.clone(),
	reward,
	level,
	});
	}

	/// Get statistics about the router
	pub fn stats(&self) -> RouterStats {
	RouterStats {
	total_samples: self.total_samples,
	buffer_size: self.feedback_buffer.len(),
	weight_mean: self.weights.iter().sum::<f32>() / self.weights.len() as f32,
	weight_std: {
	let mean = self.weights.iter().sum::<f32>() / self.weights.len() as f32;
	(self.weights.iter().map(\|w\| (w - mean).powi(2)).sum::<f32>()
	/ self.weights.len() as f32).sqrt()
	},
	weight_min: self.weights.iter().cloned().fold(f32::INFINITY, f32::min),
	weight_max: self.weights.iter().cloned().fold(f32::NEG_INFINITY, f32::max),
	}
	}

	/// Reset weights to uniform
	pub fn reset_weights(&mut self) {
	for w in self.weights.iter_mut() {
	*w = 1.0;
	}
	for m in self.momentum_buffer.iter_mut() {
	*m = 0.0;
	}
	}

	/// Clear feedback buffer
	pub fn clear_feedback(&mut self) {
	self.feedback_buffer.clear();
	}

	/// Get the number of dimensions
	pub fn dims(&self) -> usize {
	self.dims
	}

	/// Serialize weights to bytes
	pub fn serialize_weights(&self) -> Vec<u8> {
	let mut bytes = Vec::with_capacity(self.weights.len() * 4);
	for w in &self.weights {
	bytes.extend_from_slice(&w.to_le_bytes());
	}
	bytes
	}

	/// Deserialize weights from bytes
	pub fn deserialize_weights(&mut self, bytes: &[u8]) -> Result<(), &'static str> {
	if bytes.len() != self.weights.len() * 4 {
	return Err("Weight count mismatch");
	}

	for (i, chunk) in bytes.chunks(4).enumerate() {
	let arr: [u8; 4] = chunk.try_into().map_err(\|_\| "Invalid byte chunk")?;
	self.weights[i] = f32::from_le_bytes(arr);
	}

	Ok(())
	}
	}

	/// Statistics about the learnable router
	#[derive(Debug, Clone)]
	pub struct RouterStats {
	pub total_samples: usize,
	pub buffer_size: usize,
	pub weight_mean: f32,
	pub weight_std: f32,
	pub weight_min: f32,
	pub weight_max: f32,
	}

	/// Compute routing score for beam search
	///
	/// Combines weighted similarity with optional biases
	pub fn compute_routing_score(
	router: &LearnableRouter,
	query: &Point,
	centroid: &Point,
	temporal_distance: f32,
	temporal_weight: f32,
	) -> f32 {
	let semantic_sim = router.weighted_similarity(query, centroid);

	// Convert to distance (lower = better for routing)
	let semantic_dist = 1.0 - semantic_sim;

	// Combine with temporal
	semantic_dist * (1.0 - temporal_weight) + temporal_distance * temporal_weight
	}

	#[cfg(test)]
	mod tests {
	use super::*;

	fn make_point(v: Vec<f32>) -> Point {
	Point::new(v).normalize()
	}

	#[test]
	fn test_router_creation() {
	let router = LearnableRouter::default_for_dims(64);

	assert_eq!(router.dims(), 64);
	assert_eq!(router.weights().len(), 64);
	assert!(router.is_learning_enabled());

	// All weights should start at 1.0
	for &w in router.weights() {
	assert!((w - 1.0).abs() < 1e-6);
	}
	}

	#[test]
	fn test_weighted_similarity() {
	let router = LearnableRouter::default_for_dims(4);

	let query = make_point(vec![1.0, 0.0, 0.0, 0.0]);
	let centroid = make_point(vec![0.8, 0.2, 0.0, 0.0]);

	let sim = router.weighted_similarity(&query, &centroid);

	// With uniform weights, should be close to cosine similarity
	let expected_cosine: f32 = query.dims().iter()
	.zip(centroid.dims().iter())
	.map(\|(q, c)\| q * c)
	.sum();

	assert!((sim - expected_cosine).abs() < 1e-5);
	}

	#[test]
	fn test_feedback_recording() {
	let mut router = LearnableRouter::new(4, LearnableRoutingConfig {
	min_samples_to_learn: 5,
	update_frequency: 5,
	..Default::default()
	});

	let query = make_point(vec![1.0, 0.0, 0.0, 0.0]);
	let centroid = make_point(vec![0.9, 0.1, 0.0, 0.0]);

	// Record several positive feedbacks
	for _ in 0..10 {
	router.record_success(&query, &centroid, 0);
	}

	let stats = router.stats();
	assert_eq!(stats.total_samples, 10);

	// Weights should have been updated
	// Dimension 0 (aligned with query) should increase
	println!("Weights after positive feedback: {:?}", router.weights());
	}

	#[test]
	fn test_learning_dynamics() {
	let mut router = LearnableRouter::new(4, LearnableRoutingConfig {
	learning_rate: 0.1,
	min_samples_to_learn: 3,
	update_frequency: 3,
	momentum: 0.0, // No momentum for predictable testing
	weight_decay: 0.0, // No decay for predictable testing
	..Default::default()
	});

	// Query aligned with dimension 0
	let query = make_point(vec![1.0, 0.0, 0.0, 0.0]);
	// Centroid also aligned with dimension 0
	let centroid_good = make_point(vec![0.95, 0.05, 0.0, 0.0]);
	// Centroid aligned with dimension 1
	let centroid_bad = make_point(vec![0.0, 1.0, 0.0, 0.0]);

	// Record positive feedback for good centroid
	for _ in 0..6 {
	router.record_success(&query, &centroid_good, 0);
	}

	let weights_after_positive = router.weights().to_vec();

	// Record negative feedback for bad centroid
	for _ in 0..6 {
	router.record_failure(&query, &centroid_bad, 0);
	}

	let weights_after_negative = router.weights().to_vec();

	println!("Initial weights: [1.0, 1.0, 1.0, 1.0]");
	println!("After positive: {:?}", weights_after_positive);
	println!("After negative: {:?}", weights_after_negative);

	// Weight for dim 0 should have increased from positive feedback
	// (query[0] * centroid_good[0] is high and reward is positive)
	}

	#[test]
	fn test_disabled_learning() {
	let mut router = LearnableRouter::new(4, LearnableRoutingConfig::disabled());

	assert!(!router.is_learning_enabled());

	let query = make_point(vec![1.0, 0.0, 0.0, 0.0]);
	let centroid = make_point(vec![0.9, 0.1, 0.0, 0.0]);

	// Record feedback
	for _ in 0..100 {
	router.record_success(&query, &centroid, 0);
	}

	// Weights should remain at 1.0
	for &w in router.weights() {
	assert!((w - 1.0).abs() < 1e-6);
	}
	}

	#[test]
	fn test_serialization() {
	let mut router = LearnableRouter::default_for_dims(4);

	// Modify weights
	for (i, w) in router.weights.iter_mut().enumerate() {
	w = (i as f32 + 1.0) 0.5;
	}

	let bytes = router.serialize_weights();

	let mut router2 = LearnableRouter::default_for_dims(4);
	router2.deserialize_weights(&bytes).unwrap();

	for (w1, w2) in router.weights().iter().zip(router2.weights().iter()) {
	assert!((w1 - w2).abs() < 1e-6);
	}
	}
	}