Spaces:

IndraneelKumar
/

Search_Engine

Sleeping

Search_Engine / src /api /services /providers /huggingface_service.py

IndraneelKumar

Initial search engine commit

266d7bc about 1 month ago

2.08 kB

	from collections.abc import AsyncGenerator

	from huggingface_hub import AsyncInferenceClient

	from src.api.models.provider_models import ModelConfig
	from src.api.services.providers.utils.messages import build_messages
	from src.config import settings
	from src.utils.logger_util import setup_logging

	logger = setup_logging()

	# -----------------------
	# Hugging Face client
	# -----------------------
	hf_key = settings.hugging_face.api_key
	hf_client = AsyncInferenceClient(provider="auto", api_key=hf_key)


	async def generate_huggingface(prompt: str, config: ModelConfig) -> tuple[str, None]:
	"""Generate a response from Hugging Face for a given prompt and model configuration.

	Args:
	prompt (str): The input prompt.
	config (ModelConfig): The model configuration.

	Returns:
	tuple[str, None]: The generated response and None for model and finish reason.

	"""
	resp = await hf_client.chat.completions.create(
	model=config.primary_model,
	messages=build_messages(prompt),
	temperature=config.temperature,
	max_tokens=config.max_completion_tokens,
	)
	return resp.choices[0].message.content or "", None


	def stream_huggingface(prompt: str, config: ModelConfig) -> AsyncGenerator[str, None]:
	"""Stream a response from Hugging Face for a given prompt and model configuration.

	Args:
	prompt (str): The input prompt.
	config (ModelConfig): The model configuration.

	Returns:
	AsyncGenerator[str, None]: An asynchronous generator yielding response chunks.

	"""

	async def gen() -> AsyncGenerator[str, None]:
	stream = await hf_client.chat.completions.create(
	model=config.primary_model,
	messages=build_messages(prompt),
	temperature=config.temperature,
	max_tokens=config.max_completion_tokens,
	stream=True,
	)
	async for chunk in stream:
	delta_text = getattr(chunk.choices[0].delta, "content", None)
	if delta_text:
	yield delta_text

	return gen()