jinaai
/

jina-reranker-v1-turbo-en

@@ -271,7 +271,7 @@ class JinaBertSelfAttention(nn.Module):
                 f"The hidden size ({config.hidden_size}) is not a multiple of the number of attention "
                 f"heads ({config.num_attention_heads})"
             )
         self.attn_implementation = config.attn_implementation
         self.num_attention_heads = config.num_attention_heads
         self.attention_head_size = int(config.hidden_size / config.num_attention_heads)
@@ -1945,6 +1945,8 @@ class JinaBertForSequenceClassification(JinaBertPreTrainedModel):
         self.num_labels = config.num_labels
         self.config = config
         self.bert = JinaBertModel(config)
         classifier_dropout = (
             config.classifier_dropout
@@ -2042,6 +2044,57 @@ class JinaBertForSequenceClassification(JinaBertPreTrainedModel):
             attentions=outputs.attentions,
         )
 @add_start_docstrings(
     """

                 f"The hidden size ({config.hidden_size}) is not a multiple of the number of attention "
                 f"heads ({config.num_attention_heads})"
             )
         self.attn_implementation = config.attn_implementation
         self.num_attention_heads = config.num_attention_heads
         self.attention_head_size = int(config.hidden_size / config.num_attention_heads)
         self.num_labels = config.num_labels
         self.config = config
+        self._name_or_path = config._name_or_path
         self.bert = JinaBertModel(config)
         classifier_dropout = (
             config.classifier_dropout
             attentions=outputs.attentions,
         )
+    @torch.inference_mode()
+    def compute_score(
+        self,
+        sentence_pairs: Union[List[Tuple[str, str]], Tuple[str, str]],
+        batch_size: int = 32,
+        device: Optional[torch.device] = None,
+        **tokenizer_kwargs,
+    ):
+        assert isinstance(sentence_pairs, list)
+        if isinstance(sentence_pairs[0], str):
+            sentence_pairs = [sentence_pairs]
+        if not hasattr(self, 'tokenizer'):
+            from transformers import AutoTokenizer
+            self.tokenizer = AutoTokenizer.from_pretrained(self._name_or_path)
+        is_training = self.training
+        self.eval()
+        if device is not None:
+            self.to(device)
+        all_scores = []
+        for start_index in range(
+            0, len(sentence_pairs), batch_size
+        ):
+            sentences_batch = sentence_pairs[
+                start_index : start_index + (batch_size or self._eval_batch_size)
+            ]
+            inputs = self._tokenizer(
+                sentences_batch,
+                padding=True,
+                truncation=True,
+                return_tensors='pt',
+                **tokenizer_kwargs,
+            ).to(self.device)
+            scores = (
+                self.forward(**inputs, return_dict=True)
+                .logits.view(
+                    -1,
+                )
+                .float()
+            )
+            all_scores.extend(scores.cpu().numpy().tolist())
+        if len(all_scores) == 1:
+            return all_scores[0]
+        return all_scores
 @add_start_docstrings(
     """