Fix token count

Signed-off-by: Jael Gu <mengjia.gu@zilliz.com>
2 years ago · 3ed58a383a
1 changed files with 1 additions and 1 deletions
--- a/auto_transformers.py
+++ b/auto_transformers.py
@ -146,6 +146,7 @@ class AutoTransformers(NNOperator):
            txt = data
        try:
            inputs = self.tokenizer(txt, padding=True, truncation=True, return_tensors='pt')
            num_tokens = int(torch.count_nonzero(inputs['input_ids']))
        except Exception as e:
            log.error(f'Fail to tokenize inputs: {e}')
            raise e
@ -155,7 +156,6 @@ class AutoTransformers(NNOperator):
            log.error(f'Invalid input for the model: {self.model_name}')
            raise e
        num_tokens = outs.size(1)
        if self.pool == 'mean':
            outs = self.mean_pool(outs, inputs)
        elif self.pool == 'cls':