Add support for HuggingFace Inference API (text generation and feature extraction) (promptfoo#205)

typpo · web-flow · commit 1df7ace85fd9 · 2023-09-29T10:16:02.000-07:00
diff --git a/.jest/setEnvVars.js b/.jest/setEnvVars.js
@@ -2,3 +2,4 @@ process.env.OPENAI_API_KEY = 'foo';
 process.env.AZURE_OPENAI_API_KEY = 'foo';
 process.env.AZURE_OPENAI_API_HOST = 'azure.openai.host';
 process.env.ANTHROPIC_API_KEY = 'foo';
+process.env.HF_API_TOKEN = 'foo';
diff --git a/src/providers.ts b/src/providers.ts
@@ -23,6 +23,7 @@ import {
   AzureOpenAiCompletionProvider,
   AzureOpenAiEmbeddingProvider,
 } from './providers/azureopenai';
+import { HuggingfaceFeatureExtractionProvider, HuggingfaceTextGenerationProvider } from './providers/huggingface';
 
 import type {
   ApiProvider,
@@ -162,11 +163,26 @@ export async function loadApiProvider(
         `Unknown Anthropic model type: ${modelType}. Use one of the following providers: anthropic:completion:<model name>`,
       );
     }
+  } else if (providerPath?.startsWith('huggingface:')) {
+    const splits = providerPath.split(':');
+    if (splits.length < 3) {
+      throw new Error(
+        `Invalid Huggingface provider path: ${providerPath}. Use one of the following providers: huggingface:feature-extraction:<model name>, huggingface:text-generation:<model name>`,
+      );
+    }
+    const modelName = splits.slice(2).join(':');
+    if (splits[1] === 'feature-extraction') {
+      return new HuggingfaceFeatureExtractionProvider(modelName, providerOptions);
+    } else if (splits[1] === 'text-generation') {
+      return new HuggingfaceTextGenerationProvider(modelName, providerOptions);
+    } else {
+      throw new Error(
+        `Invalid Huggingface provider path: ${providerPath}. Use one of the following providers: huggingface:feature-extraction:<model name>, huggingface:text-generation:<model name>`,
+      );
+    }
   } else if (providerPath?.startsWith('replicate:')) {
-    // Load Replicate module
     const splits = providerPath.split(':');
     const modelName = splits.slice(1).join(':');
-
     return new ReplicateProvider(modelName, providerOptions);
   }
 
diff --git a/src/providers/huggingface.ts b/src/providers/huggingface.ts
@@ -0,0 +1,146 @@
+import fetch from 'node-fetch';
+import {fetchWithCache} from '../cache';
+
+import type { ApiProvider, ProviderEmbeddingResponse, ProviderResponse } from '../types';
+import {REQUEST_TIMEOUT_MS} from './shared';
+
+interface HuggingfaceTextGenerationOptions {
+  top_k?: number;
+  top_p?: number;
+  temperature?: number;
+  repetition_penalty?: number;
+  max_new_tokens?: number;
+  max_time?: number;
+  return_full_text?: boolean;
+  num_return_sequences?: number;
+  do_sample?: boolean;
+  use_cache?: boolean;
+  wait_for_model?: boolean;
+}
+
+export class HuggingfaceTextGenerationProvider implements ApiProvider {
+  modelName: string;
+  config: HuggingfaceTextGenerationOptions;
+
+  constructor(modelName: string, options: { id?: string, config?: HuggingfaceTextGenerationOptions } = {}) {
+    const { id, config } = options;
+    this.modelName = modelName;
+    this.id = id ? () => id : this.id;
+    this.config = config || {};
+  }
+
+  id(): string {
+    return `huggingface:text-generation:${this.modelName}`;
+  }
+
+  toString(): string {
+    return `[Huggingface Text Generation Provider ${this.modelName}]`;
+  }
+
+  async callApi(prompt: string): Promise<ProviderResponse> {
+    const params = {
+      inputs: prompt,
+      parameters: {
+        return_full_text: this.config.return_full_text ?? false,
+        ...this.config
+      },
+    };
+
+    let response;
+    try {
+      response = await fetchWithCache(`https://api-inference.huggingface.co/models/${this.modelName}`, {
+        method: 'POST',
+        headers: {
+          'Content-Type': 'application/json',
+          ...(process.env.HF_API_TOKEN ? { 'Authorization': `Bearer ${process.env.HF_API_TOKEN}` } : {}),
+        },
+        body: JSON.stringify(params),
+      }, REQUEST_TIMEOUT_MS);
+
+      if (response.data.error) {
+        return {
+          error: `API call error: ${response.data.error}`,
+        };
+      }
+      if (!response.data[0]) {
+        return {
+          error: `Malformed response data: ${response.data}`,
+        };
+      }
+
+      return {
+        output: response.data[0]?.generated_text,
+      };
+    } catch(err) {
+      return {
+        error: `API call error: ${String(err)}. Output:\n${response?.data}`,
+      };
+    }
+  }
+}
+
+interface HuggingfaceFeatureExtractionOptions {
+  use_cache?: boolean;
+  wait_for_model?: boolean;
+}
+
+export class HuggingfaceFeatureExtractionProvider implements ApiProvider {
+   modelName: string;
+   config: HuggingfaceFeatureExtractionOptions;
+
+   constructor(modelName: string, options: { id?: string, config?: HuggingfaceFeatureExtractionOptions } = {}) {
+     const { id, config } = options;
+     this.modelName = modelName;
+     this.id = id ? () => id : this.id;
+     this.config = config || {};
+   }
+
+   id(): string {
+     return `huggingface:feature-extraction:${this.modelName}`;
+   }
+
+   toString(): string {
+     return `[Huggingface Feature Extraction Provider ${this.modelName}]`;
+   }
+
+   async callApi(): Promise<ProviderResponse> {
+     throw new Error('Cannot use a feature extraction provider for text generation');
+   }
+
+   async callEmbeddingApi(text: string): Promise<ProviderEmbeddingResponse> {
+     const params = {
+       inputs: text,
+     };
+
+     let response;
+     try {
+       response = await fetchWithCache(`https://api-inference.huggingface.co/models/${this.modelName}`, {
+         method: 'POST',
+         headers: {
+           'Content-Type': 'application/json',
+           ...(process.env.HF_API_TOKEN ? { 'Authorization': `Bearer ${process.env.HF_API_TOKEN}` } : {}),
+         },
+         body: JSON.stringify(params),
+       }, REQUEST_TIMEOUT_MS);
+
+       if (response.data.error) {
+         return {
+           error: `API call error: ${response.data.error}`,
+         };
+       }
+       if (!Array.isArray(response.data)) {
+         return {
+           error: `Malformed response data: ${response.data}`,
+         };
+       }
+
+       return {
+         embedding: response.data,
+       };
+     } catch(err) {
+       return {
+         error: `API call error: ${String(err)}. Output:\n${response?.data}`,
+       };
+     }
+   }
+ }
diff --git a/src/providers/ollama.ts b/src/providers/ollama.ts
@@ -136,10 +136,10 @@ export class OllamaProvider implements ApiProvider {
 }
 
 export class OllamaEmbeddingProvider extends OllamaProvider {
-  async callEmbeddingApi(prompt: string): Promise<ProviderEmbeddingResponse> {
+  async callEmbeddingApi(text: string): Promise<ProviderEmbeddingResponse> {
     const params = {
       model: this.modelName,
-      prompt,
+      prompt: text,
     };
 
     logger.debug(`Calling Ollama API: ${JSON.stringify(params)}`);
diff --git a/test/providers.test.ts b/test/providers.test.ts
@@ -12,6 +12,7 @@ import {
 } from '../src/providers/azureopenai';
 import { OllamaProvider } from '../src/providers/ollama';
 import { WebhookProvider } from '../src/providers/webhook';
+import { HuggingfaceTextGenerationProvider, HuggingfaceFeatureExtractionProvider } from '../src/providers/huggingface';
 
 import type { ProviderOptionsMap, ProviderFunction } from '../src/types';
 
@@ -225,6 +226,37 @@ describe('providers', () => {
     expect(result.output).toBe('Test output');
   });
 
+  test('HuggingfaceTextGenerationProvider callApi', async () => {
+    const mockResponse = {
+      json: jest.fn().mockResolvedValue([
+        { generated_text: 'Test output' },
+      ]),
+    };
+    (fetch as unknown as jest.Mock).mockResolvedValue(mockResponse);
+
+    const provider = new HuggingfaceTextGenerationProvider('gpt2');
+    const result = await provider.callApi('Test prompt');
+
+    expect(fetch).toHaveBeenCalledTimes(1);
+    expect(result.output).toBe('Test output');
+  });
+
+  test('HuggingfaceFeatureExtractionProvider callEmbeddingApi', async () => {
+    const mockResponse = {
+      json: jest.fn().mockResolvedValue(
+        [0.1, 0.2, 0.3, 0.4, 0.5],
+      ),
+    };
+    (fetch as unknown as jest.Mock).mockResolvedValue(mockResponse);
+
+    const provider = new HuggingfaceFeatureExtractionProvider('distilbert-base-uncased');
+    const result = await provider.callEmbeddingApi('Test text');
+
+    expect(fetch).toHaveBeenCalledTimes(1);
+    expect(result.embedding).toEqual([0.1, 0.2, 0.3, 0.4, 0.5]);
+  });
+
+
   test('loadApiProvider with openai:chat', async () => {
     const provider = await loadApiProvider('openai:chat');
     expect(provider).toBeInstanceOf(OpenAiChatCompletionProvider);
@@ -281,6 +313,16 @@ describe('providers', () => {
     expect(provider).toBeInstanceOf(WebhookProvider);
   });
 
+  test('loadApiProvider with huggingface:text-generation', async () => {
+    const provider = await loadApiProvider('huggingface:text-generation:foobar/baz');
+    expect(provider).toBeInstanceOf(HuggingfaceTextGenerationProvider);
+  });
+
+  test('loadApiProvider with huggingface:feature-extraction', async () => {
+    const provider = await loadApiProvider('huggingface:feature-extraction:foobar/baz');
+    expect(provider).toBeInstanceOf(HuggingfaceFeatureExtractionProvider);
+  });
+
   test('loadApiProvider with RawProviderConfig', async () => {
     const rawProviderConfig = {
       'openai:chat': {