feat: Add Embedding API (gemini and custom)

yinghuo302 · yinghuo302 · commit bdab53589b82 · 2024-08-06T22:45:10.000+08:00
diff --git a/cmd/command.go b/cmd/command.go
@@ -2,11 +2,12 @@ package main
 
 import (
 	"chatgpt-adapter/internal/common"
-	"chatgpt-adapter/internal/gin.handler"
+	handler "chatgpt-adapter/internal/gin.handler"
 	"chatgpt-adapter/internal/vars"
 	"chatgpt-adapter/logger"
 	"chatgpt-adapter/pkg"
 	"fmt"
+
 	"github.com/sirupsen/logrus"
 	"github.com/spf13/cobra"
 )
diff --git a/internal/common/gin.go b/internal/common/gin.go
@@ -4,8 +4,9 @@ import (
 	"chatgpt-adapter/internal/vars"
 	"chatgpt-adapter/pkg"
 	"context"
-	"github.com/gin-gonic/gin"
 	"time"
+
+	"github.com/gin-gonic/gin"
 )
 
 func GinDebugger(ctx *gin.Context) bool {
@@ -21,6 +22,11 @@ func GetGinCompletion(ctx *gin.Context) (value pkg.ChatCompletion) {
 	return
 }
 
+func GetGinEmbedding(ctx *gin.Context) (value pkg.EmbedRequest) {
+	value, _ = GetGinValue[pkg.EmbedRequest](ctx, vars.GinEmbedding)
+	return
+}
+
 func GetGinGeneration(ctx *gin.Context) (value pkg.ChatGeneration) {
 	value, _ = GetGinValue[pkg.ChatGeneration](ctx, vars.GinGeneration)
 	return
diff --git a/internal/gin.handler/basic.go b/internal/gin.handler/basic.go
@@ -14,15 +14,16 @@ import (
 	"encoding/hex"
 	"encoding/json"
 	"fmt"
-	"github.com/gin-gonic/gin"
-	"github.com/google/uuid"
 	"io"
 	"net/http"
 	"net/http/httputil"
 	"os"
 	"slices"
 	"strconv"
 	"strings"
+
+	"github.com/gin-gonic/gin"
+	"github.com/google/uuid"
 )
 
 func Bind(port int, version, proxies string) {
@@ -43,6 +44,7 @@ func Bind(port int, version, proxies string) {
 	route.POST("/v1/chat/completions", completions)
 	route.POST("/v1/object/completions", completions)
 	route.POST("/proxies/v1/chat/completions", completions)
+	route.POST("/v1/embeddings", embedding)
 	route.POST("v1/images/generations", generations)
 	route.POST("v1/object/generations", generations)
 	route.POST("proxies/v1/images/generations", generations)
diff --git a/internal/gin.handler/embedding.go b/internal/gin.handler/embedding.go
@@ -0,0 +1,30 @@
+package handler
+
+import (
+	"chatgpt-adapter/internal/gin.handler/response"
+	"chatgpt-adapter/internal/vars"
+	"chatgpt-adapter/logger"
+	"chatgpt-adapter/pkg"
+	"fmt"
+
+	"github.com/gin-gonic/gin"
+)
+
+func embedding(ctx *gin.Context) {
+
+	var embedding pkg.EmbedRequest
+	if err := ctx.BindJSON(&embedding); err != nil {
+		logger.Error(err)
+		response.Error(ctx, -1, err)
+		return
+	}
+	_ = ctx.Request.Body.Close()
+	ctx.Set(vars.GinEmbedding, embedding)
+
+	if !GlobalExtension.Match(ctx, embedding.Model) {
+		response.Error(ctx, -1, fmt.Sprintf("model '%s' is not not yet supported", embedding.Model))
+		return
+	}
+
+	GlobalExtension.Embedding(ctx)
+}
diff --git a/internal/plugin/adapter.go b/internal/plugin/adapter.go
@@ -7,6 +7,7 @@ import (
 	"chatgpt-adapter/logger"
 	"chatgpt-adapter/pkg"
 	"fmt"
+
 	"github.com/bincooo/emit.io"
 	"github.com/gin-gonic/gin"
 	socketio "github.com/zishang520/socket.io/socket"
@@ -71,6 +72,7 @@ type Adapter interface {
 	Models() []Model
 	Completion(ctx *gin.Context)
 	Generation(ctx *gin.Context)
+	Embedding(ctx *gin.Context)
 }
 
 type BaseAdapter struct {
@@ -90,6 +92,8 @@ func (BaseAdapter) Completion(*gin.Context) {
 func (BaseAdapter) Generation(*gin.Context) {
 }
 
+func (BaseAdapter) Embedding(*gin.Context) {}
+
 func (adapter ExtensionAdapter) Match(ctx *gin.Context, model string) bool {
 	for _, extension := range adapter.Extensions {
 		if extension.Match(ctx, model) {
@@ -117,6 +121,17 @@ func (adapter ExtensionAdapter) Completion(ctx *gin.Context) {
 	response.Error(ctx, -1, fmt.Sprintf("model '%s' is not not yet supported", completion.Model))
 }
 
+func (adapter ExtensionAdapter) Embedding(ctx *gin.Context) {
+	embedding := common.GetGinEmbedding(ctx)
+	for _, extension := range adapter.Extensions {
+		if extension.Match(ctx, embedding.Model) {
+			extension.Embedding(ctx)
+			return
+		}
+	}
+	response.Error(ctx, -1, fmt.Sprintf("model '%s' is not not yet supported", embedding.Model))
+}
+
 func (adapter ExtensionAdapter) Messages(ctx *gin.Context) {
 	completion := common.GetGinCompletion(ctx)
 	for _, extension := range adapter.Extensions {
diff --git a/internal/plugin/llm/gemini/adapter.go b/internal/plugin/llm/gemini/adapter.go
@@ -8,9 +8,10 @@ import (
 	"chatgpt-adapter/logger"
 	"encoding/json"
 	"errors"
-	"github.com/gin-gonic/gin"
 	"net/url"
 	"strings"
+
+	"github.com/gin-gonic/gin"
 )
 
 const MODEL = "gemini"
@@ -38,7 +39,7 @@ type API struct {
 
 func (API) Match(_ *gin.Context, model string) bool {
 	switch model {
-	case "gemini-1.0-pro-latest", "gemini-1.5-pro-latest", "gemini-1.5-flash-latest":
+	case "gemini-1.0-pro-latest", "gemini-1.5-pro-latest", "gemini-1.5-flash-latest", "models/text-embedding-004":
 		return true
 	default:
 		return false
@@ -62,6 +63,11 @@ func (API) Models() []plugin.Model {
 			Object:  "model",
 			Created: 1686935002,
 			By:      "gemini-adapter",
+		}, {
+			Id:      "models/text-embedding-004",
+			Object:  "model",
+			Created: 1686935002,
+			By:      "gemini-adapter",
 		},
 	}
 }
diff --git a/internal/plugin/llm/gemini/embedding.go b/internal/plugin/llm/gemini/embedding.go
@@ -0,0 +1,150 @@
+package gemini
+
+import (
+	"chatgpt-adapter/internal/common"
+	"chatgpt-adapter/internal/plugin"
+	"chatgpt-adapter/pkg"
+	"encoding/json"
+	"io"
+	"net/http"
+
+	"github.com/bincooo/emit.io"
+	"github.com/gin-gonic/gin"
+	"github.com/pkg/errors"
+)
+
+func ConvertOpenAIRequestToGemini(openAIReq *pkg.EmbedRequest, model string) (*GeminiEmbedBatchReq, error) {
+	if openAIReq.EncodingFormat != "" && openAIReq.EncodingFormat != "float" {
+		return nil, errors.New("unsupported encoding format")
+	}
+	reqs := make([]GeminiEmbedReq, 0)
+	switch v := openAIReq.Input.(type) {
+	case string:
+		reqs = append(reqs, GeminiEmbedReq{
+			Model: model,
+			Content: GeminiContent{
+				Parts: []GeminiContPart{{Text: v}},
+			},
+		})
+	case []interface{}:
+		for _, text := range v {
+			if t, ok := text.(string); ok {
+				reqs = append(reqs, GeminiEmbedReq{
+					Model: model,
+					Content: GeminiContent{
+						Parts: []GeminiContPart{{Text: t}},
+					},
+				})
+			} else {
+				return nil, errors.Errorf("unsupported input type: %T", t)
+			}
+		}
+	default:
+		return nil, errors.Errorf("unsupported input type: %T", v)
+	}
+
+	return &GeminiEmbedBatchReq{Requests: reqs}, nil
+}
+
+func ConvertGeminiResponseToOpenAI(geminiResp *GeminiResp, model string) *EmbedResponse {
+	openAIResp := &EmbedResponse{
+		Object: "list",
+		Model:  model,
+	}
+
+	for i, geminiResp := range geminiResp.Embeddings {
+		openAIResp.Data = append(openAIResp.Data, &EmbedResponseData{
+			Object:    "embedding",
+			Embedding: geminiResp.Values,
+			Index:     i,
+		})
+	}
+
+	openAIResp.Usage = &Usage{
+		PromptTokens: 0,
+		TotalTokens:  0,
+	}
+
+	return openAIResp
+}
+
+type GeminiEmbedBatchReq struct {
+	Requests []GeminiEmbedReq `json:"requests"`
+}
+
+type GeminiEmbedReq struct {
+	Model   string        `json:"model"`
+	Content GeminiContent `json:"content"`
+}
+
+type GeminiContent struct {
+	Parts []GeminiContPart `json:"parts"`
+}
+
+type GeminiContPart struct {
+	Text string `json:"text"`
+}
+
+type EmbedResponseData struct {
+	Object    string    `json:"object"`
+	Embedding []float32 `json:"embedding"`
+	Index     int       `json:"index"`
+}
+
+type Usage struct {
+	PromptTokens int `json:"prompt_tokens"`
+	TotalTokens  int `json:"total_tokens"`
+}
+
+type EmbedResponse struct {
+	Object string               `json:"object"`
+	Data   []*EmbedResponseData `json:"data"`
+	Model  string               `json:"model"`
+	Usage  *Usage               `json:"usage"`
+}
+
+type GeminiResp struct {
+	Embeddings []GeminiEmbedding `json:"embeddings"`
+}
+
+type GeminiEmbedding struct {
+	Values []float32 `json:"values"`
+}
+
+func (API) Embedding(ctx *gin.Context) {
+
+	openAIReq := common.GetGinEmbedding(ctx)
+	var (
+		token   = ctx.GetString("token")
+		proxies = ctx.GetString("proxies")
+	)
+
+	geminiReq, err := ConvertOpenAIRequestToGemini(&openAIReq, openAIReq.Model)
+	if err != nil {
+		ctx.JSON(http.StatusBadRequest, gin.H{"error": "Bad Request"})
+		return
+	}
+	url := "https://generativelanguage.googleapis.com/v1beta/" +
+		openAIReq.Model + ":batchEmbedContents?key=" + token
+	resp, err := emit.ClientBuilder(plugin.HTTPClient).
+		Proxies(proxies).
+		Context(common.GetGinContext(ctx)).
+		POST(url).
+		JHeader().
+		Body(geminiReq).DoC(emit.Status(http.StatusOK))
+
+	if err != nil {
+		ctx.JSON(http.StatusInternalServerError, gin.H{"error": err.Error()})
+		return
+	}
+	respBytes, err := io.ReadAll(resp.Body)
+	if err != nil {
+		ctx.JSON(http.StatusInternalServerError, gin.H{"error": err.Error()})
+		return
+	}
+	var geminiResp GeminiResp
+	json.Unmarshal(respBytes, &geminiResp)
+	openAIResp := ConvertGeminiResponseToOpenAI(&geminiResp, openAIReq.Model)
+
+	ctx.JSON(http.StatusOK, openAIResp)
+}
diff --git a/internal/plugin/llm/v1/adapter.go b/internal/plugin/llm/v1/adapter.go
@@ -5,8 +5,13 @@ import (
 	"chatgpt-adapter/internal/gin.handler/response"
 	"chatgpt-adapter/internal/plugin"
 	"chatgpt-adapter/logger"
-	"github.com/gin-gonic/gin"
+	"chatgpt-adapter/pkg"
+	"io"
+	"net/http"
 	"strings"
+
+	"github.com/bincooo/emit.io"
+	"github.com/gin-gonic/gin"
 )
 
 var (
@@ -68,3 +73,38 @@ label:
 		response.Error(ctx, -1, "EMPTY RESPONSE")
 	}
 }
+
+func (API) Embedding(ctx *gin.Context) {
+	embedding := common.GetGinEmbedding(ctx)
+	embedding.Model = embedding.Model[7:]
+	var (
+		token    = ctx.GetString("token")
+		proxies  = ctx.GetString("proxies")
+		baseUrl  = pkg.Config.GetString("custom-llm.baseUrl")
+		useProxy = pkg.Config.GetBool("custom-llm.useProxy")
+	)
+	if !useProxy {
+		proxies = ""
+	}
+	resp, err := emit.ClientBuilder(plugin.HTTPClient).
+		Proxies(proxies).
+		Context(common.GetGinContext(ctx)).
+		POST(baseUrl+"/v1/embeddings").
+		Header("Authorization", "Bearer "+token).
+		JHeader().
+		Body(embedding).DoC(emit.Status(http.StatusOK))
+	if err != nil {
+		ctx.JSON(http.StatusBadGateway, gin.H{
+			"error": "can't send request to upstream",
+		})
+	}
+	ctx.Header("Content-Type", "application/json; charset=utf-8")
+	content, err := io.ReadAll(resp.Body)
+	if err != nil {
+		ctx.JSON(http.StatusBadGateway, gin.H{
+			"error": "can't read from upstream",
+		})
+	}
+	ctx.Writer.Write(content)
+	ctx.Writer.Flush()
+}
diff --git a/internal/vars/com.go b/internal/vars/com.go
@@ -11,6 +11,7 @@ const (
 
 	GinCompletion      = "__completion__"
 	GinGeneration      = "__generation__"
+	GinEmbedding       = "__embedding__"
 	GinMatchers        = "__matchers__"
 	GinCompletionUsage = "__completion-usage__"
 	GinDebugger        = "__debug__"
diff --git a/pkg/model.go b/pkg/model.go
@@ -28,6 +28,14 @@ type ChatGeneration struct {
 	Quality string `json:"quality"`
 }
 
+type EmbedRequest struct {
+	Input          interface{} `json:"input"`
+	Model          string      `json:"model"`
+	EncodingFormat string      `json:"encoding_format,omitempty"`
+	Dimensions     int         `json:"dimensions,omitempty"`
+	User           string      `json:"user,omitempty"`
+}
+
 type Keyv[V any] map[string]V
 
 type ChatResponse struct {