From e5c77f63ced7b4633b0e157acb87a6161171f3f2 Mon Sep 17 00:00:00 2001
From: Chaiwat Saithongcum <chaiwat.sa@g-able.com>
Date: Tue, 24 Dec 2024 14:21:29 +0700
Subject: [PATCH 1/3] Add support for Google Generative AI (Gemini) embedder

---
 .../GeminiOptions/index.jsx                   | 50 +++++++++++++++++++
 .../EmbeddingPreference/index.jsx             |  9 ++++
 server/.env.example                           |  4 ++
 server/utils/EmbeddingEngines/gemini/index.js | 40 +++++++++++++++
 server/utils/helpers/index.js                 |  3 ++
 server/utils/helpers/updateENV.js             |  1 +
 6 files changed, 107 insertions(+)
 create mode 100644 frontend/src/components/EmbeddingSelection/GeminiOptions/index.jsx
 create mode 100644 server/utils/EmbeddingEngines/gemini/index.js
diff --git a/frontend/src/components/EmbeddingSelection/GeminiOptions/index.jsx b/frontend/src/components/EmbeddingSelection/GeminiOptions/index.jsx
new file mode 100644
index 00000000000..03def80c239
--- /dev/null
+++ b/frontend/src/components/EmbeddingSelection/GeminiOptions/index.jsx
@@ -0,0 +1,50 @@
+export default function GeminiOptions({ settings }) {
+  return (
+    <div className="w-full flex flex-col gap-y-4">
+      <div className="w-full flex items-center gap-[36px] mt-1.5">
+        <div className="flex flex-col w-60">
+          <label className="text-white text-sm font-semibold block mb-3">
+            API Key
+          </label>
+          <input
+            type="password"
+            name="GeminiLLMApiKey"
+            className="border-none bg-theme-settings-input-bg text-white placeholder:text-theme-settings-input-placeholder text-sm rounded-lg focus:outline-primary-button active:outline-primary-button outline-none block w-full p-2.5"
+            placeholder="Gemini LLM API Key"
+            defaultValue={settings?.GeminiLLMApiKey ? "*".repeat(20) : ""}
+            required={true}
+            autoComplete="off"
+            spellCheck={false}
+          />
+        </div>
+        <div className="flex flex-col w-60">
+          <label className="text-white text-sm font-semibold block mb-3">
+            Model Preference
+          </label>
+          <select
+            name="EmbeddingModelPref"
+            required={true}
+            className="border-none bg-theme-settings-input-bg border-gray-500 text-white text-sm rounded-lg block w-full p-2.5"
+          >
+            <optgroup label="Available embedding models">
+              {[
+                "text-embedding-004",
+                "embedding-001",
+              ].map((model) => {
+                return (
+                  <option
+                    key={model}
+                    value={model}
+                    selected={settings?.EmbeddingModelPref === model}
+                  >
+                    {model}
+                  </option>
+                );
+              })}
+            </optgroup>
+          </select>
+        </div>
+      </div>
+    </div>
+  );
+}
diff --git a/frontend/src/pages/GeneralSettings/EmbeddingPreference/index.jsx b/frontend/src/pages/GeneralSettings/EmbeddingPreference/index.jsx
index 77853e0a999..a1833b0cc6f 100644
--- a/frontend/src/pages/GeneralSettings/EmbeddingPreference/index.jsx
+++ b/frontend/src/pages/GeneralSettings/EmbeddingPreference/index.jsx
@@ -6,6 +6,7 @@ import showToast from "@/utils/toast";
 import AnythingLLMIcon from "@/media/logo/anything-llm-icon.png";
 import OpenAiLogo from "@/media/llmprovider/openai.png";
 import AzureOpenAiLogo from "@/media/llmprovider/azure.png";
+import GemeniAiLogo from "@/media/llmprovider/gemini.png";
 import LocalAiLogo from "@/media/llmprovider/localai.png";
 import OllamaLogo from "@/media/llmprovider/ollama.png";
 import LMStudioLogo from "@/media/llmprovider/lmstudio.png";
@@ -19,6 +20,7 @@ import PreLoader from "@/components/Preloader";
 import ChangeWarningModal from "@/components/ChangeWarning";
 import OpenAiOptions from "@/components/EmbeddingSelection/OpenAiOptions";
 import AzureAiOptions from "@/components/EmbeddingSelection/AzureAiOptions";
+import GeminiOptions from "@/components/EmbeddingSelection/GeminiOptions";
 import LocalAiOptions from "@/components/EmbeddingSelection/LocalAiOptions";
 import NativeEmbeddingOptions from "@/components/EmbeddingSelection/NativeEmbeddingOptions";
 import OllamaEmbeddingOptions from "@/components/EmbeddingSelection/OllamaOptions";
@@ -59,6 +61,13 @@ const EMBEDDERS = [
     options: (settings) => <AzureAiOptions settings={settings} />,
     description: "The enterprise option of OpenAI hosted on Azure services.",
   },
+  {
+    name: "Gemini",
+    value: "gemini",
+    logo: GemeniAiLogo,
+    options: (settings) => <GeminiOptions settings={settings} />,
+    description: "Run powerful embedding models from Google AI.",
+  },
   {
     name: "Local AI",
     value: "localai",
diff --git a/server/.env.example b/server/.env.example
index 3346fc397d5..b8e538c2464 100644
--- a/server/.env.example
+++ b/server/.env.example
@@ -128,6 +128,10 @@ SIG_SALT='salt' # Please generate random string at least 32 chars long.
 # AZURE_OPENAI_KEY=
 # EMBEDDING_MODEL_PREF='my-embedder-model' # This is the "deployment" on Azure you want to use for embeddings. Not the base model. Valid base model is text-embedding-ada-002
 
+# EMBEDDING_ENGINE='gemini'
+# GEMINI_API_KEY=
+# EMBEDDING_MODEL_PREF='text-embedding-004'
+
 # EMBEDDING_ENGINE='localai'
 # EMBEDDING_BASE_PATH='http://localhost:8080/v1'
 # EMBEDDING_MODEL_PREF='text-embedding-ada-002'
diff --git a/server/utils/EmbeddingEngines/gemini/index.js b/server/utils/EmbeddingEngines/gemini/index.js
new file mode 100644
index 00000000000..748383cc699
--- /dev/null
+++ b/server/utils/EmbeddingEngines/gemini/index.js
@@ -0,0 +1,40 @@
+const { toChunks } = require("../../helpers");
+
+class geminiEmbedder {
+  constructor() {
+    if (!process.env.GEMINI_API_KEY) throw new Error("No Gemini API key was set.");
+    const { GoogleGenerativeAI: GenerativeAI } = require("@google/generative-ai");
+    this.gemini = new GenerativeAI(process.env.GEMINI_API_KEY);
+    this.model = process.env.EMBEDDING_MODEL_PREF || "text-embedding-004";
+
+    // Limit of how many strings we can process in a single pass to stay with resource or network limits
+    this.maxConcurrentChunks = 1; // Gemini's limit per request is 1
+
+    // https://ai.google.dev/gemini-api/docs/models/gemini#text-embedding-and-embedding
+    this.embeddingMaxChunkLength = 2_048;
+  }
+
+  async embedTextInput(textInput) {
+    const genAI = this.gemini;
+    const model = genAI.getGenerativeModel({ model: this.model });
+
+    const result = await model.embedContent(textInput);
+    return result.embedding.values || [];
+  }
+
+  async embedChunks(textChunks = []) {
+    const genAI = this.gemini;
+    const model = genAI.getGenerativeModel({ model: this.model });
+
+    const embeddings = [];
+    for (const chunk of toChunks(textChunks, this.maxConcurrentChunks)) {
+      const result = await model.embedContent(chunk);
+      embeddings.push(result.embedding.values);
+    }
+    return embeddings || [];
+  }
+}
+
+module.exports = {
+  geminiEmbedder,
+};
diff --git a/server/utils/helpers/index.js b/server/utils/helpers/index.js
index 55d190f4fdb..be17625db88 100644
--- a/server/utils/helpers/index.js
+++ b/server/utils/helpers/index.js
@@ -222,6 +222,9 @@ function getEmbeddingEngineSelection() {
         AzureOpenAiEmbedder,
       } = require("../EmbeddingEngines/azureOpenAi");
       return new AzureOpenAiEmbedder();
+    case "gemini":
+      const { geminiEmbedder } = require("../EmbeddingEngines/gemini");
+      return new geminiEmbedder();
     case "localai":
       const { LocalAiEmbedder } = require("../EmbeddingEngines/localAi");
       return new LocalAiEmbedder();
diff --git a/server/utils/helpers/updateENV.js b/server/utils/helpers/updateENV.js
index da30b6ee0dd..dab2c82c98a 100644
--- a/server/utils/helpers/updateENV.js
+++ b/server/utils/helpers/updateENV.js
@@ -759,6 +759,7 @@ function supportedEmbeddingModel(input = "") {
   const supported = [
     "openai",
     "azure",
+    "gemini",
     "localai",
     "native",
     "ollama",

From 7d022fe3465e5fa96c91670e74d8e5cf2f1e8f02 Mon Sep 17 00:00:00 2001
From: timothycarambat <rambat1010@gmail.com>
Date: Tue, 31 Dec 2024 09:25:57 -0800
Subject: [PATCH 2/3] Add missing example in docker Fix UI key elements in
 options Add Gemini to data handling section Patch issues with chunk handling
 during embedding

---
 docker/.env.example                           |  4 ++
 .../GeminiOptions/index.jsx                   | 11 ++--
 .../Steps/DataHandling/index.jsx              |  8 +++
 server/.env.example                           |  4 ++
 server/models/systemSettings.js               |  5 +-
 server/utils/EmbeddingEngines/gemini/index.js | 56 ++++++++++++-------
 server/utils/helpers/index.js                 |  6 +-
 server/utils/helpers/updateENV.js             |  6 ++
 8 files changed, 66 insertions(+), 34 deletions(-)

diff --git a/docker/.env.example b/docker/.env.example
index ee53c718bc6..19c04dfa855 100644
--- a/docker/.env.example
+++ b/docker/.env.example
@@ -170,6 +170,10 @@ GID='1000'
 # GENERIC_OPEN_AI_EMBEDDING_API_KEY='sk-123abc'
 # GENERIC_OPEN_AI_EMBEDDING_MAX_CONCURRENT_CHUNKS=500
 
+# EMBEDDING_ENGINE='gemini'
+# GEMINI_EMBEDDING_API_KEY=
+# EMBEDDING_MODEL_PREF='text-embedding-004'
+
 ###########################################
 ######## Vector Database Selection ########
 ###########################################
diff --git a/frontend/src/components/EmbeddingSelection/GeminiOptions/index.jsx b/frontend/src/components/EmbeddingSelection/GeminiOptions/index.jsx
index 03def80c239..c25a2b13f8d 100644
--- a/frontend/src/components/EmbeddingSelection/GeminiOptions/index.jsx
+++ b/frontend/src/components/EmbeddingSelection/GeminiOptions/index.jsx
@@ -8,10 +8,10 @@ export default function GeminiOptions({ settings }) {
           </label>
           <input
             type="password"
-            name="GeminiLLMApiKey"
+            name="GeminiEmbeddingApiKey"
             className="border-none bg-theme-settings-input-bg text-white placeholder:text-theme-settings-input-placeholder text-sm rounded-lg focus:outline-primary-button active:outline-primary-button outline-none block w-full p-2.5"
-            placeholder="Gemini LLM API Key"
-            defaultValue={settings?.GeminiLLMApiKey ? "*".repeat(20) : ""}
+            placeholder="Gemini API Key"
+            defaultValue={settings?.GeminiEmbeddingApiKey ? "*".repeat(20) : ""}
             required={true}
             autoComplete="off"
             spellCheck={false}
@@ -27,10 +27,7 @@ export default function GeminiOptions({ settings }) {
             className="border-none bg-theme-settings-input-bg border-gray-500 text-white text-sm rounded-lg block w-full p-2.5"
           >
             <optgroup label="Available embedding models">
-              {[
-                "text-embedding-004",
-                "embedding-001",
-              ].map((model) => {
+              {["text-embedding-004"].map((model) => {
                 return (
                   <option
                     key={model}
diff --git a/frontend/src/pages/OnboardingFlow/Steps/DataHandling/index.jsx b/frontend/src/pages/OnboardingFlow/Steps/DataHandling/index.jsx
index 1fefca235b6..713891300dd 100644
--- a/frontend/src/pages/OnboardingFlow/Steps/DataHandling/index.jsx
+++ b/frontend/src/pages/OnboardingFlow/Steps/DataHandling/index.jsx
@@ -378,6 +378,14 @@ export const EMBEDDING_ENGINE_PRIVACY = {
     ],
     logo: GenericOpenAiLogo,
   },
+  gemini: {
+    name: "Google Gemini",
+    description: [
+      "Your document text is sent to Google Gemini's servers for processing",
+      "Your document text is stored or managed according to the terms of service of Google Gemini API Terms of Service",
+    ],
+    logo: GeminiLogo,
+  },
 };
 
 export default function DataHandling({ setHeader, setForwardBtn, setBackBtn }) {
diff --git a/server/.env.example b/server/.env.example
index b8e538c2464..d2e746a1583 100644
--- a/server/.env.example
+++ b/server/.env.example
@@ -168,6 +168,10 @@ SIG_SALT='salt' # Please generate random string at least 32 chars long.
 # GENERIC_OPEN_AI_EMBEDDING_API_KEY='sk-123abc'
 # GENERIC_OPEN_AI_EMBEDDING_MAX_CONCURRENT_CHUNKS=500
 
+# EMBEDDING_ENGINE='gemini'
+# GEMINI_EMBEDDING_API_KEY=
+# EMBEDDING_MODEL_PREF='text-embedding-004'
+
 ###########################################
 ######## Vector Database Selection ########
 ###########################################
diff --git a/server/models/systemSettings.js b/server/models/systemSettings.js
index 3403c0824cd..1af5d8cdd9d 100644
--- a/server/models/systemSettings.js
+++ b/server/models/systemSettings.js
@@ -198,10 +198,12 @@ const SystemSettings = {
       EmbeddingModelPref: process.env.EMBEDDING_MODEL_PREF,
       EmbeddingModelMaxChunkLength:
         process.env.EMBEDDING_MODEL_MAX_CHUNK_LENGTH,
+      VoyageAiApiKey: !!process.env.VOYAGEAI_API_KEY,
       GenericOpenAiEmbeddingApiKey:
         !!process.env.GENERIC_OPEN_AI_EMBEDDING_API_KEY,
       GenericOpenAiEmbeddingMaxConcurrentChunks:
         process.env.GENERIC_OPEN_AI_EMBEDDING_MAX_CONCURRENT_CHUNKS || 500,
+      GeminiEmbeddingApiKey: !!process.env.GEMINI_EMBEDDING_API_KEY,
 
       // --------------------------------------------------------
       // VectorDB Provider Selection Settings & Configs
@@ -533,9 +535,6 @@ const SystemSettings = {
       CohereApiKey: !!process.env.COHERE_API_KEY,
       CohereModelPref: process.env.COHERE_MODEL_PREF,
 
-      // VoyageAi API Keys
-      VoyageAiApiKey: !!process.env.VOYAGEAI_API_KEY,
-
       // DeepSeek API Keys
       DeepSeekApiKey: !!process.env.DEEPSEEK_API_KEY,
       DeepSeekModelPref: process.env.DEEPSEEK_MODEL_PREF,
diff --git a/server/utils/EmbeddingEngines/gemini/index.js b/server/utils/EmbeddingEngines/gemini/index.js
index 748383cc699..7a1ba9684c3 100644
--- a/server/utils/EmbeddingEngines/gemini/index.js
+++ b/server/utils/EmbeddingEngines/gemini/index.js
@@ -1,40 +1,54 @@
-const { toChunks } = require("../../helpers");
-
-class geminiEmbedder {
+class GeminiEmbedder {
   constructor() {
-    if (!process.env.GEMINI_API_KEY) throw new Error("No Gemini API key was set.");
-    const { GoogleGenerativeAI: GenerativeAI } = require("@google/generative-ai");
-    this.gemini = new GenerativeAI(process.env.GEMINI_API_KEY);
+    if (!process.env.GEMINI_API_KEY)
+      throw new Error("No Gemini API key was set.");
+    const { GoogleGenerativeAI } = require("@google/generative-ai");
+    const genAI = new GoogleGenerativeAI(process.env.GEMINI_API_KEY);
     this.model = process.env.EMBEDDING_MODEL_PREF || "text-embedding-004";
+    this.gemini = genAI.getGenerativeModel({ model: this.model });
 
-    // Limit of how many strings we can process in a single pass to stay with resource or network limits
-    this.maxConcurrentChunks = 1; // Gemini's limit per request is 1
+    // This property is disabled as it causes issues when sending multiple chunks at once
+    // since when given 4 chunks at once, the gemini api returns 1 embedding for all 4 chunks
+    // instead of 4 embeddings - no idea why this is the case, but it is not how the results are
+    // expected to be returned.
+    // this.maxConcurrentChunks = 1;
 
     // https://ai.google.dev/gemini-api/docs/models/gemini#text-embedding-and-embedding
     this.embeddingMaxChunkLength = 2_048;
+    this.log(`Initialized with ${this.model}`);
   }
 
-  async embedTextInput(textInput) {
-    const genAI = this.gemini;
-    const model = genAI.getGenerativeModel({ model: this.model });
+  log(text, ...args) {
+    console.log(`\x1b[36m[GeminiEmbedder]\x1b[0m ${text}`, ...args);
+  }
 
-    const result = await model.embedContent(textInput);
+  /**
+   * Embeds a single text input
+   * @param {string} textInput - The text to embed
+   * @returns {Promise<Array<number>>} The embedding values
+   */
+  async embedTextInput(textInput) {
+    const result = await this.gemini.embedContent(textInput);
     return result.embedding.values || [];
   }
 
+  /**
+   * Embeds a list of text inputs
+   * @param {Array<string>} textInputs - The list of text to embed
+   * @returns {Promise<Array<Array<number>>>} The embedding values
+   */
   async embedChunks(textChunks = []) {
-    const genAI = this.gemini;
-    const model = genAI.getGenerativeModel({ model: this.model });
-
-    const embeddings = [];
-    for (const chunk of toChunks(textChunks, this.maxConcurrentChunks)) {
-      const result = await model.embedContent(chunk);
-      embeddings.push(result.embedding.values);
+    let embeddings = [];
+    for (const chunk of textChunks) {
+      const results = await this.gemini.embedContent(chunk);
+      if (!results.embedding || !results.embedding.values)
+        throw new Error("No embedding values returned from gemini");
+      embeddings.push(results.embedding.values);
     }
-    return embeddings || [];
+    return embeddings;
   }
 }
 
 module.exports = {
-  geminiEmbedder,
+  GeminiEmbedder,
 };
diff --git a/server/utils/helpers/index.js b/server/utils/helpers/index.js
index be17625db88..fa47f9cf78e 100644
--- a/server/utils/helpers/index.js
+++ b/server/utils/helpers/index.js
@@ -222,9 +222,6 @@ function getEmbeddingEngineSelection() {
         AzureOpenAiEmbedder,
       } = require("../EmbeddingEngines/azureOpenAi");
       return new AzureOpenAiEmbedder();
-    case "gemini":
-      const { geminiEmbedder } = require("../EmbeddingEngines/gemini");
-      return new geminiEmbedder();
     case "localai":
       const { LocalAiEmbedder } = require("../EmbeddingEngines/localAi");
       return new LocalAiEmbedder();
@@ -253,6 +250,9 @@ function getEmbeddingEngineSelection() {
         GenericOpenAiEmbedder,
       } = require("../EmbeddingEngines/genericOpenAi");
       return new GenericOpenAiEmbedder();
+    case "gemini":
+      const { GeminiEmbedder } = require("../EmbeddingEngines/gemini");
+      return new GeminiEmbedder();
     default:
       return new NativeEmbedder();
   }
diff --git a/server/utils/helpers/updateENV.js b/server/utils/helpers/updateENV.js
index dab2c82c98a..bdf4e63d68f 100644
--- a/server/utils/helpers/updateENV.js
+++ b/server/utils/helpers/updateENV.js
@@ -266,6 +266,12 @@ const KEY_MAPPING = {
     checks: [nonZero],
   },
 
+  // Gemini Embedding Settings
+  GeminiEmbeddingApiKey: {
+    envKey: "GEMINI_EMBEDDING_API_KEY",
+    checks: [isNotEmpty],
+  },
+
   // Generic OpenAI Embedding Settings
   GenericOpenAiEmbeddingApiKey: {
     envKey: "GENERIC_OPEN_AI_EMBEDDING_API_KEY",

From ed52202ed15c5b1243c3e2e1ca2daacc2c3557ab Mon Sep 17 00:00:00 2001
From: timothycarambat <rambat1010@gmail.com>
Date: Tue, 31 Dec 2024 09:27:11 -0800
Subject: [PATCH 3/3] remove dupe in env

---
 server/.env.example | 4 ----
 1 file changed, 4 deletions(-)

diff --git a/server/.env.example b/server/.env.example
index d2e746a1583..bf528359d4d 100644
--- a/server/.env.example
+++ b/server/.env.example
@@ -128,10 +128,6 @@ SIG_SALT='salt' # Please generate random string at least 32 chars long.
 # AZURE_OPENAI_KEY=
 # EMBEDDING_MODEL_PREF='my-embedder-model' # This is the "deployment" on Azure you want to use for embeddings. Not the base model. Valid base model is text-embedding-ada-002
 
-# EMBEDDING_ENGINE='gemini'
-# GEMINI_API_KEY=
-# EMBEDDING_MODEL_PREF='text-embedding-004'
-
 # EMBEDDING_ENGINE='localai'
 # EMBEDDING_BASE_PATH='http://localhost:8080/v1'
 # EMBEDDING_MODEL_PREF='text-embedding-ada-002'