From 33067b5f9e5f1f366161d49a12e5a9a60fe1ce87 Mon Sep 17 00:00:00 2001
From: Aaron Van Doren <vandoren96+1@gmail.com>
Date: Sun, 15 Sep 2024 21:14:53 -0700
Subject: [PATCH] Issue #1943: Add support for LLM provider - Fireworks AI

---
 .vscode/settings.json                         |   1 +
 README.md                                     |   1 +
 docker/.env.example                           |   4 +
 .../LLMSelection/FireworksAiOptions/index.jsx |  99 +++++++++++++
 frontend/src/hooks/useGetProvidersModels.js   |   5 +-
 .../src/media/llmprovider/fireworksai.jpeg    | Bin 0 -> 3795 bytes
 .../GeneralSettings/LLMPreference/index.jsx   |  11 ++
 .../Steps/DataHandling/index.jsx              |   9 ++
 .../Steps/LLMPreference/index.jsx             |  10 ++
 locales/README.ja-JP.md                       |   1 +
 locales/README.zh-CN.md                       |   1 +
 server/.env.example                           |   4 +
 server/models/systemSettings.js               |   4 +
 server/utils/AiProviders/fireworksAi/index.js | 135 ++++++++++++++++++
 .../utils/AiProviders/fireworksAi/models.js   | 112 +++++++++++++++
 .../fireworksAi/scripts/.gitignore            |   1 +
 .../fireworksAi/scripts/chat_models.txt       |  20 +++
 .../AiProviders/fireworksAi/scripts/parse.mjs |  46 ++++++
 server/utils/helpers/customModels.js          |  19 +++
 server/utils/helpers/index.js                 |   6 +
 server/utils/helpers/updateENV.js             |  11 ++
 21 files changed, 498 insertions(+), 2 deletions(-)
 create mode 100644 frontend/src/components/LLMSelection/FireworksAiOptions/index.jsx
 create mode 100644 frontend/src/media/llmprovider/fireworksai.jpeg
 create mode 100644 server/utils/AiProviders/fireworksAi/index.js
 create mode 100644 server/utils/AiProviders/fireworksAi/models.js
 create mode 100644 server/utils/AiProviders/fireworksAi/scripts/.gitignore
 create mode 100644 server/utils/AiProviders/fireworksAi/scripts/chat_models.txt
 create mode 100644 server/utils/AiProviders/fireworksAi/scripts/parse.mjs
diff --git a/.vscode/settings.json b/.vscode/settings.json
index 4769a939c43..d60238c72cb 100644
--- a/.vscode/settings.json
+++ b/.vscode/settings.json
@@ -47,6 +47,7 @@
     "streamable",
     "textgenwebui",
     "togetherai",
+    "fireworksai",
     "Unembed",
     "vectordbs",
     "Weaviate",
diff --git a/README.md b/README.md
index aa36f8bb836..d42f6fe913f 100644
--- a/README.md
+++ b/README.md
@@ -84,6 +84,7 @@ AnythingLLM divides your documents into objects called `workspaces`. A Workspace
 - [LM Studio (all models)](https://lmstudio.ai)
 - [LocalAi (all models)](https://localai.io/)
 - [Together AI (chat models)](https://www.together.ai/)
+- [Fireworks AI  (chat models)](https://fireworks.ai/)
 - [Perplexity (chat models)](https://www.perplexity.ai/)
 - [OpenRouter (chat models)](https://openrouter.ai/)
 - [Mistral](https://mistral.ai/)
diff --git a/docker/.env.example b/docker/.env.example
index 1521a307af7..e38ba6edf65 100644
--- a/docker/.env.example
+++ b/docker/.env.example
@@ -47,6 +47,10 @@ GID='1000'
 # TOGETHER_AI_API_KEY='my-together-ai-key'
 # TOGETHER_AI_MODEL_PREF='mistralai/Mixtral-8x7B-Instruct-v0.1'
 
+# LLM_PROVIDER='fireworksai'
+# FIREWORKS_AI_API_KEY='my-fireworks-ai-key'
+# FIREWORKS_AI_MODEL_PREF='accounts/fireworks/models/llama-v3p1-8b-instruct'
+
 # LLM_PROVIDER='mistral'
 # MISTRAL_API_KEY='example-mistral-ai-api-key'
 # MISTRAL_MODEL_PREF='mistral-tiny'
diff --git a/frontend/src/components/LLMSelection/FireworksAiOptions/index.jsx b/frontend/src/components/LLMSelection/FireworksAiOptions/index.jsx
new file mode 100644
index 00000000000..d9a15c3318b
--- /dev/null
+++ b/frontend/src/components/LLMSelection/FireworksAiOptions/index.jsx
@@ -0,0 +1,99 @@
+import System from "@/models/system";
+import { useState, useEffect } from "react";
+
+export default function FireworksAiOptions({ settings }) {
+  return (
+    <div className="flex gap-[36px] mt-1.5">
+      <div className="flex flex-col w-60">
+        <label className="text-white text-sm font-semibold block mb-3">
+          Fireworks AI API Key
+        </label>
+        <input
+          type="password"
+          name="FireworksAiApiKey"
+          className="bg-zinc-900 text-white placeholder:text-white/20 text-sm rounded-lg focus:outline-primary-button active:outline-primary-button outline-none block w-full p-2.5"
+          placeholder="Fireworks AI API Key"
+          defaultValue={settings?.FireworksAiApiKey ? "*".repeat(20) : ""}
+          required={true}
+          autoComplete="off"
+          spellCheck={false}
+        />
+      </div>
+      {!settings?.credentialsOnly && (
+        <FireworksAiModelSelection settings={settings} />
+      )}
+    </div>
+  );
+}
+function FireworksAiModelSelection({ settings }) {
+  const [groupedModels, setGroupedModels] = useState({});
+  const [loading, setLoading] = useState(true);
+
+  useEffect(() => {
+    async function findCustomModels() {
+      setLoading(true);
+      const { models } = await System.customModels("fireworksai");
+
+      if (models?.length > 0) {
+        const modelsByOrganization = models.reduce((acc, model) => {
+          acc[model.organization] = acc[model.organization] || [];
+          acc[model.organization].push(model);
+          return acc;
+        }, {});
+
+        setGroupedModels(modelsByOrganization);
+      }
+
+      setLoading(false);
+    }
+    findCustomModels();
+  }, []);
+
+  if (loading || Object.keys(groupedModels).length === 0) {
+    return (
+      <div className="flex flex-col w-60">
+        <label className="text-white text-sm font-semibold block mb-3">
+          Chat Model Selection
+        </label>
+        <select
+          name="FireworksAiModelPref"
+          disabled={true}
+          className="bg-zinc-900 border-gray-500 text-white text-sm rounded-lg block w-full p-2.5"
+        >
+          <option disabled={true} selected={true}>
+            -- loading available models --
+          </option>
+        </select>
+      </div>
+    );
+  }
+
+  return (
+    <div className="flex flex-col w-60">
+      <label className="text-white text-sm font-semibold block mb-3">
+        Chat Model Selection
+      </label>
+      <select
+        name="FireworksAiModelPref"
+        required={true}
+        className="bg-zinc-900 border-gray-500 text-white text-sm rounded-lg block w-full p-2.5"
+      >
+        {Object.keys(groupedModels)
+          .sort()
+          .map((organization) => (
+            <optgroup key={organization} label={organization}>
+              {groupedModels[organization].map((model) => (
+                <option
+                  key={model.id}
+                  value={model.id}
+                  selected={settings?.FireworksAiModelPref === model.id}
+                >
+                  {model.name}
+                </option>
+              ))}
+            </optgroup>
+          ))}
+      </select>
+    </div>
+  );
+}
diff --git a/frontend/src/hooks/useGetProvidersModels.js b/frontend/src/hooks/useGetProvidersModels.js
index ca9c42ca534..ece31c2b5c9 100644
--- a/frontend/src/hooks/useGetProvidersModels.js
+++ b/frontend/src/hooks/useGetProvidersModels.js
@@ -35,6 +35,7 @@ const PROVIDER_DEFAULT_MODELS = {
   localai: [],
   ollama: [],
   togetherai: [],
+  fireworksai: [],
   groq: [],
   native: [],
   cohere: [
@@ -50,7 +51,7 @@ const PROVIDER_DEFAULT_MODELS = {
   bedrock: [],
 };
 
-// For togetherAi, which has a large model list - we subgroup the options
+// For providers with large model lists (e.g. togetherAi) - we subgroup the options
 // by their creator organization (eg: Meta, Mistral, etc)
 // which makes selection easier to read.
 function groupModels(models) {
@@ -61,7 +62,7 @@ function groupModels(models) {
   }, {});
 }
 
-const groupedProviders = ["togetherai", "openai", "openrouter"];
+const groupedProviders = ["togetherai", "fireworksai", "openai", "openrouter"];
 export default function useGetProviderModels(provider = null) {
   const [defaultModels, setDefaultModels] = useState([]);
   const [customModels, setCustomModels] = useState([]);
diff --git a/frontend/src/media/llmprovider/fireworksai.jpeg b/frontend/src/media/llmprovider/fireworksai.jpeg
new file mode 100644
index 0000000000000000000000000000000000000000..46a25812cce2a62e05264d811f745625cd2f5d05
GIT binary patch
literal 3795
zcmcImc{tQx7yr&`nHkM6j3kU=LS)}624zns^~*L2B@|}tS+X@ms6iAJvX?b2io!(p
z>}8Ma5z1cV{p$VI^ZW08-sgGWbMN!q=X=igo_p@++_P-;Yz+fgLtO)100IF32snVP
zen1C+L803dBse$`><9!Lj^JctL$aee(P$JW3Wed~#$vc|TqqQl4~yf$^YZedcM$mb
z@ci6(Ui`Ka2n^f<M{pnz9C!>0ga5B-iv{4=fqI}G1`!3II0y^}*{T5qK_g)RY}?-7
zgk)ofKoM}*wiM(;LE%57a3mClV1ux4^#N!YD8<6C;8lzCrfiCTEBKFV>CBFYLhAAR
zzBCsZ-#|@9J{>x?Y~naT)w#a7<4EGK?fRWYb4kK{nQ}7$F>KTA{%kEHwk>jcGp`dp
z2O;xoeAH<Y)wbmgsm{eYr>Iz6ZF|$}DZPW3jQD~Xz1B~o7_)mCDFHD?gl|sHcYV9U
zVr(5h_T|oN(Ul_78o{4o&&%hXEfb@C-qub=J`y~WXrFS`O?W!L$!UnNa~D$LhlPgR
zySEjy5kanMlXe=i^E~y!X+|8H<n5FG8`{QE91B1}Oks#WK*AA75OpZ%X*R4Zj+>86
zBY=pqgGfUV&`n*0?<I@+QG5Q>3U6guLsC-RxW>(z3)o<EeU*fJq1d2Kw|fzP3e$1#
znRlnQfJ1>MGJS{i0&(|Vx_&t6nl3r`urO7!H}A8~ne(yr%$sX<pXr934V^1?fdBbD
zFED-DxSf<0-&{BEA?><q-j6q}8ZK!KJ+3Xc)V&#zEpbBq?Dybiou13KrMnGX(|ojE
z8fq&@a(#$1c+)$P<KnyYgekEDZJOqp-khz`nvS{sx%291Ii}H$n?Gc8Z9S+XxFcZY
z$0Bz&aU`-cHbE_+&ZsF|sB9zf9&P_j=y~g10@u_uH4N0tkD0ATKYEgP<W<AE{6h3a
zP=rz+-uYhD&wiM3p#I{kmgIrHg4%}zmIeM^GPltDyFbaN$G|KHFZP3svZq$pPbpFp
z2tkjx01#s_8~}ksU{JO{&e?vuIBp)Is0alsE2nLG*7g^~;Ct4DtVf{m={`>$I9f&x
zxN8_?N(X&HcHI?@yVGxK>?)nL_qLxnw^gN8vf#e#c-({ggSxYKc14b5#v=rM8V21B
zBGaC>o|{&{YhT5xEGU1lN_;U3GBDS_lR!(9Z~%aSKsnjje!Ck21;ZX7${|5>@LCkx
z^aVbVJ!bR}W(ihS-t=sBd&e)!pxc)Hc=PtVnMcO6VyBUBT@J<lK`Tk-1s(ErWm0TW
zkLn~3opfClo@@w`&kqRKX3Unj6Af~YUgH#3t#URGBZ%u=EqlKO6#Bg9evPii8eb_7
zc<T4_p+xr8w#bVW0nQHRO2%7qoWtG(>OFk$#f);c#+ED4Z@x!NB+=;%vG*8NwR%<H
zV2YU#oniQd!yzzubQddwI3zh0bx=k$-gPE4TO1{1+~=KpNF_!`=Z?Kos|)T45Lj0v
zt?Z40O7KXzcxKhP3p#DI)r%#c!VVmiLY|;1zkSyORSv-O?tCpD8{a7CH}|zLp=cmN
zVA?2lO10CgahyA!8Wb7?LU;IApg`dq>>P-H`w@f=faB!2iCVT;9??At6go2=AtEcU
zr0pJu=T#)r(yK=nbWVhXmi!$*NKNPl#oy?*U4n5%tQ@48VJ-bCpYkr_7}^n1b7@h!
z<I{Ty(jJ56YaBJRSx=vZ?@L6C(;bofuT0{<-W5_tOYXY8X>d}>I7&9kgnn=bT=EV7
zgUK@+SC$Vq-_JM7>OXOeSUYCd?6b*|vewrr=(%Jm+bm~Ruy?2INOE<nqz3&US5WF^
z)=SDetKC5ytxLly#%fLRH@-(#T81@Dc~z>B99k#laOgd7p^6AGUZujv8J2Q=uM^ED
z$Ba}t;{?kk3g!sBYRcV*?V@?mx=tbu5r|i<Wn4QJzU0Kbpx2k}9{$jMWeeDq9y|B?
zi)U`xUP>X1#!L5_D|NrJ`!1AUms1H;jDNN=6B^xrQK*!n$0lPAIeqhd?{pk%bKT;o
zg3Evtcm{5+xaGKc27L4{$5C-X_Go(I#}wC=)Ryk$q-Ed21FPAQCfoyy_N8u%K|m-Z
zxMfUjU)J;I)@&7Z%7-29v#QrEjO1qrG=>ui^G%HsDXyc(+-Q|3bk}lwD1D)<fk7|9
zD7qZqxyrC#@{d*cLF4xswf3xF2*k<7MPbP*rFRof^!FFlfZ9A)_zpBRS|mA)Ow$Bf
z{MBcwomad*gm%yVC_+4%CD@=$AAgG}U==Tud{b;jPqTkkY&Uv4c;xa;(S4m>JN9@b
zUpzpv98eI7^NjvHAho^Wbm?3LU(p5XnzYTkmkXA~8sRDlA$Y-&j+tJnWI%UEP775O
zTn+?!UjJxj+22@7HGC-;790F=LdWIMBi=5f^su{%t5M4zUcWp#U&!>I$u#*sZ8ni7
zAc{6y4AWcOZ~z~x1Qr1E&2~Zj6XyVqC`Zu(0~>3bUcK;Dwq1lw`~5H>n#7+OYATY%
zuxOoGo<a3nVleFJnd+$2&vEGtMeUaM-0=NkVP2amz4jBRht61w&x#M2Nli5Z1OZyl
zQ)zN{nAgdNO~nF<sQaVX>#1!CwfRvw&mJZk_vX*3c6pr}3Xd~*?%r(IL#<>lclNvX
zoZ!ss=*=h=NK#krh9Fn+ajHg9A(=wGHxhlS+mdI;pPj;ooa6BPDh^XT7|WFwPOHgy
z;Hh(!j}H)?G55&DLT52cIDKQHDjYemFPkIz&@8W3aBnE}_%(GinD@P(u2v3;LMswg
z@T`ctcs}1iTb9E>H_@g&4-!v89ra6=H**jv*vtq?f+Kx5?QR2&{F93IlzETun1wqr
zq*t+O-Br++`>iKOFGO_6VSQG1hsy4IQ#)zHFU|!CyfQqHZ4#yIyD5%^sOMWxMqfNU
zN8184wAtZ|VE!WfY(>grw|7%_SPPH2Z`f9;=ocOG$kUgbQdmykfUd{DA`Y4oZzf7X
zJUJKNsB4aSnp_^_86q5=7-XW6qU@TO)55`Ui6Kv^?xf5EM{HtWxd>e2uexb~whUWf
zQzipsVxBYO^P{#81w}`XZ6eIZF969t9=ShTz%28t?*Y3e0KkHk=YKxNIa&WyiuyF&
zalZ05r(I_L=-(fk*LBV;sU4XAE&9K%HGl{Xtfvq-n2vuF1i)!wiL!Dcrf1U^{*+ei
zD&NBUsylZ0g<F}yeB|4$6E2H}xkPFj+jC^JCSyqie~FCu!CjuA_>qF`!xM?Fc{ub2
z4;W7*@C3+qm;9$qg5bcSsYPMh(nCb57qGIXXG_}uR7&hd4Vh(5=hD0VKqQRARgAGA
zH&n9rXw+nm({JjwSadXhsYy<+Km&~6WtGYDY!8nHGLIR`xVcw-Q_yYAr{`6QHKH>0
z>dW6A#NVniZ*!d~DYQC21yMNPVV{(0Y5McJ$H4phagopVOp;z<$i#_vW6LV<N%-LO
z+N8E!#|A~61AvmWHLW6NVM!&#n%4LezglQyLLbd4YiQi{8znG#`0;b;hKMK!bh<wk
zlR~T1uXKtuNU`;>=kJqpi{JRGRY{Ir@5$Ig|I+ba=>)t!{8#J!cRu-beTuDC2v(L}
zy&ytnmeA7MNB*vJ5KZh)$}Plw?RrN(f5#qG-ZVrMTHnuiBDBg)AX2w0R%TG^Y%7Ty
zPyC2lxgsg!z*CbXao`R{ig5YF3xS$3TS%8Lx1!1jor9LZ`oWA*H#?%A!_Ie^JT4(s
zw%b7SKo24jDRM4b>(X9V$@#S4)bOj}T0PfC=!`sXB8{OY*-T~2V*`9Wc+Ja*17nJ(
z?gEV3(^YGXxLd4MnJ)38ZTs{Bz9CPNv$}AkWE#U-H;H-F{Dfs^oAllrRXbSv_1)c6
zTg~D`d9E7EVET&gG6QB8zWeg6FfL}s@uEfA%=cXWo%@d%P5q2YrT8fg@}nB(Sq=5f
z)B)2w1agkn-CL6)m0-hs5*qKJdKoiS^?3D$GGR*Q<gE2bg$!v9iiv-4kz<cTAtRE*
zyK7#o*SRy;uvX*V<In9^%U!%yzbjeOYb|yz<$qbTFieo2f8n}QMod;%QP%a|X>)cI
zukaE9>dhr<WA?5VuJ12r_Ec3>@pc%A&zm~SvdH_3K=-+@Ii`FW#xzwBYj}A{PMUed
zLnzHxUQdN?NE(Rq;2v{>C>I0TxeS6&(0e17Y$WRXuEM3W`%kYol1<u%ZO$kL)d=QQ
z?Y7kEd3Z0dUeog11l<Pbqhk`o5k58C&O{n5>9j?p&1!_nN=vT`WtIUG+3@zY=~_%v
zdb~lCf;H>7p##GDxO+0$9WHwA_+Fl_MiFY0yg;rosnu)oqu+Y#D-OoG>+8ewCZ8<o
zpPgmyy`wAg9V=cEkB30In0Asi{U0}_J_#*<o%horE)J@N&HQ{KBt$nEVezXAH-Fgb
F{TG+zDfR#W

literal 0
HcmV?d00001

diff --git a/frontend/src/pages/GeneralSettings/LLMPreference/index.jsx b/frontend/src/pages/GeneralSettings/LLMPreference/index.jsx
index 148409d6bf5..48258eb3557 100644
--- a/frontend/src/pages/GeneralSettings/LLMPreference/index.jsx
+++ b/frontend/src/pages/GeneralSettings/LLMPreference/index.jsx
@@ -14,6 +14,7 @@ import OllamaLogo from "@/media/llmprovider/ollama.png";
 import LMStudioLogo from "@/media/llmprovider/lmstudio.png";
 import LocalAiLogo from "@/media/llmprovider/localai.png";
 import TogetherAILogo from "@/media/llmprovider/togetherai.png";
+import FireworksAILogo from "@/media/llmprovider/fireworksai.jpeg";
 import MistralLogo from "@/media/llmprovider/mistral.jpeg";
 import HuggingFaceLogo from "@/media/llmprovider/huggingface.png";
 import PerplexityLogo from "@/media/llmprovider/perplexity.png";
@@ -36,6 +37,7 @@ import NativeLLMOptions from "@/components/LLMSelection/NativeLLMOptions";
 import GeminiLLMOptions from "@/components/LLMSelection/GeminiLLMOptions";
 import OllamaLLMOptions from "@/components/LLMSelection/OllamaLLMOptions";
 import TogetherAiOptions from "@/components/LLMSelection/TogetherAiOptions";
+import FireworksAiOptions from "@/components/LLMSelection/FireworksAiOptions";
 import MistralOptions from "@/components/LLMSelection/MistralOptions";
 import HuggingFaceOptions from "@/components/LLMSelection/HuggingFaceOptions";
 import PerplexityOptions from "@/components/LLMSelection/PerplexityOptions";
@@ -130,6 +132,15 @@ export const AVAILABLE_LLM_PROVIDERS = [
     description: "Run open source models from Together AI.",
     requiredConfig: ["TogetherAiApiKey"],
   },
+  {
+    name: "Fireworks AI",
+    value: "fireworksai",
+    logo: FireworksAILogo,
+    options: (settings) => <FireworksAiOptions settings={settings} />,
+    description:
+      "The fastest and most efficient inference engine to build production-ready, compound AI systems.",
+    requiredConfig: ["FireworksAiApiKey"],
+  },
   {
     name: "Mistral",
     value: "mistral",
diff --git a/frontend/src/pages/OnboardingFlow/Steps/DataHandling/index.jsx b/frontend/src/pages/OnboardingFlow/Steps/DataHandling/index.jsx
index 372a65236bb..b739d502a82 100644
--- a/frontend/src/pages/OnboardingFlow/Steps/DataHandling/index.jsx
+++ b/frontend/src/pages/OnboardingFlow/Steps/DataHandling/index.jsx
@@ -8,6 +8,7 @@ import AnthropicLogo from "@/media/llmprovider/anthropic.png";
 import GeminiLogo from "@/media/llmprovider/gemini.png";
 import OllamaLogo from "@/media/llmprovider/ollama.png";
 import TogetherAILogo from "@/media/llmprovider/togetherai.png";
+import FireworksAILogo from "@/media/llmprovider/fireworksai.jpeg";
 import LMStudioLogo from "@/media/llmprovider/lmstudio.png";
 import LocalAiLogo from "@/media/llmprovider/localai.png";
 import MistralLogo from "@/media/llmprovider/mistral.jpeg";
@@ -107,6 +108,14 @@ export const LLM_SELECTION_PRIVACY = {
     ],
     logo: TogetherAILogo,
   },
+  fireworksai: {
+    name: "FireworksAI",
+    description: [
+      "Your chats will not be used for training",
+      "Your prompts and document text used in response creation are visible to Fireworks AI",
+    ],
+    logo: FireworksAILogo,
+  },
   mistral: {
     name: "Mistral",
     description: [
diff --git a/frontend/src/pages/OnboardingFlow/Steps/LLMPreference/index.jsx b/frontend/src/pages/OnboardingFlow/Steps/LLMPreference/index.jsx
index aab0268961d..52996b695cc 100644
--- a/frontend/src/pages/OnboardingFlow/Steps/LLMPreference/index.jsx
+++ b/frontend/src/pages/OnboardingFlow/Steps/LLMPreference/index.jsx
@@ -9,6 +9,7 @@ import OllamaLogo from "@/media/llmprovider/ollama.png";
 import LMStudioLogo from "@/media/llmprovider/lmstudio.png";
 import LocalAiLogo from "@/media/llmprovider/localai.png";
 import TogetherAILogo from "@/media/llmprovider/togetherai.png";
+import FireworksAILogo from "@/media/llmprovider/fireworksai.jpeg";
 import AnythingLLMIcon from "@/media/logo/anything-llm-icon.png";
 import MistralLogo from "@/media/llmprovider/mistral.jpeg";
 import HuggingFaceLogo from "@/media/llmprovider/huggingface.png";
@@ -33,6 +34,7 @@ import OllamaLLMOptions from "@/components/LLMSelection/OllamaLLMOptions";
 import MistralOptions from "@/components/LLMSelection/MistralOptions";
 import HuggingFaceOptions from "@/components/LLMSelection/HuggingFaceOptions";
 import TogetherAiOptions from "@/components/LLMSelection/TogetherAiOptions";
+import FireworksAiOptions from "@/components/LLMSelection/FireworksAiOptions";
 import PerplexityOptions from "@/components/LLMSelection/PerplexityOptions";
 import OpenRouterOptions from "@/components/LLMSelection/OpenRouterOptions";
 import GroqAiOptions from "@/components/LLMSelection/GroqAiOptions";
@@ -132,6 +134,14 @@ const LLMS = [
     options: (settings) => <TogetherAiOptions settings={settings} />,
     description: "Run open source models from Together AI.",
   },
+  {
+    name: "Fireworks AI",
+    value: "fireworksai",
+    logo: FireworksAILogo,
+    options: (settings) => <FireworksAiOptions settings={settings} />,
+    description:
+      "The fastest and most efficient inference engine to build production-ready, compound AI systems.",
+  },
   {
     name: "Mistral",
     value: "mistral",
diff --git a/locales/README.ja-JP.md b/locales/README.ja-JP.md
index 952bf1f942d..e273576af05 100644
--- a/locales/README.ja-JP.md
+++ b/locales/README.ja-JP.md
@@ -82,6 +82,7 @@ AnythingLLMのいくつかのクールな機能
 - [LM Studio (すべてのモデル)](https://lmstudio.ai)
 - [LocalAi (すべてのモデル)](https://localai.io/)
 - [Together AI (チャットモデル)](https://www.together.ai/)
+- [Fireworks AI (チャットモデル)](https://fireworks.ai/)
 - [Perplexity (チャットモデル)](https://www.perplexity.ai/)
 - [OpenRouter (チャットモデル)](https://openrouter.ai/)
 - [Mistral](https://mistral.ai/)
diff --git a/locales/README.zh-CN.md b/locales/README.zh-CN.md
index fbdb4e05ab5..03e9ece135d 100644
--- a/locales/README.zh-CN.md
+++ b/locales/README.zh-CN.md
@@ -78,6 +78,7 @@ AnythingLLM的一些酷炫特性
 - [LM Studio (所有模型)](https://lmstudio.ai)
 - [LocalAi (所有模型)](https://localai.io/)
 - [Together AI (聊天模型)](https://www.together.ai/)
+- [Fireworks AI (聊天模型)](https://fireworks.ai/)
 - [Perplexity (聊天模型)](https://www.perplexity.ai/)
 - [OpenRouter (聊天模型)](https://openrouter.ai/)
 - [Mistral](https://mistral.ai/)
diff --git a/server/.env.example b/server/.env.example
index f942d6832a2..6bee599c138 100644
--- a/server/.env.example
+++ b/server/.env.example
@@ -44,6 +44,10 @@ SIG_SALT='salt' # Please generate random string at least 32 chars long.
 # TOGETHER_AI_API_KEY='my-together-ai-key'
 # TOGETHER_AI_MODEL_PREF='mistralai/Mixtral-8x7B-Instruct-v0.1'
 
+# LLM_PROVIDER='fireworksai'
+# FIREWORKS_AI_API_KEY='my-fireworks-ai-key'
+# FIREWORKS_AI_MODEL_PREF='accounts/fireworks/models/llama-v3p1-8b-instruct'
+
 # LLM_PROVIDER='perplexity'
 # PERPLEXITY_API_KEY='my-perplexity-key'
 # PERPLEXITY_MODEL_PREF='codellama-34b-instruct'
diff --git a/server/models/systemSettings.js b/server/models/systemSettings.js
index c2c03ffa099..2c8855d9ebe 100644
--- a/server/models/systemSettings.js
+++ b/server/models/systemSettings.js
@@ -441,6 +441,10 @@ const SystemSettings = {
       TogetherAiApiKey: !!process.env.TOGETHER_AI_API_KEY,
       TogetherAiModelPref: process.env.TOGETHER_AI_MODEL_PREF,
 
+      // Fireworks AI API Keys
+      FireworksAiApiKey: !!process.env.FIREWORKS_AI_API_KEY,
+      FireworksAiModelPref: process.env.FIREWORKS_AI_MODEL_PREF,
+
       // Perplexity AI Keys
       PerplexityApiKey: !!process.env.PERPLEXITY_API_KEY,
       PerplexityModelPref: process.env.PERPLEXITY_MODEL_PREF,
diff --git a/server/utils/AiProviders/fireworksAi/index.js b/server/utils/AiProviders/fireworksAi/index.js
new file mode 100644
index 00000000000..841237e99c8
--- /dev/null
+++ b/server/utils/AiProviders/fireworksAi/index.js
@@ -0,0 +1,135 @@
+const { NativeEmbedder } = require("../../EmbeddingEngines/native");
+const {
+  handleDefaultStreamResponseV2,
+} = require("../../helpers/chat/responses");
+
+function fireworksAiModels() {
+  const { MODELS } = require("./models.js");
+  return MODELS || {};
+}
+
+class FireworksAiLLM {
+  constructor(embedder = null, modelPreference = null) {
+    if (!process.env.FIREWORKS_AI_API_KEY)
+      throw new Error("No FireworksAI API key was set.");
+    const { OpenAI: OpenAIApi } = require("openai");
+    this.openai = new OpenAIApi({
+      baseURL: "https://api.fireworks.ai/inference/v1",
+      apiKey: process.env.FIREWORKS_AI_API_KEY ?? null,
+    });
+    this.model = modelPreference || process.env.FIREWORKS_AI_MODEL_PREF;
+    this.limits = {
+      history: this.promptWindowLimit() * 0.15,
+      system: this.promptWindowLimit() * 0.15,
+      user: this.promptWindowLimit() * 0.7,
+    };
+
+    this.embedder = !embedder ? new NativeEmbedder() : embedder;
+    this.defaultTemp = 0.7;
+  }
+
+  #appendContext(contextTexts = []) {
+    if (!contextTexts || !contextTexts.length) return "";
+    return (
+      "\nContext:\n" +
+      contextTexts
+        .map((text, i) => {
+          return `[CONTEXT ${i}]:\n${text}\n[END CONTEXT ${i}]\n\n`;
+        })
+        .join("")
+    );
+  }
+
+  allModelInformation() {
+    return fireworksAiModels();
+  }
+
+  streamingEnabled() {
+    return "streamGetChatCompletion" in this;
+  }
+
+  static promptWindowLimit(modelName) {
+    const availableModels = fireworksAiModels();
+    return availableModels[modelName]?.maxLength || 4096;
+  }
+
+  // Ensure the user set a value for the token limit
+  // and if undefined - assume 4096 window.
+  promptWindowLimit() {
+    const availableModels = this.allModelInformation();
+    return availableModels[this.model]?.maxLength || 4096;
+  }
+
+  async isValidChatCompletionModel(model = "") {
+    const availableModels = this.allModelInformation();
+    return availableModels.hasOwnProperty(model);
+  }
+
+  constructPrompt({
+    systemPrompt = "",
+    contextTexts = [],
+    chatHistory = [],
+    userPrompt = "",
+  }) {
+    const prompt = {
+      role: "system",
+      content: `${systemPrompt}${this.#appendContext(contextTexts)}`,
+    };
+    return [prompt, ...chatHistory, { role: "user", content: userPrompt }];
+  }
+
+  async getChatCompletion(messages = null, { temperature = 0.7 }) {
+    if (!(await this.isValidChatCompletionModel(this.model)))
+      throw new Error(
+        `FireworksAI chat: ${this.model} is not valid for chat completion!`
+      );
+
+    const result = await this.openai.chat.completions.create({
+      model: this.model,
+      messages,
+      temperature,
+    });
+
+    if (!result.hasOwnProperty("choices") || result.choices.length === 0)
+      return null;
+    return result.choices[0].message.content;
+  }
+
+  async streamGetChatCompletion(messages = null, { temperature = 0.7 }) {
+    if (!(await this.isValidChatCompletionModel(this.model)))
+      throw new Error(
+        `FireworksAI chat: ${this.model} is not valid for chat completion!`
+      );
+
+    const streamRequest = await this.openai.chat.completions.create({
+      model: this.model,
+      stream: true,
+      messages,
+      temperature,
+    });
+    return streamRequest;
+  }
+
+  handleStream(response, stream, responseProps) {
+    return handleDefaultStreamResponseV2(response, stream, responseProps);
+  }
+
+  // Simple wrapper for dynamic embedder & normalize interface for all LLM implementations
+  async embedTextInput(textInput) {
+    return await this.embedder.embedTextInput(textInput);
+  }
+  async embedChunks(textChunks = []) {
+    return await this.embedder.embedChunks(textChunks);
+  }
+
+  async compressMessages(promptArgs = {}, rawHistory = []) {
+    const { messageArrayCompressor } = require("../../helpers/chat");
+    const messageArray = this.constructPrompt(promptArgs);
+    return await messageArrayCompressor(this, messageArray, rawHistory);
+  }
+}
+
+module.exports = {
+  FireworksAiLLM,
+  fireworksAiModels,
+};
diff --git a/server/utils/AiProviders/fireworksAi/models.js b/server/utils/AiProviders/fireworksAi/models.js
new file mode 100644
index 00000000000..c28f98af495
--- /dev/null
+++ b/server/utils/AiProviders/fireworksAi/models.js
@@ -0,0 +1,112 @@
+const MODELS = {
+  "accounts/fireworks/models/llama-v3p1-405b-instruct": {
+    id: "accounts/fireworks/models/llama-v3p1-405b-instruct",
+    organization: "Meta",
+    name: "Llama 3.1 405B Instruct",
+    maxLength: 131072,
+  },
+  "accounts/fireworks/models/llama-v3p1-70b-instruct": {
+    id: "accounts/fireworks/models/llama-v3p1-70b-instruct",
+    organization: "Meta",
+    name: "Llama 3.1 70B Instruct",
+    maxLength: 131072,
+  },
+  "accounts/fireworks/models/llama-v3p1-8b-instruct": {
+    id: "accounts/fireworks/models/llama-v3p1-8b-instruct",
+    organization: "Meta",
+    name: "Llama 3.1 8B Instruct",
+    maxLength: 131072,
+  },
+  "accounts/fireworks/models/llama-v3-70b-instruct": {
+    id: "accounts/fireworks/models/llama-v3-70b-instruct",
+    organization: "Meta",
+    name: "Llama 3 70B Instruct",
+    maxLength: 8192,
+  },
+  "accounts/fireworks/models/mixtral-8x22b-instruct": {
+    id: "accounts/fireworks/models/mixtral-8x22b-instruct",
+    organization: "mistralai",
+    name: "Mixtral MoE 8x22B Instruct",
+    maxLength: 65536,
+  },
+  "accounts/fireworks/models/mixtral-8x7b-instruct": {
+    id: "accounts/fireworks/models/mixtral-8x7b-instruct",
+    organization: "mistralai",
+    name: "Mixtral MoE 8x7B Instruct",
+    maxLength: 32768,
+  },
+  "accounts/fireworks/models/firefunction-v2": {
+    id: "accounts/fireworks/models/firefunction-v2",
+    organization: "Fireworks AI",
+    name: "Firefunction V2",
+    maxLength: 8192,
+  },
+  "accounts/fireworks/models/firefunction-v1": {
+    id: "accounts/fireworks/models/firefunction-v1",
+    organization: "Fireworks AI",
+    name: "FireFunction V1",
+    maxLength: 32768,
+  },
+  "accounts/fireworks/models/gemma2-9b-it": {
+    id: "accounts/fireworks/models/gemma2-9b-it",
+    organization: "Google",
+    name: "Gemma 2 9B Instruct",
+    maxLength: 8192,
+  },
+  "accounts/fireworks/models/llama-v3-70b-instruct-hf": {
+    id: "accounts/fireworks/models/llama-v3-70b-instruct-hf",
+    organization: "Hugging Face",
+    name: "Llama 3 70B Instruct (HF version)",
+    maxLength: 8192,
+  },
+  "accounts/fireworks/models/llama-v3-8b-instruct": {
+    id: "accounts/fireworks/models/llama-v3-8b-instruct",
+    organization: "Hugging Face",
+    name: "Llama 3 8B Instruct",
+    maxLength: 8192,
+  },
+  "accounts/fireworks/models/llama-v3-8b-instruct-hf": {
+    id: "accounts/fireworks/models/llama-v3-8b-instruct-hf",
+    organization: "Hugging Face",
+    name: "Llama 3 8B Instruct (HF version)",
+    maxLength: 8192,
+  },
+  "accounts/fireworks/models/mixtral-8x7b-instruct-hf": {
+    id: "accounts/fireworks/models/mixtral-8x7b-instruct-hf",
+    organization: "Hugging Face",
+    name: "Mixtral MoE 8x7B Instruct (HF version)",
+    maxLength: 32768,
+  },
+  "accounts/fireworks/models/mythomax-l2-13b": {
+    id: "accounts/fireworks/models/mythomax-l2-13b",
+    organization: "Gryphe",
+    name: "MythoMax L2 13b",
+    maxLength: 4096,
+  },
+  "accounts/fireworks/models/phi-3-vision-128k-instruct": {
+    id: "accounts/fireworks/models/phi-3-vision-128k-instruct",
+    organization: "Microsoft",
+    name: "Phi 3.5 Vision Instruct",
+    maxLength: 8192,
+  },
+  "accounts/fireworks/models/starcoder-16b": {
+    id: "accounts/fireworks/models/starcoder-16b",
+    organization: "BigCode",
+    name: "StarCoder 15.5B",
+    maxLength: 8192,
+  },
+  "accounts/fireworks/models/starcoder-7b": {
+    id: "accounts/fireworks/models/starcoder-7b",
+    organization: "BigCode",
+    name: "StarCoder 7B",
+    maxLength: 8192,
+  },
+  "accounts/fireworks/models/yi-01-ai/yi-large": {
+    id: "accounts/fireworks/models/yi-01-ai/yi-large",
+    organization: "01.AI",
+    name: "Yi-Large",
+    maxLength: 32768,
+  },
+};
+
+module.exports.MODELS = MODELS;
diff --git a/server/utils/AiProviders/fireworksAi/scripts/.gitignore b/server/utils/AiProviders/fireworksAi/scripts/.gitignore
new file mode 100644
index 00000000000..94a2dd146a2
--- /dev/null
+++ b/server/utils/AiProviders/fireworksAi/scripts/.gitignore
@@ -0,0 +1 @@
+*.json
\ No newline at end of file
diff --git a/server/utils/AiProviders/fireworksAi/scripts/chat_models.txt b/server/utils/AiProviders/fireworksAi/scripts/chat_models.txt
new file mode 100644
index 00000000000..a1afec9d60d
--- /dev/null
+++ b/server/utils/AiProviders/fireworksAi/scripts/chat_models.txt
@@ -0,0 +1,20 @@
+| Organization | Model Name | Model String for API | Context length |
+|--------------|------------|----------------------|----------------|
+| Meta | Llama 3.1 405B Instruct | accounts/fireworks/models/llama-v3p1-405b-instruct | 131072 |
+| Meta | Llama 3.1 70B Instruct | accounts/fireworks/models/llama-v3p1-70b-instruct | 131072 |
+| Meta | Llama 3.1 8B Instruct | accounts/fireworks/models/llama-v3p1-8b-instruct | 131072 |
+| Meta | Llama 3 70B Instruct | accounts/fireworks/models/llama-v3-70b-instruct | 8192 |
+| mistralai | Mixtral MoE 8x22B Instruct | accounts/fireworks/models/mixtral-8x22b-instruct | 65536 |
+| mistralai | Mixtral MoE 8x7B Instruct | accounts/fireworks/models/mixtral-8x7b-instruct | 32768 |
+| Fireworks AI | Firefunction V2 | accounts/fireworks/models/firefunction-v2 | 8192 |
+| Fireworks AI | FireFunction V1 | accounts/fireworks/models/firefunction-v1 | 32768 |
+| Google | Gemma 2 9B Instruct | accounts/fireworks/models/gemma2-9b-it | 8192 |
+| Hugging Face | Llama 3 70B Instruct (HF version) | accounts/fireworks/models/llama-v3-70b-instruct-hf | 8192 |
+| Hugging Face | Llama 3 8B Instruct | accounts/fireworks/models/llama-v3-8b-instruct | 8192 |
+| Hugging Face | Llama 3 8B Instruct (HF version) | accounts/fireworks/models/llama-v3-8b-instruct-hf | 8192 |
+| Hugging Face | Mixtral MoE 8x7B Instruct (HF version) | accounts/fireworks/models/mixtral-8x7b-instruct-hf | 32768 |
+| Gryphe | MythoMax L2 13b | accounts/fireworks/models/mythomax-l2-13b | 4096 |
+| Microsoft | Phi 3.5 Vision Instruct | accounts/fireworks/models/phi-3-vision-128k-instruct | 8192 |
+| BigCode | StarCoder 15.5B | accounts/fireworks/models/starcoder-16b | 8192 |
+| BigCode | StarCoder 7B | accounts/fireworks/models/starcoder-7b | 8192 |
+| 01.AI | Yi-Large | accounts/fireworks/models/yi-01-ai/yi-large | 32768 |
\ No newline at end of file
diff --git a/server/utils/AiProviders/fireworksAi/scripts/parse.mjs b/server/utils/AiProviders/fireworksAi/scripts/parse.mjs
new file mode 100644
index 00000000000..33581d1591d
--- /dev/null
+++ b/server/utils/AiProviders/fireworksAi/scripts/parse.mjs
@@ -0,0 +1,46 @@
+// Fireworks AI does not provide a simple REST API to get models,
+// so we have a table which we copy from their documentation
+// at https://fireworks.ai/models that we can
+// then parse and get all models from in a format that makes sense
+// Why this does not exist is so bizarre, but whatever.
+
+// To run, cd into this directory and run `node parse.mjs`
+// copy outputs into the export in ../models.js
+
+// Update the date below if you run this again because Fireworks AI added new models.
+
+// Last Collected: Sep 15, 2024
+// NOTE: Only managed to collect 18 out of ~100 models!
+// https://fireworks.ai/models lists almost 100 chat language models.
+// If you want to add models, please manually add them to chat_models.txt...
+// ... I tried to write a script to grab them all but gave up after a few hours...
+
+import fs from "fs";
+
+function parseChatModels() {
+  const fixed = {};
+  const tableString = fs.readFileSync("chat_models.txt", { encoding: "utf-8" });
+  const rows = tableString.split("\n").slice(2);
+
+  rows.forEach((row) => {
+    const [provider, name, id, maxLength] = row.split("|").slice(1, -1);
+    const data = {
+      provider: provider.trim(),
+      name: name.trim(),
+      id: id.trim(),
+      maxLength: Number(maxLength.trim()),
+    };
+
+    fixed[data.id] = {
+      id: data.id,
+      organization: data.provider,
+      name: data.name,
+      maxLength: data.maxLength,
+    };
+  });
+
+  fs.writeFileSync("chat_models.json", JSON.stringify(fixed, null, 2), "utf-8");
+  return fixed;
+}
+
+parseChatModels();
diff --git a/server/utils/helpers/customModels.js b/server/utils/helpers/customModels.js
index 27afa150f5a..a25896ef4fc 100644
--- a/server/utils/helpers/customModels.js
+++ b/server/utils/helpers/customModels.js
@@ -1,6 +1,7 @@
 const { fetchOpenRouterModels } = require("../AiProviders/openRouter");
 const { perplexityModels } = require("../AiProviders/perplexity");
 const { togetherAiModels } = require("../AiProviders/togetherAi");
+const { fireworksAiModels } = require("../AiProviders/fireworksAi");
 const { ElevenLabsTTS } = require("../TextToSpeech/elevenLabs");
 const SUPPORT_CUSTOM_MODELS = [
   "openai",
@@ -8,6 +9,7 @@ const SUPPORT_CUSTOM_MODELS = [
   "ollama",
   "native-llm",
   "togetherai",
+  "fireworksai",
   "mistral",
   "perplexity",
   "openrouter",
@@ -31,6 +33,8 @@ async function getCustomModels(provider = "", apiKey = null, basePath = null) {
       return await ollamaAIModels(basePath);
     case "togetherai":
       return await getTogetherAiModels();
+    case "fireworksai":
+      return await getFireworksAiModels(apiKey);
     case "mistral":
       return await getMistralModels(apiKey);
     case "native-llm":
@@ -304,6 +308,21 @@ async function getTogetherAiModels() {
   return { models, error: null };
 }
 
+async function getFireworksAiModels() {
+  const knownModels = fireworksAiModels();
+  if (!Object.keys(knownModels).length === 0)
+    return { models: [], error: null };
+
+  const models = Object.values(knownModels).map((model) => {
+    return {
+      id: model.id,
+      organization: model.organization,
+      name: model.name,
+    };
+  });
+  return { models, error: null };
+}
+
 async function getPerplexityModels() {
   const knownModels = perplexityModels();
   if (!Object.keys(knownModels).length === 0)
diff --git a/server/utils/helpers/index.js b/server/utils/helpers/index.js
index 6ec0b2a3189..84e9ed84905 100644
--- a/server/utils/helpers/index.js
+++ b/server/utils/helpers/index.js
@@ -120,6 +120,9 @@ function getLLMProvider({ provider = null, model = null } = {}) {
     case "togetherai":
       const { TogetherAiLLM } = require("../AiProviders/togetherAi");
       return new TogetherAiLLM(embedder, model);
+    case "fireworksai":
+      const { FireworksAiLLM } = require("../AiProviders/fireworksAi");
+      return new FireworksAiLLM(embedder, model);
     case "perplexity":
       const { PerplexityLLM } = require("../AiProviders/perplexity");
       return new PerplexityLLM(embedder, model);
@@ -240,6 +243,9 @@ function getLLMProviderClass({ provider = null } = {}) {
     case "togetherai":
       const { TogetherAiLLM } = require("../AiProviders/togetherAi");
       return TogetherAiLLM;
+    case "fireworksai":
+      const { FireworksAiLLM } = require("../AiProviders/fireworksAi");
+      return new FireworksAiLLM(embedder, model);
     case "perplexity":
       const { PerplexityLLM } = require("../AiProviders/perplexity");
       return PerplexityLLM;
diff --git a/server/utils/helpers/updateENV.js b/server/utils/helpers/updateENV.js
index bd29a746fd2..717c05581c2 100644
--- a/server/utils/helpers/updateENV.js
+++ b/server/utils/helpers/updateENV.js
@@ -350,6 +350,16 @@ const KEY_MAPPING = {
     checks: [isNotEmpty],
   },
 
+  // Fireworks AI Options
+  FireworksAiApiKey: {
+    envKey: "FIREWORKS_AI_API_KEY",
+    checks: [isNotEmpty],
+  },
+  FireworksAiModelPref: {
+    envKey: "FIREWORKS_AI_MODEL_PREF",
+    checks: [isNotEmpty],
+  },
+
   // Perplexity Options
   PerplexityApiKey: {
     envKey: "PERPLEXITY_API_KEY",
@@ -580,6 +590,7 @@ function supportedLLM(input = "") {
     "ollama",
     "native",
     "togetherai",
+    "fireworksai",
     "mistral",
     "huggingface",
     "perplexity",