Tags · iZNDGroup/LocalAI

v2.12.4

fix(autogptq): do not use_triton with qwen-vl (mudler#1985)

* Enhance autogptq backend to support VL models

* update dependencies for autogptq

* remove redundant auto-gptq dependency

* Convert base64 to image_url for Qwen-VL model

* implemented model inference for qwen-vl

* remove user prompt from generated answer

* fixed write image error

* fixed use_triton issue when loading Qwen-VL model

---------

Co-authored-by: Binghua Wu <bingwu@estee.com>

Apr 11, 2024
0004ec8
zip
tar.gz

v2.12.3

ci: push latest images for dockerhub (mudler#1984)

Fixes: mudler#1983

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>

Apr 10, 2024
d692b2c
zip
tar.gz

v2.12.1

ci: fixup latest image push

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>

Apr 9, 2024
cc3d601
zip
tar.gz

v2.12.0

tests(petals): temp disable

Apr 8, 2024
2bbb221
zip
tar.gz

v2.11.0

⬆️ Update ggerganov/llama.cpp (mudler#1897)

Signed-off-by: GitHub <noreply@github.com>
Co-authored-by: mudler <mudler@users.noreply.github.com>

Mar 25, 2024
1395e50
zip
tar.gz

v2.10.1

test/fix: OSX Test Repair (mudler#1843)

* test with gguf instead of ggml. Updates testPrompt to match? Adds debugging line to Dockerfile that I've found helpful recently.

* fix testPrompt slightly

* Sad Experiment: Test GH runner without metal?

* break apart CGO_LDFLAGS

* switch runner

* upstream llama.cpp disables Metal on Github CI!

* missed a dir from clean-tests

* CGO_LDFLAGS

* tmate failure + NO_ACCELERATE

* whisper.cpp has a metal fix

* do the exact opposite of the name of this branch, but keep it around for unrelated fixes?

* add back newlines

* add tmate to linux for testing

* update fixtures

* timeout for tmate

Mar 18, 2024
ed5734a
zip
tar.gz

v2.10.0

⬆️ Update ggerganov/llama.cpp (mudler#1840)

Signed-off-by: GitHub <noreply@github.com>
Co-authored-by: mudler <mudler@users.noreply.github.com>

Mar 16, 2024
8967ed1
zip
tar.gz

v2.9.0

⬆️ Update ggerganov/llama.cpp (mudler#1750)

Signed-off-by: GitHub <noreply@github.com>
Co-authored-by: mudler <mudler@users.noreply.github.com>

Feb 23, 2024
ff88c39
zip
tar.gz

v2.8.2

fix(tts): fix regression when supplying backend from requests (mudler…

…#1713)

fixes mudler#1707

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>

Feb 15, 2024
e690bf3
zip
tar.gz

v2.8.1

fix(python): pin exllama2 (mudler#1711)

fix(python): pin python deps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

Feb 14, 2024
5e155fb
zip
tar.gz

PreviousNext

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

v2.12.4

v2.12.3

v2.12.1

v2.12.0

v2.11.0

v2.10.1

v2.10.0

v2.9.0

v2.8.2

v2.8.1

Tags: iZNDGroup/LocalAI