zhengjl/text-generation-webui

Аутор	SHA1 Порука	Датум
oobabooga	3a47a602a3 Detect ggml*.bin files automatically	пре 2 година
oobabooga	4c27562157 Minor changes	пре 2 година
Thomas Antony	79fa2b6d7e Add support for alpaca	пре 2 година
Thomas Antony	7745faa7bb Add llamacpp to models.py	пре 2 година
oobabooga	1cb9246160 Adapt to the new model names	пре 2 година
oobabooga	53da672315 Fix FlexGen	пре 2 година
oobabooga	ee95e55df6 Fix RWKV tokenizer	пре 2 година
oobabooga	fde92048af Merge branch 'main' into catalpaaa-lora-and-model-dir	пре 2 година
oobabooga	49c10c5570 Add support for the latest GPTQ models with group-size (#530)	пре 2 година
catalpaaa	b37c54edcf lora-dir, model-dir and login auth	пре 2 година
oobabooga	a6bf54739c Revert models.py (accident)	пре 2 година
oobabooga	a80aa65986 Update models.py	пре 2 година
oobabooga	ddb62470e9 --no-cache and --gpu-memory in MiB for fine VRAM control	пре 2 година
oobabooga	e26763a510 Minor changes	пре 2 година
Wojtek Kowaluk	7994b580d5 clean up duplicated code	пре 2 година
Wojtek Kowaluk	30939e2aee add mps support on apple silicon	пре 2 година
oobabooga	ee164d1821 Don't split the layers in 8-bit mode by default	пре 2 година
oobabooga	e085cb4333 Small changes	пре 2 година
awoo	83cb20aad8 Add support for --gpu-memory witn --load-in-8bit	пре 2 година
oobabooga	1c378965e1 Remove unused imports	пре 2 година
oobabooga	66256ac1dd Make the "no GPU has been detected" message more descriptive	пре 2 година
oobabooga	265ba384b7 Rename a file, add deprecation warning for --load-in-4bit	пре 2 година
Ayanami Rei	8778b756e6 use updated load_quantized	пре 2 година
Ayanami Rei	e1c952c41c make argument non case-sensitive	пре 2 година
Ayanami Rei	3c9afd5ca3 rename method	пре 2 година
Ayanami Rei	edbc61139f use new quant loader	пре 2 година
oobabooga	65dda28c9d Rename --llama-bits to --gptq-bits	пре 2 година
oobabooga	fed3617f07 Move LLaMA 4-bit into a separate file	пре 2 година
draff	001e638b47 Make it actually work	пре 2 година
draff	804486214b Re-implement --load-in-4bit and update --llama-bits arg description	пре 2 година

Новије Старије

Историја ревизија Пронађи

Историја ревизија