Историја ревизија

Аутор SHA1 Порука Датум
  oobabooga 3a47a602a3 Detect ggml*.bin files automatically пре 2 година
  oobabooga 4c27562157 Minor changes пре 2 година
  Thomas Antony 79fa2b6d7e Add support for alpaca пре 2 година
  Thomas Antony 7745faa7bb Add llamacpp to models.py пре 2 година
  oobabooga 1cb9246160 Adapt to the new model names пре 2 година
  oobabooga 53da672315 Fix FlexGen пре 2 година
  oobabooga ee95e55df6 Fix RWKV tokenizer пре 2 година
  oobabooga fde92048af Merge branch 'main' into catalpaaa-lora-and-model-dir пре 2 година
  oobabooga 49c10c5570 Add support for the latest GPTQ models with group-size (#530) пре 2 година
  catalpaaa b37c54edcf lora-dir, model-dir and login auth пре 2 година
  oobabooga a6bf54739c Revert models.py (accident) пре 2 година
  oobabooga a80aa65986 Update models.py пре 2 година
  oobabooga ddb62470e9 --no-cache and --gpu-memory in MiB for fine VRAM control пре 2 година
  oobabooga e26763a510 Minor changes пре 2 година
  Wojtek Kowaluk 7994b580d5 clean up duplicated code пре 2 година
  Wojtek Kowaluk 30939e2aee add mps support on apple silicon пре 2 година
  oobabooga ee164d1821 Don't split the layers in 8-bit mode by default пре 2 година
  oobabooga e085cb4333 Small changes пре 2 година
  awoo 83cb20aad8 Add support for --gpu-memory witn --load-in-8bit пре 2 година
  oobabooga 1c378965e1 Remove unused imports пре 2 година
  oobabooga 66256ac1dd Make the "no GPU has been detected" message more descriptive пре 2 година
  oobabooga 265ba384b7 Rename a file, add deprecation warning for --load-in-4bit пре 2 година
  Ayanami Rei 8778b756e6 use updated load_quantized пре 2 година
  Ayanami Rei e1c952c41c make argument non case-sensitive пре 2 година
  Ayanami Rei 3c9afd5ca3 rename method пре 2 година
  Ayanami Rei edbc61139f use new quant loader пре 2 година
  oobabooga 65dda28c9d Rename --llama-bits to --gptq-bits пре 2 година
  oobabooga fed3617f07 Move LLaMA 4-bit into a separate file пре 2 година
  draff 001e638b47 Make it actually work пре 2 година
  draff 804486214b Re-implement --load-in-4bit and update --llama-bits arg description пре 2 година