oobabooga bd8aac8fa4 Add LLaMA 8-bit support hace 2 años
..
LLaMA.py 5a79863df3 Increase the sequence length, decrease batch size hace 2 años
LLaMA_8bit.py bd8aac8fa4 Add LLaMA 8-bit support hace 2 años
RWKV.py ff9f649c0c Remove some unused imports hace 2 años
chat.py 1a05860ca3 Ensure proper no-streaming with generation_attempts > 1 hace 2 años
deepspeed_parameters.py f38c9bf428 Fix deepspeed (oops) hace 3 años
extensions.py 91f5852245 Move bot_picture.py inside the extension hace 2 años
html_generator.py 43b6ab8673 Store thumbnails as files instead of base64 strings hace 2 años
models.py bd8aac8fa4 Add LLaMA 8-bit support hace 2 años
shared.py ed8b35efd2 Add --pin-weight parameter for FlexGen hace 2 años
stopping_criteria.py 7224343a70 Improve the imports hace 2 años
text_generation.py c93f1fa99b Count the tokens more conservatively hace 2 años
ui.py 2bff646130 Stop chat from flashing dark when processing hace 2 años