rohvani
|
826e297b0e
add llama-65b-4bit support & multiple pt paths
|
2 년 전 |
oobabooga
|
9849aac0f1
Don't show .pt models in the list
|
2 년 전 |
oobabooga
|
74102d5ee4
Insert to the path instead of appending
|
2 년 전 |
oobabooga
|
2965aa1625
Check if the .pt file exists
|
2 년 전 |
oobabooga
|
828a524f9a
Add LLaMA 4-bit support
|
2 년 전 |
oobabooga
|
e91f4bc25a
Add RWKV tokenizer
|
2 년 전 |
oobabooga
|
c33715ad5b
Move towards HF LLaMA implementation
|
2 년 전 |
oobabooga
|
bd8aac8fa4
Add LLaMA 8-bit support
|
2 년 전 |
oobabooga
|
ed8b35efd2
Add --pin-weight parameter for FlexGen
|
2 년 전 |
oobabooga
|
ea5c5eb3da
Add LLaMA support
|
2 년 전 |
oobabooga
|
659bb76722
Add RWKVModel class
|
2 년 전 |
oobabooga
|
6837d4d72a
Load the model by name
|
2 년 전 |
oobabooga
|
70e522732c
Move RWKV loader into a separate file
|
2 년 전 |
oobabooga
|
ebc64a408c
RWKV support prototype
|
2 년 전 |
oobabooga
|
8e3e8a070f
Make FlexGen work with the newest API
|
2 년 전 |
oobabooga
|
65326b545a
Move all gradio elements to shared (so that extensions can use them)
|
2 년 전 |
oobabooga
|
f6f792363b
Separate command-line params by spaces instead of commas
|
2 년 전 |
luis
|
5abdc99a7c
gpu-memory arg change
|
2 년 전 |
oobabooga
|
7224343a70
Improve the imports
|
2 년 전 |
oobabooga
|
e46c43afa6
Move some stuff from server.py to modules
|
2 년 전 |
oobabooga
|
1dacd34165
Further refactor
|
2 년 전 |