oobabooga
|
8e89bc596b
Fix encode() for RWKV
|
пре 2 година |
oobabooga
|
19a34941ed
Add proper streaming to RWKV
|
пре 2 година |
oobabooga
|
8660227e1b
Add top_k to RWKV
|
пре 2 година |
oobabooga
|
20bd645f6a
Fix bug in multigpu setups (attempt 3)
|
пре 2 година |
oobabooga
|
09a7c36e1b
Minor improvement while running custom models
|
пре 2 година |
oobabooga
|
24c4c20391
Fix bug in multigpu setups (attempt #2)
|
пре 2 година |
oobabooga
|
d88b7836c6
Fix bug in multigpu setups
|
пре 2 година |
oobabooga
|
e91f4bc25a
Add RWKV tokenizer
|
пре 2 година |
oobabooga
|
a54b91af77
Improve readability
|
пре 2 година |
oobabooga
|
8e706df20e
Fix a memory leak when text streaming is on
|
пре 2 година |
oobabooga
|
c33715ad5b
Move towards HF LLaMA implementation
|
пре 2 година |
oobabooga
|
c93f1fa99b
Count the tokens more conservatively
|
пре 2 година |
oobabooga
|
05e703b4a4
Print the performance information more reliably
|
пре 2 година |
oobabooga
|
a345a2acd2
Add a tokenizer placeholder
|
пре 2 година |
oobabooga
|
5b354817f6
Make chat minimally work with LLaMA
|
пре 2 година |
oobabooga
|
ea5c5eb3da
Add LLaMA support
|
пре 2 година |
oobabooga
|
7bbe32f618
Don't return a value in an iterator function
|
пре 2 година |
oobabooga
|
ff9f649c0c
Remove some unused imports
|
пре 2 година |
oobabooga
|
955cf431e8
Minor consistency fix
|
пре 2 година |
oobabooga
|
831ac7ed3f
Add top_p
|
пре 2 година |
oobabooga
|
7c4d5ca8cc
Improve the text generation call a bit
|
пре 2 година |
oobabooga
|
0f6708c471
Sort the imports
|
пре 2 година |
oobabooga
|
e735806c51
Add a generate() function for RWKV
|
пре 2 година |
oobabooga
|
f871971de1
Trying to get the chat to work
|
пре 2 година |
oobabooga
|
ebd698905c
Add streaming to RWKV
|
пре 2 година |
oobabooga
|
70e522732c
Move RWKV loader into a separate file
|
пре 2 година |
oobabooga
|
ebc64a408c
RWKV support prototype
|
пре 2 година |
oobabooga
|
6e843a11d6
Fix FlexGen in chat mode
|
пре 2 година |
oobabooga
|
fa58fd5559
Proper way to free the cuda cache
|
пре 2 година |
oobabooga
|
700311ce40
Empty the cuda cache at model.generate()
|
пре 2 година |