Commit History

Автор SHA1 Съобщение Дата
  oobabooga 8e89bc596b Fix encode() for RWKV преди 2 години
  oobabooga 19a34941ed Add proper streaming to RWKV преди 2 години
  oobabooga 8660227e1b Add top_k to RWKV преди 2 години
  oobabooga 20bd645f6a Fix bug in multigpu setups (attempt 3) преди 2 години
  oobabooga 09a7c36e1b Minor improvement while running custom models преди 2 години
  oobabooga 24c4c20391 Fix bug in multigpu setups (attempt #2) преди 2 години
  oobabooga d88b7836c6 Fix bug in multigpu setups преди 2 години
  oobabooga e91f4bc25a Add RWKV tokenizer преди 2 години
  oobabooga a54b91af77 Improve readability преди 2 години
  oobabooga 8e706df20e Fix a memory leak when text streaming is on преди 2 години
  oobabooga c33715ad5b Move towards HF LLaMA implementation преди 2 години
  oobabooga c93f1fa99b Count the tokens more conservatively преди 2 години
  oobabooga 05e703b4a4 Print the performance information more reliably преди 2 години
  oobabooga a345a2acd2 Add a tokenizer placeholder преди 2 години
  oobabooga 5b354817f6 Make chat minimally work with LLaMA преди 2 години
  oobabooga ea5c5eb3da Add LLaMA support преди 2 години
  oobabooga 7bbe32f618 Don't return a value in an iterator function преди 2 години
  oobabooga ff9f649c0c Remove some unused imports преди 2 години
  oobabooga 955cf431e8 Minor consistency fix преди 2 години
  oobabooga 831ac7ed3f Add top_p преди 2 години
  oobabooga 7c4d5ca8cc Improve the text generation call a bit преди 2 години
  oobabooga 0f6708c471 Sort the imports преди 2 години
  oobabooga e735806c51 Add a generate() function for RWKV преди 2 години
  oobabooga f871971de1 Trying to get the chat to work преди 2 години
  oobabooga ebd698905c Add streaming to RWKV преди 2 години
  oobabooga 70e522732c Move RWKV loader into a separate file преди 2 години
  oobabooga ebc64a408c RWKV support prototype преди 2 години
  oobabooga 6e843a11d6 Fix FlexGen in chat mode преди 2 години
  oobabooga fa58fd5559 Proper way to free the cuda cache преди 2 години
  oobabooga 700311ce40 Empty the cuda cache at model.generate() преди 2 години