-

1150 -

128 -

6821 -

432
9127 plików
40,89 GB
Foldery
Ostatnio pobierane pliki
1. mddn_training.py: Kompletny potok treningowy - wprowadzono pełny pipeline do ładowania i przetwarzania bazy WikiText-2 przy użyciu bibliotek Hugging Face.
2. mddn_net.py: Implementacja pełnej architektury sieci MDDN (MDDNNetwork).
3. multidimensionaldynamicnode.py: Implementacja podstawowego bloku MDDN.
Model trenuje na zadaniu Causal Language Modeling (CLM), czyli przewidywaniu następnego tokena, używając zbioru danych WikiText-2 (angielskie teksty). To jest model wielkości małej/średniej wersji GPT-3, więc potrzeba godzin, a nawet dni, aby zobaczyć znaczące postępy.
- sortuj według:
-

0 -

0 -

0 -

0
4 plików
65 KB
Zaprzyjaźnione i polecane chomiki (170)





















