Biblioteki napisane w Cuda

instant-ngp

Natychmiastowe prymitywy grafiki neuronowej: błyskawiczne NeRF i więcej.
  • 13.4k
  • GNU General Public License v3.0

deep-high-resolution-net.pytorch

Projekt jest oficjalną realizacją naszego artykułu CVPR2019 „Deep High-Resolution Representation Learning for Human Pose Estimation”.
  • 4.1k
  • MIT

cub

Prymitywy kooperacyjne dla CUDA C++. (przez NVIDIĘ).
  • 1.5k
  • BSD 3-clause "New" or "Revised"

cugraph

cuGraph — biblioteka analizy wykresów RAPIDS.
  • 1.3k
  • Apache License 2.0

blocksparse

Wydajne jądra procesorów graficznych do mnożenia i splotu macierzy z rzadkimi blokami.
  • 948
  • MIT

k2

Algorytmy FSA/FST, różniczkowalne, z kompatybilnością z PyTorch.
  • 927
  • Apache License 2.0

nv-wavenet

Referencyjna implementacja autoregresyjnego wnioskowania o sieci falkowej w czasie rzeczywistym.
  • 700
  • BSD 3-clause "New" or "Revised"

nvParse

Szybki parser CSV oparty na procesorze graficznym.
  • 550
  • Apache License 2.0

instant-ngp-Windows

Natychmiastowe prymitywy grafiki neuronowej: błyskawiczne NeRF i więcej.
  • 458
  • GNU General Public License v3.0

nccl-tests

Testy NCCL.
  • 436
  • BSD 3-clause "New" or "Revised"

MegBA

MegBA: rozproszona biblioteka oparta na GPU do dostosowywania pakietu na dużą skalę.
  • 368
  • Apache License 2.0

raft

RAFT zawiera podstawowe, szeroko stosowane algorytmy i prymitywy do nauki o danych, grafów i uczenia maszynowego. (przez Rapidsai).
  • 278
  • Apache License 2.0

dietgpu

Implementacja GPU szybkiego uogólnionego kodera i dekodera entropijnego ANS (asymetryczny system liczbowy), z rozszerzeniami do bezstratnej kompresji numerycznych i innych typów danych w aplikacjach HPC/ML.
  • 247
  • MIT

TorchPQ

Przybliżone wyszukiwanie najbliższego sąsiada z kwantyzacją produktu na GPU w pytorch i cuda.
  • 173
  • MIT

Lantern

  • 163
  • BSD 3-clause "New" or "Revised"

RWKV-CUDA

Wersja CUDA modelu języka RWKV (https://github.com/BlinkDL/RWKV-LM).
  • 113

cuhnsw

Implementacja CUDA algorytmu Hierarchical Navigable Small World Graph.
  • 88
  • Apache License 2.0

CUB

TO REPOZYTORIUM ZOSTAŁO PRZENIESIONE DO github.com/nvidia/cub, KTÓRE JEST TU AUTOMATYCZNIE ODBLASOWANE.
  • 71
  • BSD 3-clause "New" or "Revised"

array-language-comparisons

Porównanie języków i bibliotek tablicowych: APL, J, BQN, Q, Julia, R, NumPy, Nial, Futhark, SaC i ArrayFire..
  • 60
  • MIT

mish-cuda

Funkcja aktywacji Mish dla PyTorch (autor: JunnYu).
  • 48
  • MIT

rocm-examples

  • 39
  • MIT

xgboost-node

Uruchom model XGBoost i dokonaj predykcji w Node.js.
  • 33
  • GNU General Public License v3.0

CUDA-Guide

CUDA Guide.
  • 29

kobra

Zorientowany na badania silnik gry badający najnowocześniejsze techniki renderowania (autor: vedavamadathil).
  • 21

CryptoGPU

Analiza cen kryptowalut.
  • 16

LSQR-CUDA

Jest to implementacja LSQR-CUDA napisana przez Lawrence'a Ayersa pod nadzorem Stefana Guthe z instytutu GRIS na Technische Universität Darmstadt. Autorami biblioteki LSQR są Chris Paige i Michael Saunders.
  • 11
  • MIT

SBNN

Pojedyncza binarna sieć neuronowa oparta na bitowych operacjach GPU (zobacz nasz dokument SC-19).
  • 10
  • GNU General Public License v3.0

GCGT

Kod źródłowy artykułu: Compressed Graph Traversal oparty na GPU.
  • 7
  • MIT

FirstCollisionTimestepRarefiedGasSimulator

Ten symulator oblicza wszystkie możliwe przecięcia dla bardzo małego kroku czasowego dla modelu cząstek.
  • 2

DOKSparse

rzadkie tensory DOK na GPU, pytorch.
  • 1
  • MIT