informapirata ⁂ :privacypride:@mastodon.uno to

Intelligenza Artificiale @feddit.it · 12 days ago

Taalas ha rilasciato un chip ASIC che esegue Llama 3.1 8B a 17.000 token al secondo

4

1

Taalas ha rilasciato un chip ASIC che esegue Llama 3.1 8B a 17.000 token al secondo

informapirata ⁂ :privacypride:@mastodon.uno to

Intelligenza Artificiale @feddit.it · 12 days ago

4

Taalas ha rilasciato un chip ASIC che esegue Llama 3.1 8B a 17.000 token al secondo

Taalas ha praticamente inciso i 32 strati di Llama 3.1 in sequenza su un chip: i pesi del modello sono transistor fisici incisi nel silicio.
Dovrebbe essere 10 volte più economico in termini di costi di gestione rispetto ai sistemi di inferenza basati su GPU e 10 volte meno energivoro. Non ci sono DRAM/HBM esterne, ma una piccola quantità di SRAM on-chip.

https://www.anuragk.com/blog/posts/Taalas.html

Chat

suoko@feddit.it
link
fedilink
Italiano
arrow-up
1·
12 days ago
Sembrano buoni per l’automotive e le telecamere del futuro distopico

Intelligenza Artificiale @feddit.it

aitech@feddit.it

You are not logged in. However you can subscribe from another Fediverse account, for example Lemmy or Mastodon. To do this, paste the following into the search field of your instance: !aitech@feddit.it

L’intelligenza artificiale è una delle rivoluzioni digitali più dirompenti degli ultimi anni. Questa è la comunità in cui parlarne.

Regole

👉 Il rispetto reciproco è fondamentale per creare un luogo di confronto sereno e piacevole.

👉 No fake news, pubblicità, link di affiliazione e paywall.

👉 Nessuna forma di discriminazione sarà tollerata.

👉 In aggiunta a queste regole, agite sempre in concordanza con la guida all’utilizzo di Feddit.

Visibility: Public

This community can be federated to other instances and be posted/commented in by their users.

1 user / day
13 users / week
65 users / month
208 users / 6 months
1 local subscriber
575 subscribers
409 Posts
315 Comments
Modlog