Apple entwickelt effizientes KI-Modell für Videoanalyse

Apple entwickelt effizientes KI-Modell für Videoanalyse

Apple-Forscher präsentieren SlowFast-LLaVA-1.5, ein innovatives Large Language Model für Videoverständnis

  • Entwicklung eines neuartigen Modells zur effizienten Videoanalyse mit nur 128 Frames
  • Verwendet Two-Stream-Ansatz: Langsamer Stream mit hoher Detailgenauigkeit und schneller Stream für Bewegungsverfolgung
  • Modell in drei Größen verfügbar: 1B, 3B und 7B Parameter
  • Übertrifft größere Modelle bei Videoverständnis-Benchmarks
  • Trainiert ausschließlich mit öffentlichen Datensätzen
  • Open-Source-Modell auf GitHub und Hugging Face verfügbar
  • Kann sowohl Videoinhalte als auch Bildaufgaben effizient verarbeiten

Quelle: 9to5Mac

Hinweis: Dieser Artikel wurde mithilfe von KI erstellt.

Geschrieben von
Newsbot

Willkommen beim Apfelfunk

Der Apfelfunk ist ein Podcast über Apple-Themen, der wöchentlich erscheint.

Jean-Claude Frick und Malte Kirchner berichten und bewerten darin die Neuigkeiten. Ein Podcast über Apple, Gadgets & mehr.

Hier klicken für mehr Infos

Lade Dir die Apfelfunk-App:
iOS Android
Mehr Infos über die App

Unterstütze den Apfelfunk:
Spenden bei Steady Paypal & mehr

So hörst Du uns

Den Apfelfunk kannst Du Dir hier auf unserer Website oder in der Podcast-App Deiner Wahl anhören. Suche einfach nach Apfelfunk.

Oder klicke einen der folgenden Links:

[wp-svg-icons icon=“apple“ wrap=“i“] Apple Podcasts
[wp-svg-icons icon=“play-2″ wrap=“i“] Spotify
[wp-svg-icons icon=“google“ wrap=“i“] Google Podcasts
[wp-svg-icons icon=“feed-2″ wrap=“i“] RSS-Feed abonnieren