Huddly Crew
Allgemein
Huddly Crew ist ein sogenanntes Multi-Kamera-System, das dem Nutzer eine KI-gesteuerte Kameraführung in Konferenzräumen verspricht. Es ist ein modulares System, welches mit drei bis fünf Kameras verwendet werden kann. So soll die optimale Erfassung aller Teilnehmer garantiert werden. Der Anwender besitzt während der Übertragungen keine Steuerungsmöglichkeiten, da alle bildverändernden Aktionen durch die Software ausgeführt werden.
Das System ist für MS Teams und Zoom zertifiziert. Es läuft unter Windows und MacOS und nicht offiziell auch unter einigen Linux-Systemen (in spezifischen Konfigurationen, aber immer nur mit den grundlegenden Funktionen). Weitere Informationen des Herstellers finden sich hier in der technischen Spezifikation (Stand 09/2024).
Installation
Unser Test fand mit fünf Kameras (Huddly L1) statt. Der Lieferumfang enthält alle notwendigen Komponenten. Die wichtigsten Komponenten sind die Kameras, die Steuereinheit und der Netzwerkswitch.
Der Aufbau ist unkompliziert und selbst beim ersten Mal in ca. 15 Minuten erledigt. Der Weltrekord soll übrigens bei 43 Sekunden liegen (Stand 12/2025). Die Kameras werden mittels IP-Kabel mit dem Switch verbunden, dieser zusätzlich noch mit der Steuereinheit ("Huddly USB Adapter"). Die Steuereinheit wiederum wird noch zusätzlich mittels USB-Kabel mit dem Laptop / PC verbunden und alles ist betriebsbereit.
Es ist unabdingbar, dass die Kameras und die Steuereinheit im selben Subnetz eingebunden werden. Der mitgelieferte Switch (PoE-Switch mit einer Gesamtleistung von 83W) stellt das unkompliziert sicher.
Die Kameras müssen immer an ein und demselben PoE-Switch sein, die Steuereinheit kann auch räumlich entfernt sein. In diesem Fall wird die Steuereinheit durch ein weiteres IP-Kabel mit demselben Subnetz verbunden.
Schön jedoch sinnlose Anordnung der Kameras
Im Videokonferenzprogramm wird die Huddly Crew wie üblich zur Auswahl angeboten. Beim ersten Mal initialisiert sich das System durch einen kurzen Check der Umgebung selbst. Die Kameras haben einen Weitwinkel von ca. 92° und durch einen Abgleich der Objekte in jedem Focus werden die eigene räumliche Anordnung im Raum und dessen Ausmaße aufgenommen und gespeichert. Es ist dazu zwingend notwendig, dass sich die Bilder der Kameras stellenweise überlappen.
Testergebnisse
- Die Konfiguration ist einfach und schnell, da diese durch Selbstinitialisierung stattfindet. Sie wird bei jeder Änderung der Kamerapositionen neu durchgeführt.
- Die automatische Anpassung der Kameraansichten sorgt für einen sehr guten Bildausschnitt und ermöglicht eine flexible Aufstellung der Kameras im Raum.
Somit sind auch ungünstig geschnittene Räume nutzbar, die sich bisherigen herkömmlichen Systemen wegen ihres Grundrisses verschliessen.
Hinweise für die Kameraanordnung in größeren Räumen (siehe dazu auch im Datenblatt)
- Es ist sinnvoll, die von der Firma empfohlenen Montage-Grundrisse der 3 bzw. 5-Kamera-Systeme einzuhalten, da diese das bestmögliche Videoergebnis liefern. Die KI wurde laut Hersteller für diese Montagevorgaben optimiert. Bei anderen Anordnungen kann es zu großen Perspektiven oder nicht optimalen Bildschnitten kommen.
- Die Kameras arbeiten jede mit 6K im Video und jeweils einem Mikrofon für das Tracking durch die AI. Die Mikrofone können aber nicht als Eingangssignal für eine Videokonferenz genutzt werden und helfen nur bei der Entscheidung mit, welche Kamera den besten Blick auf den aktuellen Sprecher hat.
- Seit dem letzten Update der Software ist die Eigenschaft "Räumliche Wahrnehmung" implementiert. Das vermeidet weitestgehend die Aufnahmen von 2D-Bildern (Projektor u.ä.). Das bestätigte sich in unseren Tests, wo nur ein einziges Mal das Projektorbild als Sprecher identifiziert wurde.
- Da sich die Kameras untereinander abstimmen, wird immer nur ein Stream gesendet. Eine parallele Nutzung mehrerer Kameras ist so im Standardsetting nicht möglich. Die sendende Kamera hat eine schwach leuchtende Anzeige, die erkennbar aber nicht störend ist.
- Die KI-Komponente ist direkt in der Kamera integriert. Dadurch sind alle Aspekte des Datenschutzes erfüllt, weil keine Daten weitergegeben werden.
- Das Video hat keine Weitwinkelverzerrung.
- Da die Huddly Crew ein Multi-Kamera-System ist, muss sie für Videokonferenzen durch eine Audioübertragungskomponente, also Mikrofon und Lautsprecher, ergänzt werden. Dafür bieten einige Hersteller Bundles an.
- Mittels der App "Huddly Director" können die Kameras zwischen verschiedenen Modi umgeschalten werden.
Huddly App Version 3.3.9
- Der "Huddly Director" schaltet KI-gestützt zwischen verschiedenen Einstellungen und Blickwinkeln um.
- Im Modus "Group Framing" sind die Sprecher im Hauptfokus. Dabei wird versucht, sie mit einer geeigneten Umgebung einzublenden. Das kann der Sitznachbar, eine kleine Gruppe oder auch mal die Totale sein. Das alles findet ohne größere Verzögerungen statt.
- Im Modus "Gallery View" wird regelmäßig zwischen dem Sprecher, einer Gruppe von mehreren Teilnehmern und weiteren (stillen) Zuschauern umgeschaltet. Das ist recht angenehm, weil es lange Sequenzen von gleichen Bildausschnitten vermeidet.
- "Manual Framing" erlaubt das Anpassen des zu nutztenden Aufnahmebereiches.
- Bei der Huddly Connect App bitte immer die letzte verfügbare Version nutzen (bei uns 3.3.9). Es gibt auch noch eine andere Version für die Huddly GO (Legacy Huddly App). Der Versuch der Verwendung der falschen App mit Huddly Crew führte zu minutenlangen Verzögerungen der Umschaltungen zwischen den Kameras.
- Die Darstellung der Konferenz und damit der Teilnehmer aus verschiedenen Perspektiven und Blickwinkeln beugt bei längeren Meetings einschläfernder Monotonie wegen immer gleicher Bilder vor.
- Die Reichweite einer Kamera beträgt ca. 7m.
Fazit
Das System ist sehr gut für hochwertige Übertragungen mit sorgfältig konzipierten Kameraperspektiven und ausgeklügelten Blickwinkeln geeignet. Obwohl es mobil eingesetzt werden kann, bietet sich eine feste Installation in mittelgroßen Räumen oder für den Einsatz bei Podiumsdiskussionen an. Die automatische Kameraführung kann auch sehr gut bei Video-Podcast-Produktionen eingesetzt werden, damit sich die Beteiligten einzig und allein auf das Thema konzentrieren können.
Obwohl das System schnell auf- und abgebaut werden kann, ist es auf Grund seines Preis-Leistungs-Verhältnisses und der immer notwendigen zusätzlichen Audiokomponente für den täglichen Einsatz an verschiedenen Orten innerhalb universitärer Einrichtungen weniger geeignet.
(Stand: 12/2025)