Erste Schritte
Neue Aufgabe erstellen
Jedes Beatviz-Projekt beginnt mit einer Aufgabe. Hier definieren Sie, wie die KI Ihr Audio interpretieren soll.
Vorlage auswählen
Vorlagen definieren das Rendering-Verhalten der KI.
Storytelling
- • Entwickelt für Erzählungen und gesprochene Inhalte
- • Ausgewogene Leistung und Kosten
Gesang
- • Optimiert für Musik und Gesang
- • Überlegene Lippensynchronisations-Genauigkeit
- • Höherer Credit-Verbrauch aufgrund fortschrittlichen Renderings
Wählen Sie Gesang, wenn die Qualität der visuellen Mundbewegung wichtig ist.

Standard vs Pro Modus
Wählen Sie vor der Generierung eine Qualitätsstufe:
Standard-Modus
- • Schnelleres Rendering
- • Niedrigere Credit-Kosten
Pro-Modus
- • Höhere visuelle Detailtreue
- • Erhöhter Credit-Verbrauch
Wählen Sie basierend auf Qualitätsanforderungen und Budget.

Voreinstellungen: Charakter
Laden Sie ein Charakterbild im Bereich Voreinstellungen hoch.
Dieses Bild wird verwendet, um:
- Die Generierung des ersten Bildes zu leiten
- Die Charakteridentität über alle Videosegmente hinweg beizubehalten
Ohne Charaktervoreinstellung kann die KI inkonsistente oder zufällige Charaktere erzeugen.
Voreinstellungen: Stil
Stile definieren die emotionale und filmische Ausrichtung des Videos.
Verfügbare Beispiele umfassen:
Stile beeinflussen Beleuchtung, Stimmung und visuellen Rhythmus.
Betrachten Sie Stile als übergeordnete kreative Vorgaben für die KI.

Erstes Bild & Video-Prompts prüfen
Nach der Konfiguration führt Beatviz automatisch folgende Schritte aus:
- Analysiert Ihr Audio
- Generiert ein erstes Bild
- Erstellt einen entsprechenden Video-Prompt
Überprüfen Sie diese immer, bevor Sie das Video generieren.
Bedeutung des ersten Bildes
Das erste Bild bildet die visuelle Grundlage des Videos.
Es beeinflusst direkt:
- Charakterdarstellung
- Szenenkomposition
- Gesamte ästhetische Konsistenz
Wichtig: Wenn das erste Bild nicht Ihren gewünschten Charakter enthält, generieren Sie es neu, bevor Sie fortfahren. Dieser Schritt verhindert nachgelagerte Inkonsistenzen.
Neugenerierung & Qualitätskontrolle
Beatviz unterstützt iterative Verfeinerung ohne Neustart Ihrer Aufgabe.
Videosegment neu generieren
Wenn ein generierter Clip die Erwartungen nicht erfüllt, können Sie:
- Das aktuelle Segment neu generieren
- Das erste Bild anpassen
- Den Video-Prompt bearbeiten
Dies ermöglicht gezielte Verbesserungen unter Beibehaltung der bisherigen Arbeit.
Referenzbild vs Erstes Bild
Im Standard-Modus unterstützt die Neugenerierung zwei Bildtypen.
Referenzbild
- • Leitet das Aussehen des Charakters an
- • Hintergrund ist optional
- • KI verlässt sich stärker auf Prompts
Erstes Bild
- • Wird zum Eröffnungsbild
- • Sowohl Charakter als auch Hintergrund sind wichtig
- • Schränkt die visuelle Ausgabe stark ein
Verwenden Sie Referenzbilder für Flexibilität und erste Bilder für Präzision.

Entwurf wiederherstellen
Wenn Ihr Browser geschlossen wird oder ein technisches Problem auftritt, bleibt Ihr Fortschritt erhalten.
Unvollendete Aufgaben können wiederhergestellt werden unter: https://beatviz.ai/creations
Dies ermöglicht eine nahtlose Fortsetzung ohne Neukonfiguration.

Einfacher Modus vs Benutzerdefinierter Modus
Beatviz bietet zwei Hauptmodi zur Videogenerierung:
Hauptunterschiede
Einfacher Modus
Im einfachen Modus müssen Sie nur eine Audiodatei hochladen. Der KI-Agent von Beatviz wird automatisch:
- Das Audio analysieren
- Basierend auf Rhythmus und Struktur passende Video-Prompts generieren
- Erste Bilder erstellen
- Mit einem Klick ein vollständiges Video erstellen
Dieser Modus ist auf Geschwindigkeit und Benutzerfreundlichkeit ausgelegt, ermöglicht aber dennoch spätere Bearbeitung der KI-generierten Inhalte.
Benutzerdefinierter Modus
Im benutzerdefinierten Modus analysiert die KI Ihr Audio nicht automatisch. Stattdessen:
- Sie kontrollieren jedes Videosegment vollständig
- Sie schreiben jeden Prompt manuell
- Sie entscheiden, ob Sie erste Bilder verwenden
- Sie entwerfen die Videostruktur von Grund auf
Obwohl der einfache Modus auch manuelle Bearbeitung ermöglicht, wird die Ersteinrichtung durch KI-Agenten unterstützt.
Der benutzerdefinierte Modus bietet keine Agent-Unterstützung und richtet sich an Kreative, die vollständige kreative Freiheit und Präzision wünschen.
Aufgabe im benutzerdefinierten Modus erstellen
So erstellen Sie ein Projekt im benutzerdefinierten Modus:
- Besuchen Sie https://beatviz.ai/create-custom
- Laden Sie Ihre Audiodatei hoch
- Geben Sie einen Projektnamen ein
- Klicken Sie auf Aufgabe erstellen

Übersicht der benutzerdefinierten Oberfläche
Die benutzerdefinierte Oberfläche ist in zwei Hauptbereiche unterteilt:
- Linkes Panel: Arbeitsbereich für Bild- und Videogenerierung
- Rechtes Panel: Audio-Timeline-Arbeitsbereich
Das Ziel ist es, visuellen Content links zu generieren und rechts präzise mit Ihrem Audio abzustimmen.

Linkes Panel: Generierungs-Workspace
Das linke Panel enthält drei zentrale Funktionsbereiche:
- Erstes Bild generieren
- Video-Generierung
- Audioanalyse (nur Referenz, keine automatische Generierung)
- Der untere Bereich ist der Generator, in dem Sie Prompts und Einstellungen eingeben
- Der obere Bereich zeigt generierte Bilder und Videos
In diesem Panel werden alle visuellen Assets erstellt, bevor sie auf der Timeline platziert werden.
Rechtes Panel: Audio-Timeline
Das rechte Panel konzentriert sich auf die Audio-Timeline unten.
Hier können Sie:
- Generierte Videos vom linken Panel auf die Timeline ziehen
- Videoclips mit bestimmten Audiosegmenten ausrichten
- Nach der Platzierung frei die Reihenfolge ändern
Erstes Bild im benutzerdefinierten Modus generieren
So generieren Sie ein erstes Bild:
- Wählen Sie im Generator-Bereich Bild
- Wählen Sie Ihr bevorzugtes Bildmodell
- Geben Sie Ihren Prompt ein
- Optional: Laden Sie ein Referenzbild hoch
- Klicken Sie auf Generieren
Erste Bilder können später wiederverwendet werden, um die Videogenerierung zu leiten.
Video-Generierung im benutzerdefinierten Modus
Die Videogenerierung folgt einem ähnlichen Workflow:
- Geben Sie Ihren Video-Prompt ein
- Wählen Sie ein Videomodell
- Optional: Wählen Sie ein erstes Bild
- Generieren Sie das Video
Über erste Bilder
Ein erstes Bild definiert den visuellen Ausgangspunkt eines Videoclips.
Es beeinflusst stark:
- Komposition
- Charakter-Aussehen
- Gesamte visuelle Richtung
Die Verwendung eines gut gestalteten ersten Bildes kann die Konsistenz und Qualität des Videos erheblich verbessern.

Videos auf die Audio-Timeline anwenden
Sobald Ihre Videoclips generiert sind:
- Ziehen Sie sie vom linken Panel auf die Timeline
- Richten Sie jeden Clip mit dem gewünschten Audiosegment aus
Sie können auch:
- Jederzeit die Reihenfolge der Clips ändern
- Clips frei ersetzen oder entfernen
Lippensynchronisation im benutzerdefinierten Modus
Um die Lippensynchronisations-Funktion zu nutzen, sind zwei Schritte erforderlich:
Schritt 1: Lippensynchronisations-Audio auswählen
In der rechten Audio-Timeline:
- Wählen Sie das spezifische Audiosegment aus, das Lippensynchronisation benötigt
- Beatviz verwendet dieses ausgewählte Audio, um die Lippenbewegungsgenerierung der KI zu leiten
Schritt 2: Visuelle Richtung definieren
Sie müssen auch Folgendes angeben:
- Einen Prompt, der Charakter und Szene beschreibt
- Ein optionales Referenzbild
Diese Eingaben definieren den visuellen Gesamtstil, während das ausgewählte Audio die Mundbewegung steuert.
Charakter-Konsistenz sicherstellen
Die Charakter-Konsistenz wird hauptsächlich durch das erste Bild gesteuert.
Wie Konsistenz bestimmt wird
- Wenn das erste Bild Ihren Charakter enthält, wird die KI ihn im gesamten Video beibehalten.
- Wenn das erste Bild keinen Charakter enthält, aber die Prompts einen referenzieren, generiert die KI einen zufälligen Charakter.

Best Practice
Bestätigen Sie immer:
- Der Charakter ist im ersten Bild deutlich sichtbar
- Das Bild entspricht der Prompt-Beschreibung
Dies ist die zuverlässigste Methode für visuelle Kontinuität.
Sie können auch:
- Die Schaltfläche Aus Bibliothek importieren verwenden, um Bilder aus früheren Aufgaben zu importieren
- KI nutzen, um bei Bedarf neue Bilder zu generieren

Lippensynchronisation verbessern
Für optimale Lippensynchronisations-Ergebnisse:
- Verwenden Sie den Gesang-Modus
- Besonders für Musik und gesangslastige Inhalte
Der Gesang-Modus verbraucht mehr Credits aufgrund von:
- Längerer Renderzeit
- Fortgeschrittenen Gesichtsanimationsmodellen
Die Qualitätsverbesserung ist in der Regel erheblich.
Zusammenfassung
Diese Anleitung ist für modulares Lesen und visuelles Lernen strukturiert. Jeder Abschnitt ist eigenständig konzipiert und lässt sich natürlich mit kurzen GIF-Demonstrationen kombinieren, was sie ideal für Onboarding, Dokumentation und Produktschulung macht.