Beatviz Komplett-Anleitung: Von Audio zu professionellen Videos

Erste Schritte

Neue Aufgabe erstellen

Jedes Beatviz-Projekt beginnt mit einer Aufgabe. Hier definieren Sie, wie die KI Ihr Audio interpretieren soll.

Vorlage auswählen

Vorlagen definieren das Rendering-Verhalten der KI.

Storytelling

• Entwickelt für Erzählungen und gesprochene Inhalte
• Ausgewogene Leistung und Kosten

Gesang

• Optimiert für Musik und Gesang
• Überlegene Lippensynchronisations-Genauigkeit
• Höherer Credit-Verbrauch aufgrund fortschrittlichen Renderings

Wählen Sie Gesang, wenn die Qualität der visuellen Mundbewegung wichtig ist.

Standard vs Pro Modus

Wählen Sie vor der Generierung eine Qualitätsstufe:

Standard-Modus

• Schnelleres Rendering
• Niedrigere Credit-Kosten

Pro-Modus

• Höhere visuelle Detailtreue
• Erhöhter Credit-Verbrauch

Wählen Sie basierend auf Qualitätsanforderungen und Budget.

Voreinstellungen: Charakter

Laden Sie ein Charakterbild im Bereich Voreinstellungen hoch.

Dieses Bild wird verwendet, um:

Die Generierung des ersten Bildes zu leiten
Die Charakteridentität über alle Videosegmente hinweg beizubehalten

Ohne Charaktervoreinstellung kann die KI inkonsistente oder zufällige Charaktere erzeugen.

Voreinstellungen: Stil

Stile definieren die emotionale und filmische Ausrichtung des Videos.

Verfügbare Beispiele umfassen:

EpischFilmischLustigFröhlichTraurig

Stile beeinflussen Beleuchtung, Stimmung und visuellen Rhythmus.

Betrachten Sie Stile als übergeordnete kreative Vorgaben für die KI.

Erstes Bild & Video-Prompts prüfen

Nach der Konfiguration führt Beatviz automatisch folgende Schritte aus:

Analysiert Ihr Audio
Generiert ein erstes Bild
Erstellt einen entsprechenden Video-Prompt

Überprüfen Sie diese immer, bevor Sie das Video generieren.

Bedeutung des ersten Bildes

Das erste Bild bildet die visuelle Grundlage des Videos.

Es beeinflusst direkt:

Charakterdarstellung
Szenenkomposition
Gesamte ästhetische Konsistenz

Wichtig: Wenn das erste Bild nicht Ihren gewünschten Charakter enthält, generieren Sie es neu, bevor Sie fortfahren. Dieser Schritt verhindert nachgelagerte Inkonsistenzen.

Neugenerierung & Qualitätskontrolle

Beatviz unterstützt iterative Verfeinerung ohne Neustart Ihrer Aufgabe.

Videosegment neu generieren

Wenn ein generierter Clip die Erwartungen nicht erfüllt, können Sie:

Das aktuelle Segment neu generieren
Das erste Bild anpassen
Den Video-Prompt bearbeiten

Dies ermöglicht gezielte Verbesserungen unter Beibehaltung der bisherigen Arbeit.

Referenzbild vs Erstes Bild

Im Standard-Modus unterstützt die Neugenerierung zwei Bildtypen.

Referenzbild

• Leitet das Aussehen des Charakters an
• Hintergrund ist optional
• KI verlässt sich stärker auf Prompts

Erstes Bild

• Wird zum Eröffnungsbild
• Sowohl Charakter als auch Hintergrund sind wichtig
• Schränkt die visuelle Ausgabe stark ein

Verwenden Sie Referenzbilder für Flexibilität und erste Bilder für Präzision.

Entwurf wiederherstellen

Wenn Ihr Browser geschlossen wird oder ein technisches Problem auftritt, bleibt Ihr Fortschritt erhalten.

Unvollendete Aufgaben können wiederhergestellt werden unter: https://beatviz.ai/creations

Dies ermöglicht eine nahtlose Fortsetzung ohne Neukonfiguration.

Einfacher Modus vs Benutzerdefinierter Modus

Beatviz bietet zwei Hauptmodi zur Videogenerierung:

Einfacher Modus:https://beatviz.ai/create

Benutzerdefinierter Modus:https://beatviz.ai/create-custom

Hauptunterschiede

Einfacher Modus

Im einfachen Modus müssen Sie nur eine Audiodatei hochladen. Der KI-Agent von Beatviz wird automatisch:

Das Audio analysieren
Basierend auf Rhythmus und Struktur passende Video-Prompts generieren
Erste Bilder erstellen
Mit einem Klick ein vollständiges Video erstellen

Dieser Modus ist auf Geschwindigkeit und Benutzerfreundlichkeit ausgelegt, ermöglicht aber dennoch spätere Bearbeitung der KI-generierten Inhalte.

Benutzerdefinierter Modus

Im benutzerdefinierten Modus analysiert die KI Ihr Audio nicht automatisch. Stattdessen:

Sie kontrollieren jedes Videosegment vollständig
Sie schreiben jeden Prompt manuell
Sie entscheiden, ob Sie erste Bilder verwenden
Sie entwerfen die Videostruktur von Grund auf

Obwohl der einfache Modus auch manuelle Bearbeitung ermöglicht, wird die Ersteinrichtung durch KI-Agenten unterstützt.

Der benutzerdefinierte Modus bietet keine Agent-Unterstützung und richtet sich an Kreative, die vollständige kreative Freiheit und Präzision wünschen.

Aufgabe im benutzerdefinierten Modus erstellen

So erstellen Sie ein Projekt im benutzerdefinierten Modus:

Besuchen Sie https://beatviz.ai/create-custom
Laden Sie Ihre Audiodatei hoch
Geben Sie einen Projektnamen ein
Klicken Sie auf Aufgabe erstellen

Übersicht der benutzerdefinierten Oberfläche

Die benutzerdefinierte Oberfläche ist in zwei Hauptbereiche unterteilt:

Linkes Panel: Arbeitsbereich für Bild- und Videogenerierung
Rechtes Panel: Audio-Timeline-Arbeitsbereich

Das Ziel ist es, visuellen Content links zu generieren und rechts präzise mit Ihrem Audio abzustimmen.

Linkes Panel: Generierungs-Workspace

Das linke Panel enthält drei zentrale Funktionsbereiche:

Erstes Bild generieren
Video-Generierung
Audioanalyse (nur Referenz, keine automatische Generierung)

Der untere Bereich ist der Generator, in dem Sie Prompts und Einstellungen eingeben
Der obere Bereich zeigt generierte Bilder und Videos

In diesem Panel werden alle visuellen Assets erstellt, bevor sie auf der Timeline platziert werden.

Rechtes Panel: Audio-Timeline

Das rechte Panel konzentriert sich auf die Audio-Timeline unten.

Hier können Sie:

Generierte Videos vom linken Panel auf die Timeline ziehen
Videoclips mit bestimmten Audiosegmenten ausrichten
Nach der Platzierung frei die Reihenfolge ändern

Erstes Bild im benutzerdefinierten Modus generieren

So generieren Sie ein erstes Bild:

Wählen Sie im Generator-Bereich Bild
Wählen Sie Ihr bevorzugtes Bildmodell
Geben Sie Ihren Prompt ein
Optional: Laden Sie ein Referenzbild hoch
Klicken Sie auf Generieren

Erste Bilder können später wiederverwendet werden, um die Videogenerierung zu leiten.

Video-Generierung im benutzerdefinierten Modus

Die Videogenerierung folgt einem ähnlichen Workflow:

Geben Sie Ihren Video-Prompt ein
Wählen Sie ein Videomodell
Optional: Wählen Sie ein erstes Bild
Generieren Sie das Video

Über erste Bilder

Ein erstes Bild definiert den visuellen Ausgangspunkt eines Videoclips.

Es beeinflusst stark:

Komposition
Charakter-Aussehen
Gesamte visuelle Richtung

Die Verwendung eines gut gestalteten ersten Bildes kann die Konsistenz und Qualität des Videos erheblich verbessern.

First-frame image selection for video generation

Videos auf die Audio-Timeline anwenden

Sobald Ihre Videoclips generiert sind:

Ziehen Sie sie vom linken Panel auf die Timeline
Richten Sie jeden Clip mit dem gewünschten Audiosegment aus

Sie können auch:

Jederzeit die Reihenfolge der Clips ändern
Clips frei ersetzen oder entfernen

Lippensynchronisation im benutzerdefinierten Modus

Um die Lippensynchronisations-Funktion zu nutzen, sind zwei Schritte erforderlich:

Schritt 1: Lippensynchronisations-Audio auswählen

In der rechten Audio-Timeline:

Wählen Sie das spezifische Audiosegment aus, das Lippensynchronisation benötigt
Beatviz verwendet dieses ausgewählte Audio, um die Lippenbewegungsgenerierung der KI zu leiten

Schritt 2: Visuelle Richtung definieren

Sie müssen auch Folgendes angeben:

Einen Prompt, der Charakter und Szene beschreibt
Ein optionales Referenzbild

Diese Eingaben definieren den visuellen Gesamtstil, während das ausgewählte Audio die Mundbewegung steuert.

Charakter-Konsistenz sicherstellen

Die Charakter-Konsistenz wird hauptsächlich durch das erste Bild gesteuert.

Wie Konsistenz bestimmt wird

Wenn das erste Bild Ihren Charakter enthält, wird die KI ihn im gesamten Video beibehalten.
Wenn das erste Bild keinen Charakter enthält, aber die Prompts einen referenzieren, generiert die KI einen zufälligen Charakter.

Consistent vs inconsistent character example

Best Practice

Bestätigen Sie immer:

Der Charakter ist im ersten Bild deutlich sichtbar
Das Bild entspricht der Prompt-Beschreibung

Dies ist die zuverlässigste Methode für visuelle Kontinuität.

Sie können auch:

Die Schaltfläche Aus Bibliothek importieren verwenden, um Bilder aus früheren Aufgaben zu importieren
KI nutzen, um bei Bedarf neue Bilder zu generieren

Lippensynchronisation verbessern

Für optimale Lippensynchronisations-Ergebnisse:

Verwenden Sie den Gesang-Modus
Besonders für Musik und gesangslastige Inhalte

Der Gesang-Modus verbraucht mehr Credits aufgrund von:

Längerer Renderzeit
Fortgeschrittenen Gesichtsanimationsmodellen

Die Qualitätsverbesserung ist in der Regel erheblich.

Zusammenfassung

Diese Anleitung ist für modulares Lesen und visuelles Lernen strukturiert. Jeder Abschnitt ist eigenständig konzipiert und lässt sich natürlich mit kurzen GIF-Demonstrationen kombinieren, was sie ideal für Onboarding, Dokumentation und Produktschulung macht.

Beatviz Anleitung

Erste Schritte

Schnellstart-Anleitungen

Einfacher Modus vs Benutzerdefinierter Modus

Charakter-Konsistenz sicherstellen

Lippensynchronisation verbessern

Neue Aufgabe erstellen

Vorlage auswählen

Storytelling

Gesang

Standard vs Pro Modus

Standard-Modus

Pro-Modus

Voreinstellungen: Charakter

Voreinstellungen: Stil

Erstes Bild & Video-Prompts prüfen

Bedeutung des ersten Bildes

Neugenerierung & Qualitätskontrolle

Videosegment neu generieren

Referenzbild vs Erstes Bild

Referenzbild

Erstes Bild

Entwurf wiederherstellen

Einfacher Modus vs Benutzerdefinierter Modus

Hauptunterschiede

Einfacher Modus

Benutzerdefinierter Modus

Aufgabe im benutzerdefinierten Modus erstellen

Übersicht der benutzerdefinierten Oberfläche

Linkes Panel: Generierungs-Workspace

Rechtes Panel: Audio-Timeline

Erstes Bild im benutzerdefinierten Modus generieren

Video-Generierung im benutzerdefinierten Modus

Über erste Bilder

Videos auf die Audio-Timeline anwenden

Lippensynchronisation im benutzerdefinierten Modus

Schritt 1: Lippensynchronisations-Audio auswählen

Schritt 2: Visuelle Richtung definieren

Charakter-Konsistenz sicherstellen

Wie Konsistenz bestimmt wird

Best Practice

Lippensynchronisation verbessern

Zusammenfassung