mirror of https://github.com/affaan-m/everything-claude-code.git synced 2026-03-30 21:53:28 +08:00

Files

2026-03-13 17:45:44 +08:00

16 KiB

Raw Blame History

时间线编辑指南

VideoDB 提供了一个非破坏性的时间线编辑器，用于从多个素材合成视频、添加文本和图像叠加、混合音轨以及修剪片段——所有这些都在服务器端完成，无需重新编码或本地工具。可用于修剪、合并片段、在视频上叠加音频/音乐、添加字幕以及叠加文本或图像。

前提条件

视频、音频和图像必须上传到集合中，才能用作时间线素材。对于字幕叠加，视频还必须为口语单词建立索引。

核心概念

时间线

Timeline 是一个虚拟合成层。素材可以内联（在主轨道上顺序放置）或作为叠加层（在特定时间戳分层放置）放置在时间线上。不会修改原始媒体；最终流是按需编译的。

from videodb.timeline import Timeline

timeline = Timeline(conn)

素材

时间线上的每个元素都是一个素材。VideoDB 提供五种素材类型：

素材	导入	主要用途
`VideoAsset`	`from videodb.asset import VideoAsset`	视频片段（修剪、排序）
`AudioAsset`	`from videodb.asset import AudioAsset`	音乐、音效、旁白
`ImageAsset`	`from videodb.asset import ImageAsset`	徽标、缩略图、叠加层
`TextAsset`	`from videodb.asset import TextAsset, TextStyle`	标题、字幕、下三分之一字幕
`CaptionAsset`	`from videodb.editor import CaptionAsset`	自动渲染的字幕（编辑器 API）

构建时间线

内联添加视频片段

内联素材在主视频轨道上一个接一个播放。add_inline 方法只接受 VideoAsset：

from videodb.asset import VideoAsset

video_a = coll.get_video(video_id_a)
video_b = coll.get_video(video_id_b)

timeline = Timeline(conn)
timeline.add_inline(VideoAsset(asset_id=video_a.id))
timeline.add_inline(VideoAsset(asset_id=video_b.id))

stream_url = timeline.generate_stream()

修剪 / 子片段

在 VideoAsset 上使用 start 和 end 来提取一部分：

# Take only seconds 10–30 from the source video
clip = VideoAsset(asset_id=video.id, start=10, end=30)
timeline.add_inline(clip)

VideoAsset 参数

参数	类型	默认值	描述
`asset_id`	`str`	必填	视频媒体 ID
`start`	`float`	`0`	修剪开始时间（秒）
`end`	`float\|None`	`None`	修剪结束时间（`None` = 完整视频）

警告： SDK 不会验证负时间戳。传递 start=-5 会被静默接受，但会产生损坏或意外的输出。在创建 VideoAsset 之前，请始终确保 start >= 0、start < end 和 end <= video.length。

文本叠加

在时间线的任意点添加标题、下三分之一字幕或说明文字：

from videodb.asset import TextAsset, TextStyle

title = TextAsset(
    text="Welcome to the Demo",
    duration=5,
    style=TextStyle(
        fontsize=36,
        fontcolor="white",
        boxcolor="black",
        alpha=0.8,
        font="Sans",
    ),
)

# Overlay the title at the very start (t=0)
timeline.add_overlay(0, title)

TextStyle 参数

参数	类型	默认值	描述
`fontsize`	`int`	`24`	字体大小（像素）
`fontcolor`	`str`	`"black"`	CSS 颜色名称或十六进制值
`fontcolor_expr`	`str`	`""`	动态字体颜色表达式
`alpha`	`float`	`1.0`	文本不透明度（0.0–1.0）
`font`	`str`	`"Sans"`	字体系列
`box`	`bool`	`True`	启用背景框
`boxcolor`	`str`	`"white"`	背景框颜色
`boxborderw`	`str`	`"10"`	框边框宽度
`boxw`	`int`	`0`	框宽度覆盖
`boxh`	`int`	`0`	框高度覆盖
`line_spacing`	`int`	`0`	行间距
`text_align`	`str`	`"T"`	框内文本对齐方式
`y_align`	`str`	`"text"`	垂直对齐参考
`borderw`	`int`	`0`	文本边框宽度
`bordercolor`	`str`	`"black"`	文本边框颜色
`expansion`	`str`	`"normal"`	文本扩展模式
`basetime`	`int`	`0`	基于时间的表达式的基础时间
`fix_bounds`	`bool`	`False`	固定文本边界
`text_shaping`	`bool`	`True`	启用文本整形
`shadowcolor`	`str`	`"black"`	阴影颜色
`shadowx`	`int`	`0`	阴影 X 偏移
`shadowy`	`int`	`0`	阴影 Y 偏移
`tabsize`	`int`	`4`	制表符大小（空格数）
`x`	`str`	`"(main_w-text_w)/2"`	水平位置表达式
`y`	`str`	`"(main_h-text_h)/2"`	垂直位置表达式

音频叠加

在主视频轨道上叠加背景音乐、音效或旁白：

from videodb.asset import AudioAsset

music = coll.get_audio(music_id)

audio_layer = AudioAsset(
    asset_id=music.id,
    disable_other_tracks=False,
    fade_in_duration=2,
    fade_out_duration=2,
)

# Start the music at t=0, overlaid on the video track
timeline.add_overlay(0, audio_layer)

AudioAsset 参数

参数	类型	默认值	描述
`asset_id`	`str`	必填	音频媒体 ID
`start`	`float`	`0`	修剪开始时间（秒）
`end`	`float\|None`	`None`	修剪结束时间（`None` = 完整音频）
`disable_other_tracks`	`bool`	`True`	为 True 时，静音其他音轨
`fade_in_duration`	`float`	`0`	淡入秒数（最大 5）
`fade_out_duration`	`float`	`0`	淡出秒数（最大 5）

图像叠加

添加徽标、水印或生成的图像作为叠加层：

from videodb.asset import ImageAsset

logo = coll.get_image(logo_id)

logo_overlay = ImageAsset(
    asset_id=logo.id,
    duration=10,
    width=120,
    height=60,
    x=20,
    y=20,
)

timeline.add_overlay(0, logo_overlay)

ImageAsset 参数

参数	类型	默认值	描述
`asset_id`	`str`	必填	图像媒体 ID
`width`	`int\|str`	`100`	显示宽度
`height`	`int\|str`	`100`	显示高度
`x`	`int`	`80`	水平位置（距离左侧的像素）
`y`	`int`	`20`	垂直位置（距离顶部的像素）
`duration`	`float\|None`	`None`	显示时长（秒）

字幕叠加

有两种方式可以为视频添加字幕。

方法 1：字幕工作流（最简单）

使用 video.add_subtitle() 将字幕直接烧录到视频流中。这在内部使用 videodb.timeline.Timeline：

from videodb import SubtitleStyle

# Video must have spoken words indexed first (force=True skips if already done)
video.index_spoken_words(force=True)

# Add subtitles with default styling
stream_url = video.add_subtitle()

# Or customise the subtitle style
stream_url = video.add_subtitle(style=SubtitleStyle(
    font_name="Arial",
    font_size=22,
    primary_colour="&H00FFFFFF",
    bold=True,
))

方法 2：编辑器 API（高级）

编辑器 API（videodb.editor）提供了一个基于轨道的合成系统，包含 CaptionAsset、Clip、Track 及其自身的 Timeline。这是一个与上述使用的 videodb.timeline.Timeline 独立的 API。

from videodb.editor import (
    CaptionAsset,
    Clip,
    Track,
    Timeline as EditorTimeline,
    FontStyling,
    BorderAndShadow,
    Positioning,
    CaptionAnimation,
)

# Video must have spoken words indexed first (force=True skips if already done)
video.index_spoken_words(force=True)

# Create a caption asset
caption = CaptionAsset(
    src="auto",
    font=FontStyling(name="Clear Sans", size=30),
    primary_color="&H00FFFFFF",
    back_color="&H00000000",
    border=BorderAndShadow(outline=1),
    position=Positioning(margin_v=30),
    animation=CaptionAnimation.box_highlight,
)

# Build an editor timeline with tracks and clips
editor_tl = EditorTimeline(conn)
track = Track()
track.add_clip(start=0, clip=Clip(asset=caption, duration=video.length))
editor_tl.add_track(track)
stream_url = editor_tl.generate_stream()

CaptionAsset 参数

参数	类型	默认值	描述
`src`	`str`	`"auto"`	字幕来源（`"auto"` 或 base64 ASS 字符串）
`font`	`FontStyling\|None`	`FontStyling()`	字体样式（名称、大小、粗体、斜体等）
`primary_color`	`str`	`"&H00FFFFFF"`	主文本颜色（ASS 格式）
`secondary_color`	`str`	`"&H000000FF"`	次文本颜色（ASS 格式）
`back_color`	`str`	`"&H00000000"`	背景颜色（ASS 格式）
`border`	`BorderAndShadow\|None`	`BorderAndShadow()`	边框和阴影样式
`position`	`Positioning\|None`	`Positioning()`	字幕对齐方式和边距
`animation`	`CaptionAnimation\|None`	`None`	动画效果（例如，`box_highlight`、`reveal`、`karaoke`）

编译与流式传输

组装好时间线后，将其编译成可流式传输的 URL。流是即时生成的——无需渲染等待时间。

stream_url = timeline.generate_stream()
print(f"Stream: {stream_url}")

有关更多流式传输选项（分段流、搜索到流、音频播放），请参阅 streaming.md。

完整工作流示例

带标题卡的高光集锦

import videodb
from videodb import SearchType
from videodb.exceptions import InvalidRequestError
from videodb.timeline import Timeline
from videodb.asset import VideoAsset, TextAsset, TextStyle

conn = videodb.connect()
coll = conn.get_collection()
video = coll.get_video("your-video-id")

# 1. Search for key moments
video.index_spoken_words(force=True)
try:
    results = video.search("product announcement", search_type=SearchType.semantic)
    shots = results.get_shots()
except InvalidRequestError as exc:
    if "No results found" in str(exc):
        shots = []
    else:
        raise

# 2. Build timeline
timeline = Timeline(conn)

# Title card
title = TextAsset(
    text="Product Launch Highlights",
    duration=4,
    style=TextStyle(fontsize=48, fontcolor="white", boxcolor="#1a1a2e", alpha=0.95),
)
timeline.add_overlay(0, title)

# Append each matching clip
for shot in shots:
    asset = VideoAsset(asset_id=shot.video_id, start=shot.start, end=shot.end)
    timeline.add_inline(asset)

# 3. Generate stream
stream_url = timeline.generate_stream()
print(f"Highlight reel: {stream_url}")

带背景音乐的徽标叠加

import videodb
from videodb.timeline import Timeline
from videodb.asset import VideoAsset, AudioAsset, ImageAsset

conn = videodb.connect()
coll = conn.get_collection()

main_video = coll.get_video(main_video_id)
music = coll.get_audio(music_id)
logo = coll.get_image(logo_id)

timeline = Timeline(conn)

# Main video track
timeline.add_inline(VideoAsset(asset_id=main_video.id))

# Background music — disable_other_tracks=False to mix with video audio
timeline.add_overlay(
    0,
    AudioAsset(asset_id=music.id, disable_other_tracks=False, fade_in_duration=3),
)

# Logo in top-right corner for first 10 seconds
timeline.add_overlay(
    0,
    ImageAsset(asset_id=logo.id, duration=10, x=1140, y=20, width=120, height=60),
)

stream_url = timeline.generate_stream()
print(f"Final video: {stream_url}")

来自多个视频的多片段蒙太奇

import videodb
from videodb.timeline import Timeline
from videodb.asset import VideoAsset, TextAsset, TextStyle

conn = videodb.connect()
coll = conn.get_collection()

clips = [
    {"video_id": "vid_001", "start": 5, "end": 15, "label": "Scene 1"},
    {"video_id": "vid_002", "start": 0, "end": 20, "label": "Scene 2"},
    {"video_id": "vid_003", "start": 30, "end": 45, "label": "Scene 3"},
]

timeline = Timeline(conn)
timeline_offset = 0.0

for clip in clips:
    # Add a label as an overlay on each clip
    label = TextAsset(
        text=clip["label"],
        duration=2,
        style=TextStyle(fontsize=32, fontcolor="white", boxcolor="#333333"),
    )
    timeline.add_inline(
        VideoAsset(asset_id=clip["video_id"], start=clip["start"], end=clip["end"])
    )
    timeline.add_overlay(timeline_offset, label)
    timeline_offset += clip["end"] - clip["start"]

stream_url = timeline.generate_stream()
print(f"Montage: {stream_url}")

两个时间线 API

VideoDB 有两个独立的时间线系统。它们不可互换：

	`videodb.timeline.Timeline`	`videodb.editor.Timeline`（编辑器 API）
导入	`from videodb.timeline import Timeline`	`from videodb.editor import Timeline as EditorTimeline`
素材	`VideoAsset`、`AudioAsset`、`ImageAsset`、`TextAsset`	`CaptionAsset`、`Clip`、`Track`
方法	`add_inline()`、`add_overlay()`	`add_track()` 配合 `Track` / `Clip`
最适合	视频合成、叠加、多片段编辑	带动画的字幕/字幕样式设计

不要将一个 API 的素材混入另一个 API。CaptionAsset 仅适用于编辑器 API。VideoAsset / AudioAsset / ImageAsset / TextAsset 仅适用于 videodb.timeline.Timeline。

限制与约束

时间线编辑器专为非破坏性线性合成而设计。不支持以下操作：

不支持的操作

限制	详情
无过渡或效果	片段之间没有交叉淡入淡出、划像、溶解或过渡。所有剪辑都是硬切。
无视频叠加视频（画中画）	`add_inline()` 只接受 `VideoAsset`。无法将一个视频流叠加在另一个之上。图像叠加可以近似静态画中画，但不能是实时视频。
无速度或播放控制	没有慢动作、快进、倒放或时间重映射。`VideoAsset` 没有 `speed` 参数。
无裁剪、缩放或平移	无法裁剪视频帧的区域、应用缩放效果或在帧上平移。`video.reframe()` 仅用于宽高比转换。
无视频滤镜或色彩分级	没有亮度、对比度、饱和度、色调或色彩校正调整。
无动画文本	`TextAsset` 在其整个持续时间内是静态的。没有淡入/淡出、移动或动画。对于动画字幕，请使用带有编辑器 API 的 `CaptionAsset`。
无混合文本样式	单个 `TextAsset` 只有一个 `TextStyle`。无法在单个文本块内混合粗体、斜体或颜色。
无空白或纯色片段	无法创建纯色帧、黑屏或独立的标题卡。文本和图像叠加需要在内联轨道上有 `VideoAsset` 作为底层。
无音频音量控制	`AudioAsset` 没有 `volume` 参数。音频要么是全音量，要么通过 `disable_other_tracks` 静音。无法以降低的音量混合。
无关键帧动画	无法随时间改变叠加属性（例如，将图像从位置 A 移动到 B）。

约束

约束	详情
音频淡入淡出最长 5 秒	`fade_in_duration` 和 `fade_out_duration` 各自上限为 5 秒。
叠加层定位为绝对定位	叠加层使用时间轴起始点的绝对时间戳。重新排列内联片段不会移动其叠加层。
内联轨道仅支持视频	`add_inline()` 仅接受 `VideoAsset`。音频、图像和文本必须使用 `add_overlay()`。
叠加层与片段无绑定关系	叠加层被放置在固定的时间轴时间戳上。无法将叠加层附加到特定的内联片段以使其随之移动。

提示

非破坏性：时间轴从不修改源媒体。您可以使用相同的素材创建多个时间轴。
叠加层堆叠：多个叠加层可以在同一时间戳开始。音频叠加层会混合在一起；图像/文本叠加层按添加顺序分层叠加。
内联轨道仅支持 VideoAsset：add_inline() 仅接受 VideoAsset。对于 AudioAsset、ImageAsset 和 TextAsset，请使用 add_overlay()。
裁剪精度：start/end 在 VideoAsset 和 AudioAsset 上以秒为单位。
静音视频音频：在 AudioAsset 上设置 disable_other_tracks=True，以便在叠加音乐或旁白时静音原始视频音频。
淡入淡出限制：fade_in_duration 和 fade_out_duration 在 AudioAsset 上最长不超过 5 秒。
生成媒体：使用 coll.generate_music()、coll.generate_sound_effect()、coll.generate_voice() 和 coll.generate_image() 创建可立即用作时间轴素材的媒体。

16 KiB Raw Blame History Unescape Escape