# 使用场景 常见工作流及 VideoDB 所实现的功能。代码详情请参阅 [api-reference.md](api-reference.md)、[capture.md](capture.md)、[editor.md](editor.md) 和 [search.md](search.md)。 *** ## 视频搜索与精彩片段 ### 创建精彩集锦 上传长视频(会议演讲、讲座、会议录音),按主题("产品发布"、"问答环节"、"演示")搜索关键片段,并自动将匹配的片段汇编成可分享的精彩集锦。 ### 构建可搜索视频库 批量上传视频到集合中,为语音内容建立索引以便搜索,然后在整个库中进行查询。即时在数百小时的内容中找到特定主题。 ### 提取特定片段 搜索与查询匹配的片段("预算讨论"、"行动项"),并将每个匹配的片段提取为独立的剪辑,拥有自己的流媒体 URL。 *** ## 视频增强 ### 增添专业质感 获取原始素材并进行增强: * 根据语音自动生成字幕 * 在特定时间戳添加自定义缩略图 * 背景音乐叠加 * 带有生成图像的开场/结尾序列 ### AI 增强内容 将现有视频与生成式 AI 结合: * 根据转录内容生成文本摘要 * 创建与视频时长匹配的背景音乐 * 生成标题卡和叠加图像 * 将所有元素混合成精美的最终输出 *** ## 实时录制(桌面/会议) ### 带 AI 的屏幕 + 音频录制 同时捕获屏幕、麦克风和系统音频。实时获取: * **实时转录** - 语音即时转文本 * **音频摘要** - 定期生成的 AI 讨论摘要 * **视觉索引** - AI 对屏幕活动的描述 ### 带摘要功能的会议录制 录制会议并实时转录所有参与者的发言。获取包含关键讨论点、决策和行动项的定期摘要,实时交付。 ### 屏幕活动追踪 通过 AI 生成的描述追踪屏幕活动: * "用户正在 Google Sheets 中浏览电子表格" * "用户切换到了包含 Python 文件的代码编辑器" * "正在进行屏幕共享的视频通话" ### 会话后处理 录制结束后,录音将导出为永久视频。然后: * 生成可搜索的转录稿 * 在录制内容中搜索特定主题 * 提取重要时刻的片段 * 通过流媒体 URL 或播放器链接分享 *** ## 直播流智能处理(RTSP/RTMP) ### 连接外部流 从 RTSP/RTMP 源(安全摄像头、编码器、广播)摄取实时视频。实时处理和索引内容。 ### 实时事件检测 定义要在直播流中检测的事件: * "人员进入限制区域" * "十字路口交通违规" * "货架上可见产品" 当事件发生时,通过 WebSocket 或 webhook 获取警报。 ### 直播流搜索 在已录制的直播流内容中搜索。从数小时的连续素材中找到特定时刻并生成剪辑。 *** ## 内容审核与安全 ### 自动化内容审查 使用 AI 索引视频场景并搜索有问题内容。标记包含暴力、不当内容或违反政策的视频。 ### 脏话检测 检测并定位音频中的脏话。可选择在检测到的时间戳叠加哔声。 *** ## 平台集成 ### 社交媒体格式调整 为不同平台调整视频格式: * 垂直(9:16)用于 TikTok、Reels、Shorts * 方形(1:1)用于 Instagram 动态 * 横屏(16:9)用于 YouTube ### 为分发转码 针对不同的分发目标更改分辨率、比特率或质量。为网页、移动端或广播输出优化的流。 ### 生成可分享链接 每次操作都会生成可播放的流媒体 URL。可嵌入网页播放器、直接分享或与现有平台集成。 *** ## 工作流摘要 | 目标 | VideoDB 方法 | |------|------------------| | 在视频中查找片段 | 索引语音/场景 → 搜索 → 汇编剪辑 | | 创建精彩集锦 | 搜索多个主题 → 构建时间线 → 生成流 | | 添加字幕 | 索引语音 → 添加字幕叠加层 | | 录制屏幕 + AI | 开始录制 → 运行 AI 流水线 → 导出视频 | | 监控直播流 | 连接 RTSP → 索引场景 → 创建警报 | | 为社交媒体调整格式 | 调整为目标宽高比 | | 合并剪辑 | 使用多个素材构建时间线 → 生成流 |