Files
everything-claude-code/docs/zh-CN/skills/videodb/reference/use-cases.md
2026-03-13 17:45:44 +08:00

143 lines
4.0 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 使用场景
常见工作流及 VideoDB 所实现的功能。代码详情请参阅 [api-reference.md](api-reference.md)、[capture.md](capture.md)、[editor.md](editor.md) 和 [search.md](search.md)。
***
## 视频搜索与精彩片段
### 创建精彩集锦
上传长视频(会议演讲、讲座、会议录音),按主题("产品发布"、"问答环节"、"演示")搜索关键片段,并自动将匹配的片段汇编成可分享的精彩集锦。
### 构建可搜索视频库
批量上传视频到集合中,为语音内容建立索引以便搜索,然后在整个库中进行查询。即时在数百小时的内容中找到特定主题。
### 提取特定片段
搜索与查询匹配的片段("预算讨论"、"行动项"),并将每个匹配的片段提取为独立的剪辑,拥有自己的流媒体 URL。
***
## 视频增强
### 增添专业质感
获取原始素材并进行增强:
* 根据语音自动生成字幕
* 在特定时间戳添加自定义缩略图
* 背景音乐叠加
* 带有生成图像的开场/结尾序列
### AI 增强内容
将现有视频与生成式 AI 结合:
* 根据转录内容生成文本摘要
* 创建与视频时长匹配的背景音乐
* 生成标题卡和叠加图像
* 将所有元素混合成精美的最终输出
***
## 实时录制(桌面/会议)
### 带 AI 的屏幕 + 音频录制
同时捕获屏幕、麦克风和系统音频。实时获取:
* **实时转录** - 语音即时转文本
* **音频摘要** - 定期生成的 AI 讨论摘要
* **视觉索引** - AI 对屏幕活动的描述
### 带摘要功能的会议录制
录制会议并实时转录所有参与者的发言。获取包含关键讨论点、决策和行动项的定期摘要,实时交付。
### 屏幕活动追踪
通过 AI 生成的描述追踪屏幕活动:
* "用户正在 Google Sheets 中浏览电子表格"
* "用户切换到了包含 Python 文件的代码编辑器"
* "正在进行屏幕共享的视频通话"
### 会话后处理
录制结束后,录音将导出为永久视频。然后:
* 生成可搜索的转录稿
* 在录制内容中搜索特定主题
* 提取重要时刻的片段
* 通过流媒体 URL 或播放器链接分享
***
## 直播流智能处理RTSP/RTMP
### 连接外部流
从 RTSP/RTMP 源(安全摄像头、编码器、广播)摄取实时视频。实时处理和索引内容。
### 实时事件检测
定义要在直播流中检测的事件:
* "人员进入限制区域"
* "十字路口交通违规"
* "货架上可见产品"
当事件发生时,通过 WebSocket 或 webhook 获取警报。
### 直播流搜索
在已录制的直播流内容中搜索。从数小时的连续素材中找到特定时刻并生成剪辑。
***
## 内容审核与安全
### 自动化内容审查
使用 AI 索引视频场景并搜索有问题内容。标记包含暴力、不当内容或违反政策的视频。
### 脏话检测
检测并定位音频中的脏话。可选择在检测到的时间戳叠加哔声。
***
## 平台集成
### 社交媒体格式调整
为不同平台调整视频格式:
* 垂直9:16用于 TikTok、Reels、Shorts
* 方形1:1用于 Instagram 动态
* 横屏16:9用于 YouTube
### 为分发转码
针对不同的分发目标更改分辨率、比特率或质量。为网页、移动端或广播输出优化的流。
### 生成可分享链接
每次操作都会生成可播放的流媒体 URL。可嵌入网页播放器、直接分享或与现有平台集成。
***
## 工作流摘要
| 目标 | VideoDB 方法 |
|------|------------------|
| 在视频中查找片段 | 索引语音/场景 → 搜索 → 汇编剪辑 |
| 创建精彩集锦 | 搜索多个主题 → 构建时间线 → 生成流 |
| 添加字幕 | 索引语音 → 添加字幕叠加层 |
| 录制屏幕 + AI | 开始录制 → 运行 AI 流水线 → 导出视频 |
| 监控直播流 | 连接 RTSP → 索引场景 → 创建警报 |
| 为社交媒体调整格式 | 调整为目标宽高比 |
| 合并剪辑 | 使用多个素材构建时间线 → 生成流 |