mirror of
https://github.com/affaan-m/everything-claude-code.git
synced 2026-04-04 16:23:31 +08:00
143 lines
4.0 KiB
Markdown
143 lines
4.0 KiB
Markdown
# 使用场景
|
||
|
||
常见工作流及 VideoDB 所实现的功能。代码详情请参阅 [api-reference.md](api-reference.md)、[capture.md](capture.md)、[editor.md](editor.md) 和 [search.md](search.md)。
|
||
|
||
***
|
||
|
||
## 视频搜索与精彩片段
|
||
|
||
### 创建精彩集锦
|
||
|
||
上传长视频(会议演讲、讲座、会议录音),按主题("产品发布"、"问答环节"、"演示")搜索关键片段,并自动将匹配的片段汇编成可分享的精彩集锦。
|
||
|
||
### 构建可搜索视频库
|
||
|
||
批量上传视频到集合中,为语音内容建立索引以便搜索,然后在整个库中进行查询。即时在数百小时的内容中找到特定主题。
|
||
|
||
### 提取特定片段
|
||
|
||
搜索与查询匹配的片段("预算讨论"、"行动项"),并将每个匹配的片段提取为独立的剪辑,拥有自己的流媒体 URL。
|
||
|
||
***
|
||
|
||
## 视频增强
|
||
|
||
### 增添专业质感
|
||
|
||
获取原始素材并进行增强:
|
||
|
||
* 根据语音自动生成字幕
|
||
* 在特定时间戳添加自定义缩略图
|
||
* 背景音乐叠加
|
||
* 带有生成图像的开场/结尾序列
|
||
|
||
### AI 增强内容
|
||
|
||
将现有视频与生成式 AI 结合:
|
||
|
||
* 根据转录内容生成文本摘要
|
||
* 创建与视频时长匹配的背景音乐
|
||
* 生成标题卡和叠加图像
|
||
* 将所有元素混合成精美的最终输出
|
||
|
||
***
|
||
|
||
## 实时录制(桌面/会议)
|
||
|
||
### 带 AI 的屏幕 + 音频录制
|
||
|
||
同时捕获屏幕、麦克风和系统音频。实时获取:
|
||
|
||
* **实时转录** - 语音即时转文本
|
||
* **音频摘要** - 定期生成的 AI 讨论摘要
|
||
* **视觉索引** - AI 对屏幕活动的描述
|
||
|
||
### 带摘要功能的会议录制
|
||
|
||
录制会议并实时转录所有参与者的发言。获取包含关键讨论点、决策和行动项的定期摘要,实时交付。
|
||
|
||
### 屏幕活动追踪
|
||
|
||
通过 AI 生成的描述追踪屏幕活动:
|
||
|
||
* "用户正在 Google Sheets 中浏览电子表格"
|
||
* "用户切换到了包含 Python 文件的代码编辑器"
|
||
* "正在进行屏幕共享的视频通话"
|
||
|
||
### 会话后处理
|
||
|
||
录制结束后,录音将导出为永久视频。然后:
|
||
|
||
* 生成可搜索的转录稿
|
||
* 在录制内容中搜索特定主题
|
||
* 提取重要时刻的片段
|
||
* 通过流媒体 URL 或播放器链接分享
|
||
|
||
***
|
||
|
||
## 直播流智能处理(RTSP/RTMP)
|
||
|
||
### 连接外部流
|
||
|
||
从 RTSP/RTMP 源(安全摄像头、编码器、广播)摄取实时视频。实时处理和索引内容。
|
||
|
||
### 实时事件检测
|
||
|
||
定义要在直播流中检测的事件:
|
||
|
||
* "人员进入限制区域"
|
||
* "十字路口交通违规"
|
||
* "货架上可见产品"
|
||
|
||
当事件发生时,通过 WebSocket 或 webhook 获取警报。
|
||
|
||
### 直播流搜索
|
||
|
||
在已录制的直播流内容中搜索。从数小时的连续素材中找到特定时刻并生成剪辑。
|
||
|
||
***
|
||
|
||
## 内容审核与安全
|
||
|
||
### 自动化内容审查
|
||
|
||
使用 AI 索引视频场景并搜索有问题内容。标记包含暴力、不当内容或违反政策的视频。
|
||
|
||
### 脏话检测
|
||
|
||
检测并定位音频中的脏话。可选择在检测到的时间戳叠加哔声。
|
||
|
||
***
|
||
|
||
## 平台集成
|
||
|
||
### 社交媒体格式调整
|
||
|
||
为不同平台调整视频格式:
|
||
|
||
* 垂直(9:16)用于 TikTok、Reels、Shorts
|
||
* 方形(1:1)用于 Instagram 动态
|
||
* 横屏(16:9)用于 YouTube
|
||
|
||
### 为分发转码
|
||
|
||
针对不同的分发目标更改分辨率、比特率或质量。为网页、移动端或广播输出优化的流。
|
||
|
||
### 生成可分享链接
|
||
|
||
每次操作都会生成可播放的流媒体 URL。可嵌入网页播放器、直接分享或与现有平台集成。
|
||
|
||
***
|
||
|
||
## 工作流摘要
|
||
|
||
| 目标 | VideoDB 方法 |
|
||
|------|------------------|
|
||
| 在视频中查找片段 | 索引语音/场景 → 搜索 → 汇编剪辑 |
|
||
| 创建精彩集锦 | 搜索多个主题 → 构建时间线 → 生成流 |
|
||
| 添加字幕 | 索引语音 → 添加字幕叠加层 |
|
||
| 录制屏幕 + AI | 开始录制 → 运行 AI 流水线 → 导出视频 |
|
||
| 监控直播流 | 连接 RTSP → 索引场景 → 创建警报 |
|
||
| 为社交媒体调整格式 | 调整为目标宽高比 |
|
||
| 合并剪辑 | 使用多个素材构建时间线 → 生成流 |
|