Add files present in zh-CN but missing from ja-JP: - commands: claw, context-budget, devfleet, docs, projects, prompt-optimize, rules-distill (7 files) - skills: regex-vs-llm-structured-text, remotion-video-creation, repo-scan, research-ops, returns-reverse-logistics, rules-distill, rust-patterns, rust-testing, skill-comply, skill-stocktake, social-graph-ranker, swift-actor-persistence, swift-concurrency-6-2, swift-protocol-di-testing, swiftui-patterns, team-builder, terminal-ops, token-budget-advisor, ui-demo, unified-notifications-ops, video-editing, videodb (+reference/*), visa-doc-translate, workspace-surface-audit, x-api (37 files) Result: ja-JP now has 517 files vs zh-CN 412 files. zh-CN parity: 0 missing files (complete parity achieved).
6.6 KiB
ユースケース
VideoDBが実現する一般的なワークフローと機能。コードの詳細については api-reference.md、capture.md、editor.md、search.md を参照。
ビデオ検索とハイライト
ハイライトリールの作成
長いビデオ(会議講演、講義、カンファレンス録画)をアップロードし、トピック別(「製品発表」「Q&Aセッション」「デモ」)に主要なモーメントを検索し、一致するクリップを共有可能なハイライトリールに自動的にアセンブルする。
検索可能なビデオライブラリの構築
ビデオをコレクションに一括アップロードし、検索のために音声コンテンツをインデックス化し、ライブラリ全体でクエリを実行する。数百時間のコンテンツから特定のトピックを即座に見つける。
特定のクリップの抽出
クエリに一致するセグメントを検索し(「予算の議論」「アクションアイテム」)、各一致するセグメントを独自のストリームURLを持つ独立したクリップとして抽出する。
ビデオの強化
プロフェッショナルな仕上げを追加する
生の素材を取得して強化する:
- 音声に基づいて字幕を自動生成する
- 特定のタイムスタンプにカスタムサムネイルを追加する
- バックグラウンドミュージックオーバーレイ
- 生成された画像を使用したオープニング/エンディングシーケンス
AIで強化されたコンテンツ
既存のビデオと生成AIを組み合わせる:
- トランスクリプトコンテンツからテキストサマリーを生成する
- ビデオの長さに合わせたバックグラウンドミュージックを作成する
- タイトルカードとオーバーレイ画像を生成する
- すべての要素を磨き上げた最終出力にミックスする
リアルタイム録画(デスクトップ/会議)
AIによる画面+オーディオ録画
画面、マイク、システムオーディオを同時にキャプチャする。リアルタイムで取得:
- ライブ転写 - 音声を即座にテキストに変換
- オーディオサマリー - 定期的に生成されるAIによる議論サマリー
- ビジュアルインデックス - 画面アクティビティのAI説明
サマリー機能付き会議録画
会議を録画して全参加者の発言をリアルタイムで転写する。主要な議論のポイント、決定事項、アクションアイテムを含む定期的なサマリーをリアルタイムで受け取る。
画面アクティビティ追跡
AIが生成した説明で画面アクティビティを追跡する:
- 「ユーザーはGoogle Sheetsでスプレッドシートを閲覧しています」
- 「ユーザーはPythonファイルを含むコードエディターに切り替えました」
- 「画面共有付きのビデオ通話が進行中です」
セッション後の処理
録画が終わると、録音は永続的なビデオとしてエクスポートされる。その後:
- 検索可能なトランスクリプトを生成する
- 録画内の特定のトピックを検索する
- 重要なモーメントのクリップを抽出する
- ストリームURLまたはプレーヤーリンクで共有する
ライブストリームインテリジェンス(RTSP/RTMP)
外部ストリームへの接続
RTSPまたはRTMPソース(セキュリティカメラ、エンコーダー、ブロードキャスト)からライブビデオを取り込む。コンテンツをリアルタイムで処理してインデックス化する。
リアルタイムイベント検出
ライブストリームで検出するイベントを定義する:
- 「制限区域に人が入った」
- 「交差点での交通違反」
- 「棚に製品が見える」
イベントが発生したときにWebSocketまたはWebhook経由でアラートを受け取る。
ライブストリーム検索
録画されたライブストリームコンテンツ内を検索する。数時間の連続した素材から特定のモーメントを見つけてクリップを生成する。
コンテンツモデレーションとセキュリティ
自動化されたコンテンツレビュー
AIを使用してビデオシーンをインデックス化し、問題のあるコンテンツを検索する。暴力、不適切なコンテンツ、またはポリシー違反を含むビデオにフラグを立てる。
不適切な言葉の検出
オーディオ内の不適切な言葉を検出して特定する。検出されたタイムスタンプにビープ音をオーバーレイするオプションもある。
プラットフォーム統合
ソーシャルメディア向けフォーマット変換
異なるプラットフォーム向けにビデオのフォーマットを変換する:
- 縦型(9:16):TikTok、Reels、Shorts向け
- 正方形(1:1):Instagramフィード向け
- 横型(16:9):YouTube向け
配信のためのトランスコード
異なる配信ターゲットに向けて解像度、ビットレート、品質を変更する。Web、モバイル、ブロードキャスト出力に最適化されたストリーム。
共有可能なリンクの生成
すべての操作は再生可能なストリームURLを生成する。Webプレーヤーへの埋め込み、直接共有、または既存のプラットフォームとの統合が可能。
ワークフローのサマリー
| 目標 | VideoDBのアプローチ |
|---|---|
| ビデオ内のセグメントを見つける | 音声/シーンをインデックス化 → 検索 → クリップをアセンブル |
| ハイライトリールを作成する | 複数のトピックを検索 → タイムラインを構築 → ストリームを生成 |
| 字幕を追加する | 音声をインデックス化 → 字幕オーバーレイを追加 |
| 画面録画 + AI | 録画を開始 → AIパイプラインを実行 → ビデオをエクスポート |
| ライブストリームを監視する | RTSPに接続 → シーンをインデックス化 → アラートを作成 |
| ソーシャルメディア向けにフォーマット変換 | ターゲットのアスペクト比にリフレーム |
| クリップをマージする | 複数のアセットでタイムラインを構築 → ストリームを生成 |