mirror of
https://github.com/affaan-m/everything-claude-code.git
synced 2026-04-12 04:33:29 +08:00
* docs(zh-CN): sync Chinese docs with latest upstream changes * update --------- Co-authored-by: neo <neo.dowithless@gmail.com>
245 lines
7.8 KiB
Markdown
245 lines
7.8 KiB
Markdown
---
|
||
name: foundation-models-on-device
|
||
description: 苹果FoundationModels框架用于设备上的LLM——文本生成、使用@Generable进行引导生成、工具调用,以及在iOS 26+中的快照流。
|
||
---
|
||
|
||
# FoundationModels:设备端 LLM(iOS 26)
|
||
|
||
使用 FoundationModels 框架将苹果的设备端语言模型集成到应用中的模式。涵盖文本生成、使用 `@Generable` 的结构化输出、自定义工具调用以及快照流式传输——全部在设备端运行,以保护隐私并支持离线使用。
|
||
|
||
## 何时启用
|
||
|
||
* 使用 Apple Intelligence 在设备端构建 AI 功能
|
||
* 无需依赖云端即可生成或总结文本
|
||
* 从自然语言输入中提取结构化数据
|
||
* 为特定领域的 AI 操作实现自定义工具调用
|
||
* 流式传输结构化响应以实现实时 UI 更新
|
||
* 需要保护隐私的 AI(数据不离开设备)
|
||
|
||
## 核心模式 — 可用性检查
|
||
|
||
在创建会话之前,始终检查模型可用性:
|
||
|
||
```swift
|
||
struct GenerativeView: View {
|
||
private var model = SystemLanguageModel.default
|
||
|
||
var body: some View {
|
||
switch model.availability {
|
||
case .available:
|
||
ContentView()
|
||
case .unavailable(.deviceNotEligible):
|
||
Text("Device not eligible for Apple Intelligence")
|
||
case .unavailable(.appleIntelligenceNotEnabled):
|
||
Text("Please enable Apple Intelligence in Settings")
|
||
case .unavailable(.modelNotReady):
|
||
Text("Model is downloading or not ready")
|
||
case .unavailable(let other):
|
||
Text("Model unavailable: \(other)")
|
||
}
|
||
}
|
||
}
|
||
```
|
||
|
||
## 核心模式 — 基础会话
|
||
|
||
```swift
|
||
// Single-turn: create a new session each time
|
||
let session = LanguageModelSession()
|
||
let response = try await session.respond(to: "What's a good month to visit Paris?")
|
||
print(response.content)
|
||
|
||
// Multi-turn: reuse session for conversation context
|
||
let session = LanguageModelSession(instructions: """
|
||
You are a cooking assistant.
|
||
Provide recipe suggestions based on ingredients.
|
||
Keep suggestions brief and practical.
|
||
""")
|
||
|
||
let first = try await session.respond(to: "I have chicken and rice")
|
||
let followUp = try await session.respond(to: "What about a vegetarian option?")
|
||
```
|
||
|
||
指令的关键点:
|
||
|
||
* 定义模型的角色("你是一位导师")
|
||
* 指定要做什么("帮助提取日历事件")
|
||
* 设置风格偏好("尽可能简短地回答")
|
||
* 添加安全措施("对于危险请求,回复'我无法提供帮助'")
|
||
|
||
## 核心模式 — 使用 @Generable 进行引导式生成
|
||
|
||
生成结构化的 Swift 类型,而不是原始字符串:
|
||
|
||
### 1. 定义可生成类型
|
||
|
||
```swift
|
||
@Generable(description: "Basic profile information about a cat")
|
||
struct CatProfile {
|
||
var name: String
|
||
|
||
@Guide(description: "The age of the cat", .range(0...20))
|
||
var age: Int
|
||
|
||
@Guide(description: "A one sentence profile about the cat's personality")
|
||
var profile: String
|
||
}
|
||
```
|
||
|
||
### 2. 请求结构化输出
|
||
|
||
```swift
|
||
let response = try await session.respond(
|
||
to: "Generate a cute rescue cat",
|
||
generating: CatProfile.self
|
||
)
|
||
|
||
// Access structured fields directly
|
||
print("Name: \(response.content.name)")
|
||
print("Age: \(response.content.age)")
|
||
print("Profile: \(response.content.profile)")
|
||
```
|
||
|
||
### 支持的 @Guide 约束
|
||
|
||
* `.range(0...20)` — 数值范围
|
||
* `.count(3)` — 数组元素数量
|
||
* `description:` — 生成的语义引导
|
||
|
||
## 核心模式 — 工具调用
|
||
|
||
让模型调用自定义代码以执行特定领域的任务:
|
||
|
||
### 1. 定义工具
|
||
|
||
```swift
|
||
struct RecipeSearchTool: Tool {
|
||
let name = "recipe_search"
|
||
let description = "Search for recipes matching a given term and return a list of results."
|
||
|
||
@Generable
|
||
struct Arguments {
|
||
var searchTerm: String
|
||
var numberOfResults: Int
|
||
}
|
||
|
||
func call(arguments: Arguments) async throws -> ToolOutput {
|
||
let recipes = await searchRecipes(
|
||
term: arguments.searchTerm,
|
||
limit: arguments.numberOfResults
|
||
)
|
||
return .string(recipes.map { "- \($0.name): \($0.description)" }.joined(separator: "\n"))
|
||
}
|
||
}
|
||
```
|
||
|
||
### 2. 创建带工具的会话
|
||
|
||
```swift
|
||
let session = LanguageModelSession(tools: [RecipeSearchTool()])
|
||
let response = try await session.respond(to: "Find me some pasta recipes")
|
||
```
|
||
|
||
### 3. 处理工具错误
|
||
|
||
```swift
|
||
do {
|
||
let answer = try await session.respond(to: "Find a recipe for tomato soup.")
|
||
} catch let error as LanguageModelSession.ToolCallError {
|
||
print(error.tool.name)
|
||
if case .databaseIsEmpty = error.underlyingError as? RecipeSearchToolError {
|
||
// Handle specific tool error
|
||
}
|
||
}
|
||
```
|
||
|
||
## 核心模式 — 快照流式传输
|
||
|
||
使用 `PartiallyGenerated` 类型为实时 UI 流式传输结构化响应:
|
||
|
||
```swift
|
||
@Generable
|
||
struct TripIdeas {
|
||
@Guide(description: "Ideas for upcoming trips")
|
||
var ideas: [String]
|
||
}
|
||
|
||
let stream = session.streamResponse(
|
||
to: "What are some exciting trip ideas?",
|
||
generating: TripIdeas.self
|
||
)
|
||
|
||
for try await partial in stream {
|
||
// partial: TripIdeas.PartiallyGenerated (all properties Optional)
|
||
print(partial)
|
||
}
|
||
```
|
||
|
||
### SwiftUI 集成
|
||
|
||
```swift
|
||
@State private var partialResult: TripIdeas.PartiallyGenerated?
|
||
@State private var errorMessage: String?
|
||
|
||
var body: some View {
|
||
List {
|
||
ForEach(partialResult?.ideas ?? [], id: \.self) { idea in
|
||
Text(idea)
|
||
}
|
||
}
|
||
.overlay {
|
||
if let errorMessage { Text(errorMessage).foregroundStyle(.red) }
|
||
}
|
||
.task {
|
||
do {
|
||
let stream = session.streamResponse(to: prompt, generating: TripIdeas.self)
|
||
for try await partial in stream {
|
||
partialResult = partial
|
||
}
|
||
} catch {
|
||
errorMessage = error.localizedDescription
|
||
}
|
||
}
|
||
}
|
||
```
|
||
|
||
## 关键设计决策
|
||
|
||
| 决策 | 理由 |
|
||
|----------|-----------|
|
||
| 设备端执行 | 隐私性——数据不离开设备;支持离线工作 |
|
||
| 4,096 个令牌限制 | 设备端模型约束;跨会话分块处理大数据 |
|
||
| 快照流式传输(非增量) | 对结构化输出友好;每个快照都是一个完整的部分状态 |
|
||
| `@Generable` 宏 | 为结构化生成提供编译时安全性;自动生成 `PartiallyGenerated` 类型 |
|
||
| 每个会话单次请求 | `isResponding` 防止并发请求;如有需要,创建多个会话 |
|
||
| `response.content`(而非 `.output`) | 正确的 API——始终通过 `.content` 属性访问结果 |
|
||
|
||
## 最佳实践
|
||
|
||
* 在创建会话之前**始终检查 `model.availability`**——处理所有不可用的情况
|
||
* **使用 `instructions`** 来引导模型行为——它们的优先级高于提示词
|
||
* 在发送新请求之前**检查 `isResponding`**——会话一次处理一个请求
|
||
* 通过 `response.content` **访问结果**——而不是 `.output`
|
||
* **将大型输入分块处理**——4,096 个令牌的限制适用于指令、提示词和输出的总和
|
||
* 对于结构化输出**使用 `@Generable`**——比解析原始字符串提供更强的保证
|
||
* **使用 `GenerationOptions(temperature:)`** 来调整创造力(值越高越有创意)
|
||
* **使用 Instruments 进行监控**——使用 Xcode Instruments 来分析请求性能
|
||
|
||
## 应避免的反模式
|
||
|
||
* 未先检查 `model.availability` 就创建会话
|
||
* 发送超过 4,096 个令牌上下文窗口的输入
|
||
* 尝试在单个会话上进行并发请求
|
||
* 使用 `.output` 而不是 `.content` 来访问响应数据
|
||
* 当 `@Generable` 结构化输出可行时,却去解析原始字符串响应
|
||
* 在单个提示词中构建复杂的多步逻辑——将其拆分为多个聚焦的提示词
|
||
* 假设模型始终可用——设备的资格和设置各不相同
|
||
|
||
## 何时使用
|
||
|
||
* 为注重隐私的应用进行设备端文本生成
|
||
* 从用户输入(表单、自然语言命令)中提取结构化数据
|
||
* 必须离线工作的 AI 辅助功能
|
||
* 逐步显示生成内容的流式 UI
|
||
* 通过工具调用(搜索、计算、查找)执行特定领域的 AI 操作
|