feat(API): 集成 Gemini 图片生成能力

- 添加 Gemini 模型类型检测和初始化 - 实现图片生成请求处理逻辑 - 支持流式返回生成的图片数据 - 将生成的图片保存到数据库
2025-12-27 15:01:49 +08:00 · 2025-12-27 15:01:49 +08:00 · c72b4ce3e2
commit c72b4ce3e2
parent 4c43fb4471
1 changed files with 238 additions and 3 deletions
--- a/src/app/api/chat/route.ts
+++ b/src/app/api/chat/route.ts
@ -1,6 +1,6 @@
 import { NextResponse } from 'next/server';
 import { db } from '@/drizzle/db';
-import { conversations, messages, userSettings } from '@/drizzle/schema';
+import { conversations, messages, userSettings, type GeneratedImageData } from '@/drizzle/schema';
 import { eq } from 'drizzle-orm';
 import { nanoid } from 'nanoid';
 import { executeTool } from '@/services/tools';
@ -94,6 +94,19 @@ function isCodexModel(modelId: string): boolean {
  return modelId.startsWith('gpt-') && modelId.includes('codex');
 }

+// 判断是否为 Gemini 图片生成模型
+function isGeminiImageModel(modelId: string): boolean {
+  // 支持的图片生成模型列表
+  const imageModels = [
+    'gemini-2.0-flash-preview-image-generation',
+    'gemini-3-pro-image-preview',
+    'imagen-3.0-generate-002',
+  ];
+  return imageModels.some(model => modelId.includes(model)) ||
+         modelId.includes('image-generation') ||
+         modelId.includes('imagen');
+}
+
 // 规范化 URL（移除末尾斜杠，避免拼接时出现双斜杠）
 function normalizeBaseUrl(url: string): string {
  return url.replace(/\/+$/, '');
@ -359,6 +372,7 @@ export async function POST(request: Request) {
    // 判断使用的模型类型
    const useModel = model || conversation.model;
    const isCodex = isCodexModel(useModel);
+    const isGeminiImage = isGeminiImageModel(useModel);

    // 创建 SSE 响应
    const encoder = new TextEncoder();
@ -420,6 +434,7 @@ export async function POST(request: Request) {
          let totalInputTokens = 0;
          let totalOutputTokens = 0;
          let usedTools: string[] = []; // 收集使用过的工具名称
+          let generatedImages: GeneratedImageData[] = []; // Gemini 生成的图片

          // 如果有文档解析失败，将警告添加到内容开头
          if (documentParseErrors.length > 0) {
@ -433,13 +448,35 @@ export async function POST(request: Request) {
          }

          // 【重要】处理器选择优先级说明：
-          // 1. 首先检查 apiFormat === 'openai'：如果用户选择了 "OpenAI 兼容" 格式，
+          // 0. 首先检查 isGeminiImage：Gemini 图片生成模型有专门的处理逻辑
+          // 1. 然后检查 apiFormat === 'openai'：如果用户选择了 "OpenAI 兼容" 格式，
          //    则所有模型（包括 Codex 模型）都统一使用 /v1/chat/completions 端点
          //    这是因为第三方中转站通常只支持 OpenAI 兼容的 /v1/chat/completions 端点
          // 2. 然后检查 isCodex：如果是 Claude 原生格式 + Codex 模型，才使用 /v1/responses 端点
          // 3. 最后是普通的 Claude 原生格式，使用 /v1/messages 端点

-          if (apiFormat === 'openai') {
+          if (isGeminiImage) {
+            // ==================== Gemini 图片生成模型处理 ====================
+            // Gemini 图片生成模型使用专门的 Gemini API 端点
+            console.log('[API/chat] 使用 Gemini 图片生成模型:', useModel);
+            const result = await handleGeminiImageChat({
+              cchUrl,
+              apiKey: decryptedApiKey,
+              model: useModel,
+              systemPrompt,
+              temperature,
+              historyMessages,
+              message,
+              controller,
+              encoder,
+              images,
+            });
+
+            fullContent = result.fullContent;
+            generatedImages = result.generatedImages;
+            totalInputTokens = result.inputTokens;
+            totalOutputTokens = result.outputTokens;
+          } else if (apiFormat === 'openai') {
            // ==================== OpenAI 兼容格式处理 ====================
            // 当用户选择 "OpenAI 兼容" 时，无论什么模型都走这个分支
            // 第三方中转站统一使用 /v1/chat/completions 端点
@ -528,6 +565,7 @@ export async function POST(request: Request) {
            content: fullContent,
            thinkingContent: thinkingContent || null,
            usedTools: usedTools.length > 0 ? usedTools : null,
+            generatedImages: generatedImages.length > 0 ? generatedImages : null,
            inputTokens: totalInputTokens,
            outputTokens: totalOutputTokens,
            status: 'completed',
@ -1974,6 +2012,203 @@ async function handleOpenAICompatibleChat(params: OpenAICompatibleChatParams): P
  };
 }

+// ==================== Gemini 图片生成模型处理函数 ====================
+interface GeminiImageChatParams {
+  cchUrl: string;
+  apiKey: string;
+  model: string;
+  systemPrompt: string;
+  temperature: number;
+  historyMessages: { role: string; content: string }[];
+  message: string;
+  controller: ReadableStreamDefaultController;
+  encoder: TextEncoder;
+  // 用户上传的图片
+  images?: {
+    type: 'image';
+    media_type: string;
+    data: string;
+  }[];
+}
+
+async function handleGeminiImageChat(params: GeminiImageChatParams): Promise<{
+  fullContent: string;
+  generatedImages: GeneratedImageData[];
+  inputTokens: number;
+  outputTokens: number;
+}> {
+  const {
+    cchUrl,
+    apiKey,
+    model,
+    systemPrompt,
+    temperature,
+    historyMessages,
+    message,
+    controller,
+    encoder,
+    images,
+  } = params;
+
+  // 创建安全的 stream 写入器
+  const safeWriter = createSafeStreamWriter(controller, encoder);
+
+  // 发送生成开始事件
+  safeWriter.write({
+    type: 'image_generation_start',
+    model,
+  });
+
+  // 构建 Gemini API 请求内容
+  // Gemini 使用 contents 数组格式
+  const contents: Array<{
+    role: 'user' | 'model';
+    parts: Array<{ text?: string; inlineData?: { mimeType: string; data: string } }>;
+  }> = [];
+
+  // 添加历史消息
+  for (const msg of historyMessages) {
+    if (msg.content && msg.content.trim() !== '') {
+      contents.push({
+        role: msg.role === 'assistant' ? 'model' : 'user',
+        parts: [{ text: msg.content }],
+      });
+    }
+  }
+
+  // 构建当前用户消息（支持多模态）
+  const currentParts: Array<{ text?: string; inlineData?: { mimeType: string; data: string } }> = [];
+
+  // 如果有图片，先添加图片
+  if (images && images.length > 0) {
+    for (const img of images) {
+      currentParts.push({
+        inlineData: {
+          mimeType: img.media_type,
+          data: img.data,
+        },
+      });
+    }
+  }
+
+  // 添加文本消息
+  if (message) {
+    currentParts.push({ text: message });
+  }
+
+  contents.push({
+    role: 'user',
+    parts: currentParts,
+  });
+
+  // 构建请求体
+  const requestBody = {
+    contents,
+    systemInstruction: systemPrompt ? { parts: [{ text: systemPrompt }] } : undefined,
+    generationConfig: {
+      temperature,
+      responseModalities: ['TEXT', 'IMAGE'], // 请求同时返回文本和图片
+    },
+  };
+
+  console.log('[handleGeminiImageChat] Sending request to Gemini API:', {
+    model,
+    contentsCount: contents.length,
+    hasImages: images && images.length > 0,
+  });
+
+  // 发送请求到 Gemini API
+  // Gemini API 端点格式: /v1beta/models/{model}:generateContent
+  const geminiEndpoint = `${normalizeBaseUrl(cchUrl)}/v1beta/models/${model}:generateContent`;
+
+  const response = await fetch(geminiEndpoint, {
+    method: 'POST',
+    headers: {
+      'Content-Type': 'application/json',
+      'x-goog-api-key': apiKey,
+    },
+    body: JSON.stringify(requestBody),
+  });
+
+  if (!response.ok) {
+    const errorText = await response.text();
+    throw new Error(`Gemini API error: ${response.status} - ${errorText}`);
+  }
+
+  // 解析 Gemini 响应
+  const geminiResponse = await response.json();
+
+  let fullContent = '';
+  const generatedImages: GeneratedImageData[] = [];
+  let totalInputTokens = 0;
+  let totalOutputTokens = 0;
+
+  // 提取 usage 信息
+  if (geminiResponse.usageMetadata) {
+    totalInputTokens = geminiResponse.usageMetadata.promptTokenCount || 0;
+    totalOutputTokens = geminiResponse.usageMetadata.candidatesTokenCount || 0;
+  }
+
+  // 解析候选响应
+  if (geminiResponse.candidates && geminiResponse.candidates.length > 0) {
+    const candidate = geminiResponse.candidates[0];
+
+    if (candidate.content && candidate.content.parts) {
+      for (const part of candidate.content.parts) {
+        // 处理文本内容
+        if (part.text) {
+          fullContent += part.text;
+          safeWriter.write({
+            type: 'text',
+            content: part.text,
+          });
+        }
+
+        // 处理生成的图片
+        if (part.inlineData) {
+          const imageData: GeneratedImageData = {
+            mimeType: part.inlineData.mimeType,
+            data: part.inlineData.data,
+          };
+          generatedImages.push(imageData);
+
+          // 发送生成图片事件
+          safeWriter.write({
+            type: 'generated_image',
+            image: imageData,
+            index: generatedImages.length - 1,
+          });
+
+          console.log('[handleGeminiImageChat] Generated image:', {
+            mimeType: imageData.mimeType,
+            dataLength: imageData.data.length,
+          });
+        }
+      }
+    }
+  }
+
+  // 发送生成完成事件
+  safeWriter.write({
+    type: 'image_generation_complete',
+    imageCount: generatedImages.length,
+  });
+
+  console.log('[handleGeminiImageChat] Response processed:', {
+    textLength: fullContent.length,
+    imageCount: generatedImages.length,
+    inputTokens: totalInputTokens,
+    outputTokens: totalOutputTokens,
+  });
+
+  return {
+    fullContent,
+    generatedImages,
+    inputTokens: totalInputTokens,
+    outputTokens: totalOutputTokens,
+  };
+}
+
 // 构建 Claude 工具定义
 function buildClaudeToolDefinitions(toolIds: string[]) {
  const toolMap: Record<string, object> = {