谷歌Imagen 4预览指南 | AI生成和翻译
要使用 Google Imagen 4 Preview 0606,您需要通过 Google 的 Vertex AI 平台访问,因为这是一个专为文生图设计的生成式 AI 预览服务。以下是基于现有信息的逐步指南:
如何使用 Google Imagen 4 Preview 0606
- 访问 Vertex AI:
- 平台:Imagen 4 Preview 0606 可在 Google Cloud 的 Vertex AI 上使用。您需要拥有 Google Cloud 账户才能开始。
- 注册:如果没有账户,请在 cloud.google.com 注册并设置项目。请确保启用计费,因为这是可能产生费用的预览服务(定价详情可在 Vertex AI 定价页面的 Imagen 部分找到)。
- 导航至 Vertex AI:登录后,前往 Google Cloud Console 中的 Vertex AI 部分,找到生成式 AI 工具。
- 设置环境:
- 身份验证:使用 Google Cloud 凭据验证您的账户。您可以使用以下命令生成访问令牌:
gcloud auth print-access-token - 项目和位置:设置您的 Google Cloud 项目 ID 和位置(例如
us-central1)。示例:export GOOGLE_CLOUD_PROJECT=your-project-id export GOOGLE_CLOUD_LOCATION=us-central1
- 身份验证:使用 Google Cloud 凭据验证您的账户。您可以使用以下命令生成访问令牌:
- 使用 Imagen 4 模型:
- API 访问:Imagen 4 Preview 0606 可通过 Vertex AI API 访问。使用模型端点
imagen-4.0-generate-preview-06-06。您可以使用 cURL 或 Google Gen AI SDK for Python 以编程方式与其交互。 - cURL 请求示例:
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json; charset=utf-8" \ "https://${GOOGLE_CLOUD_LOCATION}-aiplatform.googleapis.com/v1/projects/${GOOGLE_CLOUD_PROJECT}/locations/${GOOGLE_CLOUD_LOCATION}/publishers/google/models/imagen-4.0-generate-preview-06-06:predict" \ -d '{"instances": [{"prompt": "A cat reading a book"}], "parameters": {"sampleCount": 1}}' - Python SDK 示例:
from google import genai from google.genai.types import GenerateImagesConfig client = genai.Client() image = client.models.generate_images( model="imagen-4.0-generate-preview-06-06", prompt="A dog reading a newspaper", config=GenerateImagesConfig(image_size="2K") ) image.generated_images[0].image.save("output-image.png") print(f"Created output image using {len(image.generated_images[0].image.image_bytes)} bytes")
- API 访问:Imagen 4 Preview 0606 可通过 Vertex AI API 访问。使用模型端点
- 构建有效提示:
- 探索变体:
- 审查输出和安全功能:
- 替代平台:
- Imagen 4 也可在第三方平台上使用,如 Replicate、fal.ai 或 AI/ML API,这些平台可能提供更简单的界面或沙盒环境用于测试。例如:
- Replicate:使用提示如“A serene mountain landscape at sunset, hyperrealistic style.”运行 Imagen 4。请查阅 Replicate 的文档以了解 API 密钥和使用方法。
- fal.ai:使用他们的 API 发出请求,例如:
const result = await fal.subscribe("fal-ai/imagen4/preview", { input: { prompt: "A serene mountain landscape at sunset, hyperrealistic style" } }); console.log(result.images[0].url);定价各不相同(例如,Standard 为 $0.05/图像,Fast 为 $0.04/图像,Ultra 为 $0.06/图像)。
- Gemini 应用或 Google Workspace:Imagen 4 已集成到 Gemini 应用、Google Slides、Docs 和 Vids 中,可直接在工作流中生成图像。例如,在 Google Docs 中,您可以生成图像以说明文档。
- Imagen 4 也可在第三方平台上使用,如 Replicate、fal.ai 或 AI/ML API,这些平台可能提供更简单的界面或沙盒环境用于测试。例如:
- 测试和迭代:
补充说明
- 定价:请查看 Vertex AI 定价页面了解 Imagen 4 的成本(例如,Standard 为 $0.04/图像,Ultra 为 $0.06/图像)。
- 限制:Imagen 4 可能难以处理模糊提示、小面孔或完美居中的构图。使用清晰、结构化的提示以获得最佳效果。
- 可用性:作为预览服务,功能和支持可能会变化。请查看 Google Cloud 的发布阶段说明以获取更新。
如需详细文档,请访问 Vertex AI Imagen 页面 或 Google Developers Blog。对于 API 访问,请参阅 x.ai/api 以获取通用 AI API 指南,但具体的 Imagen 4 详细信息在 Google Cloud 上。
如果您在特定平台或使用案例上需要帮助,请告诉我!