谷歌生成式AI图像配置 | AI生成和翻译

Home 2025.08

以下是一个快速概览:Google Gen AI(Gemini/Imagen)Python SDK 不支持 image_size 参数。您需要选择模型变体(每个变体都有隐含的默认分辨率),控制宽高比,并且如果需要更高像素数量,可以应用放大功能。您还可以调整压缩输出格式,以及常见的“图像数量”、“负面提示”、“安全”和“人物”设置。

模型变体

您需要选择模型名称——每个变体都有其默认分辨率和性能特征:

默认分辨率

默认情况下,这些模型的方形(“1:1”)输出为 1024 × 1024 像素。如果您需要更小的文件,可以在本地进行下采样;如果您需要更高的分辨率,请参阅下面的放大部分。(raymondcamden.com

宽高比

与其指定绝对尺寸,不如在您的 GenerateImagesConfig 中使用 aspect_ratio 字段。支持的值包括:

您可以在社区教程中找到相同的列表:

放大

如果您需要真正的“2K”或“4K”输出,请调用放大模式:

from google.genai import types
config = types.GenerateImagesConfig(
    mode="upscale",
    upscale_config=types.UpscaleConfig(upscale_factor="x2"),
)

压缩与格式

其他配置选项

其他所有选项都在 GenerateImagesConfig 中:

config = types.GenerateImagesConfig(
    number_of_images=1,           # 生成多少张图像
    seed=1234,                    # 用于确定性输出
    enhance_prompt=True,          # 基于 LLM 的提示词重写
    negative_prompt="排除狗",
    language="en",
    safety_filter_level="block_medium_and_above",  
    person_generation="allow_adult",
)

这些选项让您可以控制随机性、提示词增强、安全阈值以及模型是否可以包含人物。(Google Cloud

建议

移除您的 image_size="2K" 行——没有这样的标志。相反:

  1. 选择合适的模型以平衡速度与质量。
  2. 使用 aspect_ratio 来控制构图。
  3. 如果您确实需要更高的像素数量,请在基础分辨率下生成图像,然后应用内置的放大功能(“x2”或“x4”)。
  4. 调整 compression_quality 或在本地进行下采样以获得更小的文件。

通过这些控制选项,您可以实现方形或电影般的构图,小尺寸或高分辨率输出,而无需使用不受支持的 image_size 参数。


Back Donate