Prompt Engineering w praktyce · Model-specific quirks

Gemini quirks: grounding, multimodal, caching, task-aware embeddings

Model-specific quirks

Wprowadzenie

Lekcja o specyfice Google Gemini i Vertex AI: system_instruction jako oddzielne pole zamiast roli, grounding z Google Search z compliance, multimodalne limity (video 1fps, audio 32kHz), safety_settings z czterema kategoriami, explicit context caching, AI Studio vs Vertex AI, function calling z OpenAPI 3.0, JSON mode z response_schema, narzędzie code_execution, struktura odpowiedzi candidates z polem finishReason (w tym RECITATION), gemini-2.0-flash-thinking z widocznym reasoningiem, streaming kumulatywny, tokenizer SentencePiece, 2M context i degradacja NIAH, generation_config jako nested object z polem top_k, embeddingi z task_type, model versioning (-002 aliasy), kody błędów, Batch API z 50% rabatem, Live API multimodal WebSocket, supervised fine-tuning na Vertex, Model Garden z third-party modelami, Vertex grounding z Search/Maps/własnymi danymi oraz enterprise compliance (IAM, VPC, CMEK, audit logs, CMEK, BAA).