Platforma AIAI-natywny

Amazon SageMaker AI

Zarządzana platforma MLOps i generatywnej AI od AWS do budowy, treningu i wdrażania modeli ML oraz aplikacji opartych o foundation models.

Producent:AmazonChmura zarządzana · Bezserwerowy · HybrydowySOC 2 Type II · HIPAA · GDPRWydano:1 lis 2024

Data ResidencySovereign Cloud

Odwiedź platformę

Wspierane modele

4SLM/LLM

SDK / Języki

4python, javascript…

Uptime SLA

99.9%

Robotics-Ready

✓

Opis

Amazon SageMaker AI to w pełni zarządzana platforma MLOps i generatywnej AI od Amazon Web Services, obejmująca cały cykl życia modelu uczenia maszynowego — od przygotowania danych, przez eksperymenty i trening, po wdrożenie, monitorowanie i automatyzację pipeline’ów. Platforma jest integralną częścią rodziny Amazon SageMaker, która obejmuje też SageMaker Unified Studio, SageMaker Lakehouse i SageMaker Catalog.

Kluczowe komponenty

SageMaker Studio to zintegrowane środowisko IDE oparte na przeglądarce, które łączy notebooki, eksperymenty, debugger, profiler i zarządzanie modelami w jednym interfejsie. SageMaker JumpStart udostępnia katalog gotowych foundation models — w tym modele z rodzin Llama, Mistral, DeepSeek, Stable Diffusion — umożliwiając ich jednoklikalnie wdrażanie i fine-tuning bez konieczności pisania infrastruktury. SageMaker Pipelines to natywny orkiestrator pipeline’ów ML z integracją CI/CD, wersjonowaniem artefaktów i śledzeniem lineage. Model Registry umożliwia zarządzanie wersjami modeli z przepływami zatwierdzania przed wdrożeniem na produkcję.

Trening i fine-tuning

SageMaker obsługuje trening rozproszony na klastrach GPU/Trainium z automatycznym podziałem modelu i danych (SageMaker Distributed Training). Wbudowane algorytmy oraz wsparcie dla frameworków TensorFlow, PyTorch, MXNet i scikit-learn pozwalają uruchamiać zadania treningowe na zarządzanej infrastrukturze bez konfiguracji serwera. SageMaker Clarify wykrywa bias w danych treningowych i wyjaśnia predykcje modeli za pomocą wartości SHAP.

Wdrożenie i serwowanie modeli

Platforma oferuje cztery tryby hostingu: real-time endpoints (niskie opóźnienie), serverless inference (bez zarządzania infrastrukturą), asynchronous inference (duże payloady) oraz batch transform (przetwarzanie offline na dużych zbiorach danych). Autoskalowanie i wdrożenie w VPC zapewniają izolację sieciową i elastyczność kosztową.

Feature Store i zarządzanie danymi

SageMaker Feature Store zapewnia scentralizowane przechowywanie cech ML z obsługą zarówno online serving (niskie opóźnienie dla inferencji) jak i offline storage (historyczne dane treningowe) oraz ingestion w trybie streaming. Data Wrangler umożliwia wizualne przygotowanie i transformację danych z ponad 40 źródeł, w tym Amazon S3, Redshift, Athena i AWS Glue, bez pisania kodu.

Bezpieczeństwo i zgodność

SageMaker AI posiada certyfikaty FedRAMP High, FedRAMP Moderate, HIPAA, SOC 2 Type II, PCI DSS, GDPR oraz DoD Impact Level 5. Platforma wspiera izolację VPC, szyfrowanie danych w spoczynku i tranzycie, zarządzanie tożsamością przez AWS IAM Identity Center (z federacją SAML 2.0, OIDC, Okta i Microsoft Entra ID) oraz pełne logi audytowe w AWS CloudTrail. Zasoby można dzielić na projekty i użytkowników z granularną kontrolą kosztów i alertami.

Cennik

SageMaker AI rozlicza się w modelu pay-as-you-go: opłaty naliczane są za czas działania instancji treningowych i endpointów (per sekunda), ilość przetworzonych danych oraz opcjonalnie za provisioned throughput dla foundation models w JumpStart. Dostępne są limity kosztów per projekt i per użytkownik z alertami. Platforma oferuje poziomy wsparcia Standard i Enterprise 24/7 z SLA na poziomie 99,9%.

MLOps Lifecycle

13/17 wspieranych

Rejestr modeli

Wersjonowanie — wersjonowanie artefaktów modelu

Przepływy zatwierdzania — przepływ zatwierdzania przed produkcją

Niezmienne artefakty — niezmienność zapisanych wersji

Śledzenie rodowodu — śledzenie powiązań danych i modeli

4 / 4 wspierane · brak niespełnionych

Magazyn cech

Serwowanie online — serwowanie cech w czasie rzeczywistym

Przechowywanie offline — przechowywanie cech dla treningu

Ingestia strumieniowa — ingestia strumieniowa (Kafka, Flink)

3 / 3 wspierane · brak niespełnionych

Zarządzanie promptami

Rejestr promptów — centralne repozytorium promptów

Wersjonowanie — wersjonowanie i historia promptów

Frameworki testowe — A/B testing i ewaluacja promptów

0 / 3 wspierane · 3 niespełnione ukryte

Monitoring

Wykrywanie dryftu danych — wykrywanie dryftu danych wejściowych

Wykrywanie dryftu koncepcyjnego — wykrywanie dryftu koncepcyjnego

Monitorowanie halucynacji — monitorowanie halucynacji LLM

Ewaluacja stronniczości — narzędzia do ewaluacji stronniczości

3 / 4 wspierane · 1 niespełnione ukryte

Human-in-the-Loop

Usługi etykietowania — narzędzia do etykietowania danych

RLHF — reinforcement learning from human feedback

Ręczne przesłonięcia — ręczne przełączanie decyzji modelu

3 / 3 wspierane · brak niespełnionych

Dane i wiedza

Zastosowania

Bezpieczeństwo

Ekosystem deweloperski

Języki SDK

PyPythonJSJavaScriptTSTypeScriptGoGo

Typ API

REST

Społeczność i zasoby

Biblioteka szablonów

Szybki start

Dokumentacja API

Samouczki

Cennik i model biznesowy

Zobacz pełny cennik

Modele cenowe

Płatność za użycie

Zarezerwowana przepustowość

Limity zasobów

Per projekt

Per użytkownik

Alerty kosztów

SLA i wsparcie

99.9%uptime SLA

StandardowyEnterprise 24/7

Amazon SageMaker AI

Opis

MLOps Lifecycle

Rejestr modeli

Magazyn cech

Zarządzanie promptami

Monitoring

Human-in-the-Loop

Dane i wiedza

Zastosowania

Bezpieczeństwo

Ekosystem deweloperski

Cennik i model biznesowy

Wspierane modele AI

Źródła

Opis

MLOps LifecycleiMLOps LifecyclePełny cykl życia modelu: rejestr, feature store, prompt management, monitoring i human-in-the-loop.

Rejestr modeli

Magazyn cech

Zarządzanie promptami

Monitoring

Human-in-the-Loop

Dane i wiedzaiZarządzanie danymi i wiedząKonektory danych, integracja z bazami wektorowymi, native vector search i mechanizmy zarządzania danymi (PII, provenance, dane syntetyczne).

ZastosowaniaiZastosowania AIDziedziny i scenariusze zastosowania, do których platforma jest najlepiej dopasowana – od RAG i fine-tuningu po zastosowania naukowe.

Architektura i mechanizmyiArchitektura i mechanizmyFundamenty architektoniczne i nowoczesne metody przetwarzania AI, które są natywnie wspierane lub wykorzystywane przez tę platformę.

BezpieczeństwoiBezpieczeństwo EnterpriseZestaw certyfikacji, kontroli dostępu oraz funkcji ochrony danych, kluczowych dla wdrożeń korporacyjnych i zachowania prywatności w chmurze.

Ekosystem deweloperskiiEkosystem DeweloperskiZasoby wspierające programistów: dostępne biblioteki SDK, wspierane języki programowania oraz funkcje infrastrukturalne i metody wdrażania modeli.

Cennik i model biznesowyiCennik i model biznesowyModele rozliczeń (usage-based, provisioned throughput), limity zasobów oraz parametry SLA (uptime, poziomy wsparcia).

Wspierane modele AI

ŹródłaiArchiwum DokumentacjiScentralizowana baza linków do oficjalnych źródeł, instrukcji technicznych, repozytoriów oraz notatek wydawniczych (release notes).

MLOps Lifecycle

Dane i wiedza

Zastosowania

Architektura i mechanizmy

Bezpieczeństwo

Ekosystem deweloperski

Cennik i model biznesowy

Źródła