Prompt Engineering w praktyce · Ewaluacja i iteracja promptów
Test sets i golden datasets
Ewaluacja i iteracja promptów
Wprowadzenie
Aby porównywać prompty obiektywnie, potrzebujesz powtarzalnego zestawu testów. Jak budować dataset, ile przykładów, jakie pułapki.