rename folder to prompt_evaluations and update README

2024-09-04 17:06:50 -06:00
parent 8174d9d587
commit c2dd47ec9b
94 changed files with 8 additions and 11 deletions
--- a/prompt_evaluations/07_prompt_foo_custom_graders/README.md
+++ b/prompt_evaluations/07_prompt_foo_custom_graders/README.md
@@ -0,0 +1,8 @@
+To get started, set your ANTHROPIC_API_KEY environment variable
+
+Then run:
+```
+promptfoo eval
+```
+
+Afterwards, you can view the results by running `promptfoo view`
--- a/prompt_evaluations/07_prompt_foo_custom_graders/count.py
+++ b/prompt_evaluations/07_prompt_foo_custom_graders/count.py
@@ -0,0 +1,17 @@
+import re
+
+def get_assert(output, context):
+    topic = context["vars"]["topic"]
+    goal_count = int(context["vars"]["count"])
+    pattern = fr'(^|\s)\b{re.escape(topic)}\b'
+
+    actual_count = len(re.findall(pattern, output.lower()))
+
+    pass_result = goal_count == actual_count
+
+    result = {
+        "pass": pass_result,
+        "score": 1 if pass_result else 0,
+        "reason": f"Expected {topic} to appear {goal_count} times. Actual: {actual_count}",
+    }
+    return result
--- a/prompt_evaluations/07_prompt_foo_custom_graders/images/final_eval.png
+++ b/prompt_evaluations/07_prompt_foo_custom_graders/images/final_eval.png
--- a/prompt_evaluations/07_prompt_foo_custom_graders/images/final_view.png
+++ b/prompt_evaluations/07_prompt_foo_custom_graders/images/final_view.png
--- a/prompt_evaluations/07_prompt_foo_custom_graders/images/initial_eval_output.png
+++ b/prompt_evaluations/07_prompt_foo_custom_graders/images/initial_eval_output.png
--- a/prompt_evaluations/07_prompt_foo_custom_graders/images/single_row.png
+++ b/prompt_evaluations/07_prompt_foo_custom_graders/images/single_row.png
--- a/prompt_evaluations/07_prompt_foo_custom_graders/images/tweezers_haiku_closeup.png
+++ b/prompt_evaluations/07_prompt_foo_custom_graders/images/tweezers_haiku_closeup.png
--- a/prompt_evaluations/07_prompt_foo_custom_graders/images/tweezers_sonnet_closeup.png
+++ b/prompt_evaluations/07_prompt_foo_custom_graders/images/tweezers_sonnet_closeup.png
--- a/prompt_evaluations/07_prompt_foo_custom_graders/lesson.ipynb
+++ b/prompt_evaluations/07_prompt_foo_custom_graders/lesson.ipynb
--- a/prompt_evaluations/07_prompt_foo_custom_graders/promptfooconfig.yaml
+++ b/prompt_evaluations/07_prompt_foo_custom_graders/promptfooconfig.yaml
@@ -0,0 +1,28 @@
+description: Count mentions
+prompts:
+  - >-
+    Write a short paragraph about {{topic}}. Make sure you mention {{topic}} exactly {{count}} times, no more or fewer. Only use lower case letters in your output.
+providers:
+  - anthropic:messages:claude-3-haiku-20240307
+  - anthropic:messages:claude-3-5-sonnet-20240620
+defaultTest:
+  assert:
+    - type: python
+      value: file://count.py
+tests:
+  - vars:
+      topic: sheep
+      count: 3
+  - vars:
+      topic: fowl
+      count: 2
+  - vars:
+      topic: gallows
+      count: 4
+  - vars:
+      topic: tweezers
+      count: 7
+  - vars:
+      topic: jeans
+      count: 6
+