posit-dev · wch · Jul 15, 2024 · Jul 15, 2024 · cpsievert · Jul 15, 2024
diff --git a/shiny/ui/_chat.py b/shiny/ui/_chat.py
@@ -347,7 +347,7 @@ async def _raise_exception(
     def messages(
         self,
         *,
-        format: Literal["anthropic"] = "anthropic",
+        format: Literal["anthropic"],
         token_limits: tuple[int, int] | None = (4096, 1000),
         transform_user: Literal["all", "last", "none"] = "all",
         transform_assistant: bool = False,
@@ -357,7 +357,7 @@ def messages(
     def messages(
         self,
         *,
-        format: Literal["google"] = "google",
+        format: Literal["google"],
         token_limits: tuple[int, int] | None = (4096, 1000),
         transform_user: Literal["all", "last", "none"] = "all",
         transform_assistant: bool = False,
@@ -367,7 +367,7 @@ def messages(
     def messages(
         self,
         *,
-        format: Literal["langchain"] = "langchain",
+        format: Literal["langchain"],
         token_limits: tuple[int, int] | None = (4096, 1000),
         transform_user: Literal["all", "last", "none"] = "all",
         transform_assistant: bool = False,
@@ -377,7 +377,7 @@ def messages(
     def messages(
         self,
         *,
-        format: Literal["openai"] = "openai",
+        format: Literal["openai"],
         token_limits: tuple[int, int] | None = (4096, 1000),
         transform_user: Literal["all", "last", "none"] = "all",
         transform_assistant: bool = False,
@@ -387,7 +387,7 @@ def messages(
     def messages(
         self,
         *,
-        format: Literal["ollama"] = "ollama",
+        format: Literal["ollama"],
         token_limits: tuple[int, int] | None = (4096, 1000),
         transform_user: Literal["all", "last", "none"] = "all",
         transform_assistant: bool = False,
@@ -397,7 +397,7 @@ def messages(
     def messages(
         self,
         *,
-        format: MISSING_TYPE = MISSING,
+        format: Literal["internal"],
         token_limits: tuple[int, int] | None = (4096, 1000),
         transform_user: Literal["all", "last", "none"] = "all",
         transform_assistant: bool = False,
@@ -406,7 +406,7 @@ def messages(
     def messages(
         self,
         *,
-        format: MISSING_TYPE | ProviderMessageFormat = MISSING,
+        format: ProviderMessageFormat | Literal["internal"],
-        format: ProviderMessageFormat | Literal["internal"],
+        format: ProviderMessageFormat | Literal["internal"] = "internal",
-        format: ProviderMessageFormat | Literal["internal"],
+        format: ProviderMessageFormat | Literal["internal"] = "internal",
         token_limits: tuple[int, int] | None = (4096, 1000),
         transform_user: Literal["all", "last", "none"] = "all",
         transform_assistant: bool = False,
@@ -466,7 +466,7 @@ def messages(
 
         messages = self._messages()
         if token_limits is not None:
-            messages = self._trim_messages(messages, token_limits)
+            messages = self._trim_messages(messages, token_limits, format)
 
         res: list[ChatMessage | ProviderMessage] = []
         for i, m in enumerate(messages):
@@ -479,7 +479,7 @@ def messages(
                 )
             content_key = m["transform_key" if transform else "pre_transform_key"]
             chat_msg = ChatMessage(content=m[content_key], role=m["role"])
-            if not isinstance(format, MISSING_TYPE):
+            if format != "internal":
                 chat_msg = as_provider_message(chat_msg, format)
             res.append(chat_msg)
 
@@ -827,7 +827,8 @@ def _store_message(
     @staticmethod
     def _trim_messages(
         messages: tuple[StoredMessage, ...],
-        token_limits: tuple[int, int] = (4096, 1000),
+        token_limits: tuple[int, int],
+        format: ProviderMessageFormat | Literal["internal"],
     ) -> tuple[StoredMessage, ...]:
 
         n_total, n_reserve = token_limits
@@ -872,6 +873,11 @@ def _trim_messages(
             if remaining_non_system_tokens >= 0:
                 messages2.append(m)
 
+        if format == "anthropic":
+            # For anthropic, the first message must be a user message.
+            while messages2[-1]["role"] != "user":
+                messages2.pop()
+
         messages2.reverse()
 
         if len(messages2) == n_system_messages and n_other_messages > 0:

diff --git a/tests/pytest/test_chat.py b/tests/pytest/test_chat.py
@@ -66,7 +66,7 @@ def test_chat_message_trimming():
 
         # Throws since system message is too long
         with pytest.raises(ValueError):
-            chat._trim_messages(msgs, token_limits=(100, 0))
+            chat._trim_messages(msgs, token_limits=(100, 0), format="internal")
 
         msgs = (
             as_stored_message(
@@ -79,10 +79,9 @@ def test_chat_message_trimming():
 
         # Throws since only the system message fits
         with pytest.raises(ValueError):
-            chat._trim_messages(msgs, token_limits=(100, 0))
-
+            chat._trim_messages(msgs, token_limits=(100, 0), format="internal")
         # Raising the limit should allow both messages to fit
-        trimmed = chat._trim_messages(msgs, token_limits=(102, 0))
+        trimmed = chat._trim_messages(msgs, token_limits=(102, 0), format="internal")
         assert len(trimmed) == 2
         contents = [msg["content_server"] for msg in trimmed]
         assert contents == ["System message", "User message"]
@@ -100,7 +99,7 @@ def test_chat_message_trimming():
         )
 
         # Should discard the 1st user message
-        trimmed = chat._trim_messages(msgs, token_limits=(102, 0))
+        trimmed = chat._trim_messages(msgs, token_limits=(102, 0), format="internal")
         assert len(trimmed) == 2
         contents = [msg["content_server"] for msg in trimmed]
         assert contents == ["System message", "User message 2"]
@@ -121,7 +120,7 @@ def test_chat_message_trimming():
         )
 
         # Should discard the 1st user message
-        trimmed = chat._trim_messages(msgs, token_limits=(102, 0))
+        trimmed = chat._trim_messages(msgs, token_limits=(102, 0), format="internal")
         assert len(trimmed) == 3
         contents = [msg["content_server"] for msg in trimmed]
         assert contents == ["System message", "System message 2", "User message 2"]