pydantic · metaember · Jun 18, 2025 · Jun 18, 2025 · DouweM · Jun 18, 2025
diff --git a/pydantic_ai_slim/pydantic_ai/models/google.py b/pydantic_ai_slim/pydantic_ai/models/google.py
@@ -11,7 +11,7 @@
 from typing_extensions import assert_never
 
 from .. import UnexpectedModelBehavior, _utils, usage
-from ..exceptions import UserError
+from ..exceptions import UsageLimitExceeded, UserError
 from ..messages import (
     BinaryContent,
     FileUrl,
@@ -289,7 +289,9 @@ def _process_response(self, response: GenerateContentResponse) -> ModelResponse:
         if not response.candidates or len(response.candidates) != 1:
             raise UnexpectedModelBehavior('Expected exactly one candidate in Gemini response')  # pragma: no cover
         if response.candidates[0].content is None or response.candidates[0].content.parts is None:
-            if response.candidates[0].finish_reason == 'SAFETY':
+            if response.candidates[0].finish_reason == 'MAX_TOKENS':
+                raise UsageLimitExceeded(str(response))
+            elif response.candidates[0].finish_reason == 'SAFETY':
                 raise UnexpectedModelBehavior('Safety settings triggered', str(response))
             else:
                 raise UnexpectedModelBehavior(

diff --git a/tests/models/test_google.py b/tests/models/test_google.py
@@ -12,7 +12,7 @@
 from typing_extensions import TypedDict
 
 from pydantic_ai.agent import Agent
-from pydantic_ai.exceptions import ModelRetry, UnexpectedModelBehavior, UserError
+from pydantic_ai.exceptions import ModelRetry, UnexpectedModelBehavior, UsageLimitExceeded, UserError
 from pydantic_ai.messages import (
     AudioUrl,
     BinaryContent,
@@ -585,6 +585,17 @@ async def test_google_model_safety_settings(allow_model_requests: None, google_p
         await agent.run('Tell me a joke about a Brazilians.')
 
 
+async def test_google_model_usage_limit_exceeded(allow_model_requests: None, google_provider: GoogleProvider):
+    # this passes with 'gemini-1.5-flash' but fails with 'google-gla:gemini-2.5-pro-preview-05-06'
+    m = GoogleModel('google-gla:gemini-2.5-pro-preview-05-06', provider=google_provider)
+    agent = Agent(m, model_settings=dict(max_tokens=1))
+
+    with pytest.raises(UsageLimitExceeded):
+        await agent.run(
+            'Write me a two paragraph essay about the history of the internet.',
+        )
+
+
 async def test_google_model_empty_user_prompt(allow_model_requests: None, google_provider: GoogleProvider):
     m = GoogleModel('gemini-1.5-flash', provider=google_provider)
     agent = Agent(m, instructions='You are a helpful assistant.')