eclipse-theia
diff --git a/‎package-lock.json
+11 b/‎package-lock.json
+11
diff --git a/‎packages/ai-anthropic/src/node/anthropic-language-model.ts
+35-6 b/‎packages/ai-anthropic/src/node/anthropic-language-model.ts
+35-6
diff --git a/‎packages/ai-anthropic/src/node/anthropic-language-models-manager-impl.ts
+6-2 b/‎packages/ai-anthropic/src/node/anthropic-language-models-manager-impl.ts
+6-2
diff --git a/‎packages/ai-chat/src/common/chat-agents.ts
+4 b/‎packages/ai-chat/src/common/chat-agents.ts
+4
diff --git a/‎packages/ai-chat/src/common/chat-session-naming-service.ts
+10-13 b/‎packages/ai-chat/src/common/chat-session-naming-service.ts
+10-13
diff --git a/‎packages/ai-core/src/browser/ai-core-frontend-module.ts
+15-1 b/‎packages/ai-core/src/browser/ai-core-frontend-module.ts
+15-1
diff --git a/‎packages/ai-core/src/browser/token-usage-frontend-service-impl.ts
+117 b/‎packages/ai-core/src/browser/token-usage-frontend-service-impl.ts
+117
@@ -21,7 +21,10 @@ import {
     LanguageModelResponse,
     LanguageModelStreamResponse,
     LanguageModelStreamResponsePart,
-    LanguageModelTextResponse
+    LanguageModelTextResponse,
+    TokenUsageService,
+    TokenUsageParams,
+    UserRequest
 } from '@theia/ai-core';
 import { CancellationToken, isArray } from '@theia/core';
 import { Anthropic } from '@anthropic-ai/sdk';
@@ -100,14 +103,15 @@ export class AnthropicModel implements LanguageModel {
         public model: string,
         public enableStreaming: boolean,
         public apiKey: () => string | undefined,
-        public maxTokens: number = DEFAULT_MAX_TOKENS
+        public maxTokens: number = DEFAULT_MAX_TOKENS,
+        protected readonly tokenUsageService?: TokenUsageService
     ) { }
 
     protected getSettings(request: LanguageModelRequest): Readonly<Record<string, unknown>> {
         return request.settings ?? {};
     }
 
-    async request(request: LanguageModelRequest, cancellationToken?: CancellationToken): Promise<LanguageModelResponse> {
+    async request(request: UserRequest, cancellationToken?: CancellationToken): Promise<LanguageModelResponse> {
         if (!request.messages?.length) {
             throw new Error('Request must contain at least one message');
         }
@@ -144,7 +148,7 @@ export class AnthropicModel implements LanguageModel {
 
     protected async handleStreamingRequest(
         anthropic: Anthropic,
-        request: LanguageModelRequest,
+        request: UserRequest,
         cancellationToken?: CancellationToken,
         toolMessages?: readonly Anthropic.Messages.MessageParam[]
     ): Promise<LanguageModelStreamResponse> {
@@ -173,6 +177,7 @@ export class AnthropicModel implements LanguageModel {
                 const toolCalls: ToolCallback[] = [];
                 let toolCall: ToolCallback | undefined;
                 const currentMessages: Message[] = [];
+                let currentMessage: Message | undefined = undefined;
 
                 for await (const event of stream) {
                     if (event.type === 'content_block_start') {
@@ -217,6 +222,21 @@ export class AnthropicModel implements LanguageModel {
                         }
                     } else if (event.type === 'message_start') {
                         currentMessages.push(event.message);
+                        currentMessage = event.message;
+                    } else if (event.type === 'message_stop') {
+                        if (currentMessage) {
+                            yield { input_tokens: currentMessage.usage.input_tokens, output_tokens: currentMessage.usage.output_tokens };
+                            // Record token usage if token usage service is available
+                            if (that.tokenUsageService && currentMessage.usage) {
+                                const tokenUsageParams: TokenUsageParams = {
+                                    inputTokens: currentMessage.usage.input_tokens,
+                                    outputTokens: currentMessage.usage.output_tokens,
+                                    requestId: request.requestId
+                                };
+                                await that.tokenUsageService.recordTokenUsage(that.id, tokenUsageParams);
+                            }
+                        }
+
                     }
                 }
                 if (toolCalls.length > 0) {
@@ -278,10 +298,9 @@ export class AnthropicModel implements LanguageModel {
 
     protected async handleNonStreamingRequest(
         anthropic: Anthropic,
-        request: LanguageModelRequest
+        request: UserRequest
     ): Promise<LanguageModelTextResponse> {
         const settings = this.getSettings(request);
-
         const { messages, systemMessage } = transformToAnthropicParams(request.messages);
 
         const params: Anthropic.MessageCreateParams = {
@@ -296,6 +315,16 @@ export class AnthropicModel implements LanguageModel {
             const response = await anthropic.messages.create(params);
             const textContent = response.content[0];
 
+            // Record token usage if token usage service is available
+            if (this.tokenUsageService && response.usage) {
+                const tokenUsageParams: TokenUsageParams = {
+                    inputTokens: response.usage.input_tokens,
+                    outputTokens: response.usage.output_tokens,
+                    requestId: request.requestId
+                };
+                await this.tokenUsageService.recordTokenUsage(this.id, tokenUsageParams);
+            }
+
             if (textContent?.type === 'text') {
                 return { text: textContent.text };
             }
 
@@ -14,7 +14,7 @@
 // SPDX-License-Identifier: EPL-2.0 OR GPL-2.0-only WITH Classpath-exception-2.0
 // *****************************************************************************
 
-import { LanguageModelRegistry } from '@theia/ai-core';
+import { LanguageModelRegistry, TokenUsageService } from '@theia/ai-core';
 import { inject, injectable } from '@theia/core/shared/inversify';
 import { AnthropicModel, DEFAULT_MAX_TOKENS } from './anthropic-language-model';
 import { AnthropicLanguageModelsManager, AnthropicModelDescription } from '../common';
@@ -27,6 +27,9 @@ export class AnthropicLanguageModelsManagerImpl implements AnthropicLanguageMode
     @inject(LanguageModelRegistry)
     protected readonly languageModelRegistry: LanguageModelRegistry;
 
+    @inject(TokenUsageService)
+    protected readonly tokenUsageService: TokenUsageService;
+
     get apiKey(): string | undefined {
         return this._apiKey ?? process.env.ANTHROPIC_API_KEY;
     }
@@ -64,7 +67,8 @@ export class AnthropicLanguageModelsManagerImpl implements AnthropicLanguageMode
                         modelDescription.model,
                         modelDescription.enableStreaming,
                         apiKeyProvider,
-                        modelDescription.maxTokens
+                        modelDescription.maxTokens,
+                        this.tokenUsageService
                     )
                 ]);
             }
 
@@ -27,6 +27,7 @@ import {
     isTextResponsePart,
     isThinkingResponsePart,
     isToolCallResponsePart,
+    isUsageResponsePart,
     LanguageModel,
     LanguageModelMessage,
     LanguageModelRequirement,
@@ -442,6 +443,9 @@ export abstract class AbstractStreamParsingChatAgent extends AbstractChatAgent {
         if (isThinkingResponsePart(token)) {
             return new ThinkingChatResponseContentImpl(token.thought, token.signature);
         }
+        if (isUsageResponsePart(token)) {
+            return [];
+        }
         return this.defaultContentFactory.create('', request);
     }
 
 
@@ -20,10 +20,10 @@ import {
     CommunicationRecordingService,
     getTextOfResponse,
     LanguageModelRegistry,
-    LanguageModelRequest,
     LanguageModelRequirement,
     PromptService,
-    PromptTemplate
+    PromptTemplate,
+    UserRequest
 } from '@theia/ai-core';
 import { inject, injectable } from '@theia/core/shared/inversify';
 import { ChatSession } from './chat-service';
@@ -103,22 +103,19 @@ export class ChatSessionNamingAgent implements Agent {
             throw new Error('Unable to create prompt message for generating chat session name');
         }
 
-        const request: LanguageModelRequest = {
+        const sessionId = generateUuid();
+        const requestId = generateUuid();
+        const request: UserRequest = {
             messages: [{
                 actor: 'user',
                 text: message,
                 type: 'text'
-            }]
-        };
-
-        const sessionId = generateUuid();
-        const requestId = generateUuid();
-        this.recordingService.recordRequest({
-            agentId: this.id,
-            sessionId,
+            }],
             requestId,
-            ...request
-        });
+            sessionId,
+            agentId: this.id
+        };
+        this.recordingService.recordRequest(request);
 
         const result = await lm.request(request);
         const response = await getTextOfResponse(result);
 
@@ -35,7 +35,10 @@ import {
     PromptCustomizationService,
     PromptService,
     PromptServiceImpl,
-    ToolProvider
+    ToolProvider,
+    TokenUsageService,
+    TOKEN_USAGE_SERVICE_PATH,
+    TokenUsageServiceClient
 } from '../common';
 import {
     FrontendLanguageModelRegistryImpl,
@@ -65,6 +68,8 @@ import { AiCoreCommandContribution } from './ai-core-command-contribution';
 import { PromptVariableContribution } from '../common/prompt-variable-contribution';
 import { LanguageModelService } from '../common/language-model-service';
 import { FrontendLanguageModelServiceImpl } from './frontend-language-model-service';
+import { TokenUsageFrontendService } from './token-usage-frontend-service';
+import { TokenUsageFrontendServiceImpl, TokenUsageServiceClientImpl } from './token-usage-frontend-service-impl';
 
 export default new ContainerModule(bind => {
     bindContributionProvider(bind, LanguageModelProvider);
@@ -144,4 +149,13 @@ export default new ContainerModule(bind => {
     bind(CommandContribution).toService(AiCoreCommandContribution);
     bind(FrontendLanguageModelServiceImpl).toSelf().inSingletonScope();
     bind(LanguageModelService).toService(FrontendLanguageModelServiceImpl);
+
+    bind(TokenUsageFrontendService).to(TokenUsageFrontendServiceImpl).inSingletonScope();
+    bind(TokenUsageServiceClient).to(TokenUsageServiceClientImpl).inSingletonScope();
+
+    bind(TokenUsageService).toDynamicValue(ctx => {
+        const connection = ctx.container.get<ServiceConnectionProvider>(RemoteConnectionProvider);
+        const client = ctx.container.get<TokenUsageServiceClient>(TokenUsageServiceClient);
+        return connection.createProxy<TokenUsageService>(TOKEN_USAGE_SERVICE_PATH, client);
+    }).inSingletonScope();
 });
@@ -0,0 +1,117 @@
+// *****************************************************************************
+// Copyright (C) 2025 EclipseSource GmbH.
+//
+// This program and the accompanying materials are made available under the
+// terms of the Eclipse Public License v. 2.0 which is available at
+// http://www.eclipse.org/legal/epl-2.0.
+//
+// This Source Code may also be made available under the following Secondary
+// Licenses when the conditions for such availability set forth in the Eclipse
+// Public License v. 2.0 are satisfied: GNU General Public License, version 2
+// with the GNU Classpath Exception which is available at
+// https://www.gnu.org/software/classpath/license.html.
+//
+// SPDX-License-Identifier: EPL-2.0 OR GPL-2.0-only WITH Classpath-exception-2.0
+// *****************************************************************************
+
+import { injectable, inject, postConstruct } from '@theia/core/shared/inversify';
+import { Emitter } from '@theia/core';
+import { ModelTokenUsageData, TokenUsageFrontendService } from './token-usage-frontend-service';
+import { TokenUsage, TokenUsageService } from '../common/token-usage-service';
+import { TokenUsageServiceClient } from '../common/protocol';
+
+@injectable()
+export class TokenUsageServiceClientImpl implements TokenUsageServiceClient {
+    private readonly _onTokenUsageUpdated = new Emitter<TokenUsage>();
+    readonly onTokenUsageUpdated = this._onTokenUsageUpdated.event;
+
+    notifyTokenUsage(usage: TokenUsage): void {
+        this._onTokenUsageUpdated.fire(usage);
+    }
+
+}
+
+@injectable()
+export class TokenUsageFrontendServiceImpl implements TokenUsageFrontendService {
+
+    @inject(TokenUsageServiceClient)
+    protected readonly tokenUsageServiceClient: TokenUsageServiceClient;
+
+    @inject(TokenUsageService)
+    protected readonly tokenUsageService: TokenUsageService;
+
+    private readonly _onTokenUsageUpdated = new Emitter<ModelTokenUsageData[]>();
+    readonly onTokenUsageUpdated = this._onTokenUsageUpdated.event;
+
+    private cachedUsageData: ModelTokenUsageData[] = [];
+
+    @postConstruct()
+    protected init(): void {
+        this.tokenUsageServiceClient.onTokenUsageUpdated(() => {
+            this.getTokenUsageData().then(data => {
+                this._onTokenUsageUpdated.fire(data);
+            });
+        });
+    }
+
+    /**
+     * Gets the current token usage data for all models
+     */
+    async getTokenUsageData(): Promise<ModelTokenUsageData[]> {
+        try {
+            const usages = await this.tokenUsageService.getTokenUsages();
+            this.cachedUsageData = this.aggregateTokenUsages(usages);
+            return this.cachedUsageData;
+        } catch (error) {
+            console.error('Failed to get token usage data:', error);
+            return [];
+        }
+    }
+
+    /**
+     * Aggregates token usages by model
+     */
+    private aggregateTokenUsages(usages: TokenUsage[]): ModelTokenUsageData[] {
+        // Group by model
+        const modelMap = new Map<string, {
+            inputTokens: number;
+            outputTokens: number;
+            lastUsed?: Date;
+        }>();
+
+        // Process each usage record
+        for (const usage of usages) {
+            const existing = modelMap.get(usage.model);
+
+            if (existing) {
+                existing.inputTokens += usage.inputTokens;
+                existing.outputTokens += usage.outputTokens;
+
+                // Update last used if this usage is more recent
+                if (!existing.lastUsed || (usage.timestamp && usage.timestamp > existing.lastUsed)) {
+                    existing.lastUsed = usage.timestamp;
+                }
+            } else {
+                modelMap.set(usage.model, {
+                    inputTokens: usage.inputTokens,
+                    outputTokens: usage.outputTokens,
+                    lastUsed: usage.timestamp
+                });
+            }
+        }
+
+        // Convert map to array of model usage data
+        const result: ModelTokenUsageData[] = [];
+
+        for (const [modelId, data] of modelMap.entries()) {
+            result.push({
+                modelId,
+                inputTokens: data.inputTokens,
+                outputTokens: data.outputTokens,
+                lastUsed: data.lastUsed
+            });
+        }
+
+        return result;
+    }
+}