EU GPT logo
EU GPT

Public preview — Deze API is in public preview. Endpoints, schemas en limieten kunnen wijzigen vóór general availability.

API

Gesprekken

Stateful threads vs stateless requests — wanneer gebruik je welke.

Een gesprek is een server-side thread van berichten. EU GPT bewaart de volledige history zodat opvolgende requests kunnen verwijzen naar eerdere beurten zonder alles opnieuw te sturen.

Er zijn twee manieren om de API aan te roepen.

Stateless requests#

Laat conversation_id weg. Elke call is onafhankelijk: de enige context die het model ziet is de input die je stuurt plus eventuele instructions.

{
  "model": "auto",
  "input": "Summarise this in one sentence: …",
  "stream": false
}

Gebruik stateless wanneer:

  • De request one-shot en kort is — classificatie, extractie, vertaling, samenvatten van één chunk.
  • Je history zelf wilt beheren in je eigen database.
  • Je niet wilt dat de request opduikt in de web-UI-history van de gebruiker.

Een stateless request creëert intern nog steeds een ephemeral gesprek zodat de server de response kan opslaan, maar het is verborgen in de chat-history van de gebruiker.

Stateful gesprekken#

Geef een bestaande conversation_id UUID door. De server zet de eerdere berichten van het gesprek (binnen een sliding window) ervoor en gebruikt ze als context.

{
  "model": "auto",
  "input": "And add a bulleted list of risks.",
  "conversation_id": "8f14e45f-ceea-467a-a4ed-a9e9a5cb16ee",
  "stream": true
}

Gebruik stateful wanneer:

  • De gebruiker een echt gesprek voert over meerdere beurten.
  • Je wilt dat de thread verschijnt in hun web-UI-chat-history.
  • Je server-side incrementele summarisation wilt om oude beurten automatisch te comprimeren.

Lifecycle#

Gesprekken worden op drie manieren aangemaakt:

  1. Impliciet via de web-UI als een gebruiker een nieuwe chat start.
  2. Impliciet via de API door een stateless request te sturen (een ephemeral, verborgen gesprek).
  3. Programmatic via de conversation-lijst van de EU GPT-webapp.

Je voegt toe aan een bestaand gesprek door zijn conversation_id mee te sturen. Gesprekken zijn gescoped naar de gebruiker die ze bezit; een API-key kan alleen gesprekken benaderen die eigendom zijn van de gebruiker die de key heeft uitgegeven.

Context windows en summarisation#

Elk chat-model heeft een vaste context window. EU GPT beheert dit voor je:

  • Recente berichten worden letterlijk doorgegeven (het message history window).
  • Oudere berichten worden in de achtergrond samengevat en als conversation_summary ervoor gezet.
  • Summaries zijn incrementeel — ze updaten naarmate het gesprek groeit.

Je hoeft niets aan jouw kant af te kappen of samen te vatten. Stuur gewoon dezelfde conversation_id.

Projects en RAG#

Een response kan ook gebonden worden aan een project door project_id mee te geven. Het project heeft een gekoppelde file-corpus; het systeem haalt relevante chunks op en gebruikt ze om de response te onderbouwen.

{
  "model": "auto",
  "input": "What does the 2024 audit say about Q3 server costs?",
  "conversation_id": "8f14e45f-ceea-467a-a4ed-a9e9a5cb16ee",
  "project_id": "1c8b9a7f-2d3e-4f5a-9b8c-7d6e5f4a3b2c",
  "stream": true
}