Häufig gestellte Fragen

Allgemeine Fragen zum Chat

Wie kann ich im Chatfenster eine neue Zeile beginnen?

Durch Tastenkombination Shift + Enter kann eine neue Zeile im Chatfenster begonnen werden.

Wie kann ich Bilder und Dateien in den Chat einfügen?

Dateien können per Drag & Drop, Copy & Paste aus der Zwischenablage oder per Upload (über das Plus-Symbol) dem Chat hinzugefügt werden.

Was sind die Unterschiede zwischen Standard-, Mini- und Nano-Modellen?

Standard-, Mini- und Nano-Modelle unterscheiden sich vor allem in folgenden Punkten:

Leistungsfähigkeit (Qualität der Ergebnisse)
Standard-Modelle sind in der Regel am leistungsstärksten und liefern die besten Ergebnisse, z.B. bei komplexem Textverständnis, logischen Schlussfolgerungen oder kreativen Aufgaben.
Mini-Modelle bieten ein gutes Mittelmaß aus Qualität und Effizienz.
Nano-Modelle sind stärker auf Einfachheit und Geschwindigkeit optimiert und eignen sich vor allem für weniger komplexe Aufgaben.
Geschwindigkeit und Ressourcenverbrauch
Standard-Modelle benötigen meist mehr Rechenressourcen und sind etwas langsamer in der Ausführung, bieten dafür aber höhere Genauigkeit.
Mini-Modelle sind deutlich schneller und ressourcenschonender und damit ideal für Anwendungen mit vielen Anfragen.
Nano-Modelle sind auf maximale Geschwindigkeit und sehr geringe Ressourcenanforderungen optimiert (z.B. für einfache Workflows oder eingebettete Systeme).
Kosten pro Anfrage
Standard-Modelle sind in der Regel am teuersten pro Anfrage, da sie mehr Rechenleistung benötigen.
Mini-Modelle sind kostengünstiger bei weiterhin guter Qualität.
Nano-Modelle sind am günstigsten und daher gut geeignet für Szenarien mit sehr hohem Anfragevolumen oder strengen Budgetvorgaben.
Typische Anwendungsfälle
Standard-Modelle passen gut zu komplexen Use-Cases, etwa anspruchsvolle Fachtexte, ausführliche Analysen oder kreative Generierung.
Mini-Modelle eignen sich gut für typische Alltagsanwendungen, z.B. Chatbots, Support-Automatisierung oder interne Tools.
Nano-Modelle sind ideal für einfache, klar umrissene Aufgaben, z.B. kurze Textbausteine, einfache Klassifikation oder schnelle Hilfsfunktionen innerhalb von Anwendungen.

Zusammengefasst bieten die verschiedenen Modellgrößen unterschiedliche Kompromisse zwischen Qualität, Geschwindigkeit und Kosten. Welches Modell am besten geeignet ist, hängt von den konkreten Anforderungen, der gewünschten Antwortqualität und den verfügbaren Ressourcen in Ihrer Anwendung ab.

Was bedeutet 'Token-Limit' genau?

Ein Token ist ein Baustein aus Wörtern oder Zeichen. Modelle haben eine maximale Anzahl Token, die sie in einer Anfrage verarbeiten können (Input + Output).
Beispiel: Der Satz „Hallo, wie kann ich helfen?“ besteht aus ca. 7 Token.
Je größer das Token-Limit, desto mehr Kontext kann ein Modell behalten – wichtig für lange Dokumente oder Gespräche.

Welches Modell ist das 'beste'?

Es gibt kein „bestes“ Modell – nur das passendste. Die Auswahl hängt vom Einsatzzweck ab: Zur Bestimmung des geeigneten Models empfehlen wir unseren Model-Guide

Beim Chat erhalte ich nicht die Antworten oder die Antwortqualität, die ich erwarte. Was kann die Ursache sein?

Je besser die Anfrage an die KI ist, umso besser ist auch das Ergebnis. Wir empfehlen hierzu unserem Leitfaden für gute Prompts zu folgen: Prompting-Guide

Wann sind neue Modelle in Business GPT verfügbar?

Modelle, insbesondere OpenAI Modelle, sind zuerst in den USA verfügbar. In der Regel dauert es ein paar Wochen bis diese Modelle dann auch in Europa verfügbar sind. Sobald die Modelle in Europa verfügbar sind, stellen wir diese in Business GPT zur Verfügung.

Was sind Halluzinationen – und wie gehe ich damit um?

Halluzinationen sind realistisch klingende, aber falsche Aussagen eines Modells.
Beispiele: erfundene Quellen, Zahlen, Zitate oder Fakten.
→ Besonders bei kritischen Themen (z. B. Recht, Medizin, Finanzen) ist es wichtig, Ausgaben zu validieren und mit Fachwissen zu prüfen.

Gibt es Unterschiede zwischen 'schnellen' und 'langsamen' Modellen?

Ja, absolut. Man unterscheidet in der Regel zwischen hochoptimierten, kompakten Modellen und großen, rechenintensiven Modellen:

Schnelle Modelle: Sind auf maximale Geschwindigkeit und Effizienz getrimmt. Sie reagieren fast in Echtzeit und sind ideal für Dialoge oder einfache Textaufgaben.
Langsamere Modelle: Nutzen oft mehr Parameter oder zusätzliche "Denk-Schritte" (Reasoning), um komplexe Probleme zu lösen. Das benötigt mehr Zeit, führt aber bei schwierigen Logikrätseln zu präziseren Ergebnissen.

→ Die Wahl des Modells ist immer ein Abwägen zwischen Antwortgeschwindigkeit und Tiefe der Analyse.

Ist ein schnelleres Modell schlechter als ein langsames?

Nicht unbedingt. Kleinere Modelle wie GPT-5.1-mini oder GPT-4.1-nano liefern bei Standardaufgaben oft sehr gute Ergebnisse – und das bei geringerem Ressourcenverbrauch.
→ Sie sind besonders effizient bei einfachen bis mittleren Anforderungen.

Wie viel Text kann ich im Prompt verwenden?

Ein Prompt (Texteingabe in den Chat) kann maximal 100.000 Zeichen enthalten. Übersteigt die Anfrage diese Anzahl, wird eine Fehlermeldung angezeigt. Für größere Textmengen wird empfohlen, diese bspw. als Textdatei abzuspeichern und diese .txt-Datei an den Chat anzuhängen.

Fragen zum Chat mit Dokumenten/internem Wissen

Ich sehe keine Container zur Auswahl im Dokumenten-Chat. Woran liegt das?

Werden keine Container zur Auswahl angezeigt, liegt das entweder an fehlenden Gruppenfreigaben für die gewünschten Container oder an fehlenden Gruppenmitgliedschaften im EntraID. Hierzu bitte an den zuständigen Administrator wenden.

In den Antworten beim Dokumenten-Chat werden nicht die richtigen Dokumente als Quellen benannt. Woran kann das liegen?

Ursache könnte sein, dass das Dokument bzw. der zugehörige Dokumenten-Container nicht richtig indexiert wurde. Lösung: das betreffende Dokument in einen anderen Container verschieben und anschließend erneut in den gewünschten Ziel-Container zuordnen.

Kann ich selbst Dateien hochladen, um mit diesen zu chatten?

Ja, mit dem Business GPT Paket "L" können eigene Dokumente hochgeladen werden. Diese stehen dann als temporäre Dokumente für 24h zur Verfügung bevor diese automatisch gelöscht werden.

Kann Business GPT die Anzahl von Dokumenten ermitteln, z.B. in einem Container?

Nein, Business GPT kann nicht zählen. Die Beantwortung von Fragen zu internem Wissen folgt einem deterministischen Ansatz.

Was ist der Unterschied zwischen dem Chat mit einem Dokumenten-Container und einem direkt am Chat angehängten Dokument?

Der wesentliche Unterschied besteht darin, dass bei Dokumenten, die direkt an den Chat angehängt sind, der gesamte Dokumenteninhalt dem Modell zur Verfügung gestellt wird, während beim Chat mit Containern ein Vektorsuche erfolgt, um relevante Inhalte zu finden. Auf diese Weise können große Mengen von Dokumenten durchsucht werden, aber möglicherweise wird nicht jeder Dokumentteil für jede Antwort berücksichtigt.

Ich erhalte im Chat eine Fehlermeldung, dass das Token Limit überschritten wurde, wenn ich eine Datei angehängt habe. Was bedeutet das?

Wenn sie diese Fehlermeldung erhalten, ist das Dokument oder die Gesamtanzahl aller Dokumente, die Sie an den Chat anhängen wollen, zu groß. KI-Modelle verfügen über ein sogenanntes Kontextfenster, was festlegt, wie viele Zeichen ein Modell maximal verarbeiten kann. Wenn Sie ein Dokument an den Chat anhängen, wird der Inhalt des Dokumentes extrahiert und somit der gesamte Text dem Modell zur Verfügung gestellt. Sofern das in Summe zu viele Zeichen sind, wird Ihnen diese Fehlermeldung angezeigt. Entfernen Sie dann entweder eines oder mehrere Dokumente aus dem Chat oder wechseln Sie auf eine anderes Modell mit größerem Kontextfenster.

Was passiert, wenn ein Dokument hochgeladen wird, was bereits im System, z.B. in einem Container, vorhanden ist?

Business GPT erkennt Duplikate und stellt sicher, dass Dokumente, die bereits vorhanden sind, nicht nochmals im Datenbstand gespeichert werden. Stattdessen sorgt Business GPT bei der Erkennung eines Duplikats dafür, dass lediglich eine Referenz des Dokuments erstellt und verwendet wird. Wird bspw. ein Dokument in einen Container hochgeladen, welches bereits in einem anderen Container existiert, wird dieses Dokument per Referenzierung im Container nur zugeordnet, ohne dass eine weitere physische Kopie des Dokuments gespeichert wird.

Ist die Dateianzahl in einem Dokumenten-Container begrenzt?

Nein, Sie können unbegrenzt viele Dateien in einem (Unternehmens-) Container speichern. Die Anzahl der Dateien in einem Container sollte durch die Art und Weise wie Sie den Container später verwenden möchten, bestimmt werden. Container-Inhalte können Sie beispielsweise anwendungsfallspezifisch voneinander trennen.

Bei persönlichen Dokumentencontainern ist die Maximalanzahl davon abhängig, welche Einstellungen Ihr Administrator vorgenommen hat.

Ist die Anzahl von Containern begrenzt?

Nein, Sie können beliebig viele Container erstellen.

Fragen zum Datenschutz

Wo finde ich die Datenschutzregeln und Nutzungsbedingungen?

Die Links zu den Datenschutzhinweisen und Nutzungsbedingungen können über die geöffnete Seitennaviation geöffnet werden.

Wird die KI mit hochgeladenen Dokumenten trainiert?

Nein, hochgeladenene Dokumente werden nicht zum Training der KI genutzt. Diese Daten werden lediglich in einem sogenannten "Retrieval-Augmented Generation" System, kurz RAG System, verarbeitet. Dabei werden die Inhalte der Dokumente in kleinere verarbeitbare Einheiten zerlegt ("Chunking") und anschließend für schnelle Suchanfragen gespeichert ("Indexing"). Diese Daten werden sicher durch Business GPT gespeichert und gelangen nicht nach außerhalb. Weiterführende Informationen hierzu finden Sie bei Microsoft Azure

Können Dokumente und Assistenten pro Abteilung von einander separiert werden, sodass zum Beispiel Mitarbeiter der Technik nicht auf Daten der Geschäftsleitung zugreifen können?

Ja, Business GPT erlaubt dies durch Anwendung von Nutzergruppenberechtigungen. Dokumente und Assistenten könnnen so nur für bestimmte Nutzergruppen freigegeben werden.

Fragen zur Anmeldung/Login

Die Anmeldung mit den Rollen "user" oder "admin" funktioniert nicht, obwohl die Anwendungsrollen im Entra ID einer Gruppe zugewiesen wurden. Was könnte die Ursache sein?

Falls im EntraId verschachtelte Gruppen (Gruppe in Gruppe) verwendet werden, könnte dies der Grund sein, da Entra ID nur Mitglieder der direkt zugewiesenen Gruppe berücksichtigt. Verschachtelte Gruppen werden hierbei nicht aufgelöst, da die Token-Generierung in Entra ID nicht rekursiv durch die Gruppenhierarchie navigiert. Für Mitglieder in einer untergeordneten Gruppen wird demnach die Anwendungsrolle nicht an BusinessGPT übermittelt, wodurch die Anmeldung als Admin oder User fehlschlägt.

Fragen zu Kosten und Verbrauch

Was passiert, wenn das Gesamtbudget aufgebraucht ist?

Wenn das Gesamtbudget aufgebraucht ist, sind keine kostenverursachenden Aktionen mehr in Business GPT möglich. Dazu zählen das Chatten mit KI-Modellen wie GPT4o sowie die Indexierung von Dokumenten, nachdem diese hochgeladen wurden. Zusätzliches Budget kann aber problemlos jederzeit nachbestellt werden. Weiterführende Informationen finden Sie hier: Budget nachbestellen

Wie genau wird das monatliche Prepaid-Budget verbraucht?

Das Prepaid-Budget wird zum einen durch Tokenkosten verbraucht. Dabei entstehen Kosten bei der Anfrage an die KI, sogenannte Input-Token, und durch die Anwort der KI, sogenannte Output-Token. Je Modell, z.B. GPT5.1 oder GPT4.1, sind diese Kosten unterschiedlich. Zum anderen entstehen Kosten bei der Verarbeitung von Daten, die Business GPT als "internes Wissen" zur Verfügung gestellt werden, z.B. durch den Upload von Dokumenten. Dabei entstehen durch die Verarbeitung beim Upload sogenannte Indexierungskosten.

Alle Kostenarten stehen transparent in Business GPT in einer Verbrauchsübersicht zur Verfügung.

Fragen zu Limits

Wie viele Dateien kann ich gleichzeitig an den Chat anhängen?

Es können maximal 10 Dateien gleichzeitig an den Chat angehängt werden.

Wie groß darf eine einzelne Datei sein, die ich an den Chat anhänge?

Die maximale Dateigröße pro angehängter Datei beträgt 100 MB.

Wie viele Zeichen darf mein Prompt enthalten?

Ein Prompt kann maximal 100.000 Zeichen enthalten. Übersteigt die Eingabe diese Anzahl, wird eine Fehlermeldung angezeigt. Für größere Textmengen empfiehlt es sich, den Text als Datei (z.B. .txt) zu speichern und diese an den Chat anzuhängen.

Wie viel Gesamtinhalt kann ein Modell in einem Chat verarbeiten?

Das Kontextfenster eines Modells begrenzt die gesamte Eingabe im Chat – also die Summe aus Ihren Nachrichten, angehängten Dokumenten und dem bisherigen Gesprächsverlauf. Dieses Limit ist abhängig vom gewählten Modell und fällt je nach Modell unterschiedlich groß aus. Weitere Informationen dazu finden Sie im Modell-Guide.

Welche Dateitypen können an den Chat angehängt werden?

Folgende Dokumentenformate können an den Chat angehängt werden:

.pdf, .docx, .pptx, .xlsx, .json, .md, .txt, .yaml, .xsd, .xml, .csv

Bilddateien (.jpg, .jpeg, .webp, .gif, .png) können ebenfalls angehängt werden, allerdings nur wenn das gewählte Modell die Bildverarbeitung (Vision) unterstützt.

Kann ich Bilder an den Chat anhängen?

Ja, aber nur wenn das gewählte Modell die Bildverarbeitung (Vision) unterstützt. Unterstützte Bildformate sind .jpg, .jpeg, .webp, .gif und .png.

Wie lange stehen hochgeladene Dateien zur Verfügung?

Dateien, die direkt an den Chat hochgeladen werden, stehen als temporäre Dokumente für 24 Stunden zur Verfügung und werden anschließend automatisch gelöscht. Die Funktion für temporäre Dokumente steht nur in der Produktvariante „L" zur Verfügung.

Wie viele Token kann ein Modell maximal ausgeben?

Die maximale Anzahl der Output-Token ist abhängig vom gewählten Modell. Beispielsweise liegt das Limit bei GPT-5 und GPT-5.1 bei 128.000 Output-Token, bei GPT-4.1 bei 32.768 Output-Token. Eine vollständige Übersicht finden Sie im Modell-Guide.