Zum Hauptinhalt springen

Überblick

Casibase ist eine von ChatGPT betriebene Open-Source-Domänenwissen-Datenbank, Instant-Messaging- und Forumsoftware.

Casibase Eigenschaften

  1. Mit einer in Golang entwickelten Frontend-Backend-getrennten Architektur unterstützt Casibase Hochparallelbetrieb, bietet eine webbasierte Verwaltungsoberfläche und unterstützt mehrere Sprachen (Chinesisch, Englisch).

  2. Casibase unterstützt Anmeldungen von Drittanbieteranwendungen wie GitHub, Google, QQ, WeChat usw. und ermöglicht die Erweiterung von Drittanbieteranmeldungen durch Plugins.

  3. Mit Einbettung und Prompt-Engineering für das Wissensmanagement unterstützt Casibase benutzerdefinierte Einbettungsmethoden und Sprachmodelle.

  4. Casibase ermöglicht die Integration mit bestehenden Systemen durch Datenbanksynchronisation, sodass Benutzer reibungslos zu Casibase wechseln können.

  5. Casibase unterstützt die wichtigsten Datenbanken: MySQL, PostgreSQL, SQL Server usw. und ermöglicht die Erweiterung neuer Datenbanken durch Plugins.

  6. Casibase ist ein leistungsstarkes Asset-Management-Tool, das eine einfache Verbindung zu Assets über RDP-, VNC- und SSH-Protokolle ermöglicht und Fernverbindungen zu Maschinen effizient verarbeitet.

  7. Mit der Sicherheitsprotokollierungsfunktion von Casibase können Sie Fernverbindungen einfach verfolgen und überwachen, wobei detaillierte Aufzeichnungen über Verbindungsstartzeit, Dauer und andere relevante Details erfasst werden, während auch API-Protokolle für Casdoor-Operationen erfasst und analysiert werden, um die Sicherheit und Betriebstransparenz zu verbessern.

  8. Casibase unterstützt Datenbankverwaltung. Die Datenbankverwaltungsfunktion von Casibase ermöglicht es Ihnen, Datenbanken einfach zu verbinden, zu verwalten und zu organisieren und gleichzeitig den Zugriff zu kontrollieren, wodurch die Benutzerverwaltung und Autorisierung für Datenbankressourcen vereinfacht wird.

Wie es funktioniert

Schritt 0 (Vorwissen)

Der Wissenssuchprozess von Casibase basiert auf Einbettung und Prompt-Engineering, daher wird dringend empfohlen, dass Sie sich kurz mit der Funktionsweise von Einbettungen vertraut machen. Hier ist eine Einführung zu Einbettungen.

Einbettung

Schritt 1 (Wissen importieren)

Um mit Casibase zu beginnen, müssen Benutzer die folgenden Schritte ausführen, um Wissen zu importieren und eine domänenspezifische Wissensdatenbank zu erstellen:

  1. Speicher konfigurieren: Im Casibase-Dashboard sollten Benutzer zunächst die Speichereinstellungen konfigurieren. Dies beinhaltet die Angabe des Speichersystems, das zum Speichern wissensbezogener Dateien wie Dokumente, Bilder oder andere relevante Daten verwendet wird. Benutzer können aus verschiedenen Speicheroptionen nach ihren Vorlieben und Anforderungen wählen.

  2. Dateien in den Speicher hochladen: Sobald der Speicher eingerichtet ist, können Benutzer Dateien, die domänenspezifisches Wissen enthalten, in das konfigurierte Speichersystem hochladen. Diese Dateien können in verschiedenen Formaten vorliegen, wie Textdokumente, Bilder oder strukturierte Datendateien (wie CSV oder JSON).

  3. Einbettungsmethode für die Wissensgenerierung auswählen: Nach dem Hochladen der Dateien können Benutzer die Einbettungsmethode für die Generierung von Wissen und entsprechenden Vektoren auswählen. Einbettungen sind numerische Darstellungen von Text- oder visuellen Inhalten, die eine effiziente Ähnlichkeitssuche und Datenanalyse ermöglichen.

Tipp

Wie wird Wissen eingebettet?

  • Für Textdaten: Benutzer können verschiedene Einbettungsmethoden wie Word2Vec, GloVe oder BERT wählen, um Textwissen in bedeutungsvolle Vektoren umzuwandeln.

  • Für visuelle Daten: Wenn die hochgeladenen Dateien Bilder oder visuelle Inhalte enthalten, können Benutzer Bildeinbettungstechniken wie CNN-basierte Merkmalsextraktion wählen, um repräsentative Vektoren zu erstellen.

  • Weitere Methoden folgen in Kürze...

Durch Befolgen dieser Schritte können Benutzer ihre domänenspezifische Wissensdatenbank mit relevanten Informationen und entsprechenden Einbettungen füllen, die für effektive Suche, Clustering und Wissensabruf in Casibase verwendet werden. Der Einbettungsprozess ermöglicht es dem System, den Kontext und die Beziehungen zwischen verschiedenen Wissensfragmenten zu verstehen, was ein effizienteres und aufschlussreicheres Wissensmanagement und -erkunden ermöglicht.

Schritt 2 (Wissen abrufen)

Nach dem Import Ihres Domänenwissens wandelt Casibase es in Vektoren um und speichert diese Vektoren in einer Vektordatenbank. Diese vektorielle Darstellung ermöglicht leistungsstarke Funktionen wie Ähnlichkeitssuche und effiziente Abruf relevanter Informationen. Sie können schnell relevante Daten basierend auf Kontext oder Inhalt finden, erweiterte Abfragen durchführen und wertvolle Erkenntnisse in Ihrem Domänenwissen entdecken.

Schritt 3 (Prompt erstellen)

Casibase führt eine Ähnlichkeitssuche auf den gespeicherten Wissensvektoren durch, um die besten Übereinstimmungen mit der Benutzeranfrage zu finden. Mit den Suchergebnissen erstellt es eine Prompt-Vorlage für das Sprachmodell, um eine spezifische Antwort zu erstellen. Dies stellt sicher, dass Antworten auf der Grundlage des in Casibase gespeicherten Domänenwissens genau und kontextbezogen sind.

Schritt 4 (Ziel erreichen)

In dieser Phase haben Sie mit Casibase erfolgreich das benötigte Wissen erhalten. Durch die innovative Umwandlung von Domänenwissen in Vektoren und die Kombination mit leistungsstarken Sprachmodellen wie ChatGPT liefert Casibase genaue und relevante Antworten auf Ihre Anfragen. Dies ermöglicht Ihnen einen effizienten Zugriff auf und die Nutzung spezifischer Domäneninformationen, die in Casibase gespeichert sind, und erfüllt Ihre Wissensbedürfnisse mühelos.

Schritt 5 (Optionale Feinabstimmung)

Wenn Sie mit den Ergebnissen nicht vollständig zufrieden sind, können Sie versuchen, bessere Ergebnisse zu erzielen durch:

  • Anpassung der Sprachmodellparameter

  • Stellen mehrerer Fragen

  • Optimierung der ursprünglichen Dateien

Durch die Nutzung dieser Feinabstimmungsoptionen können Sie die Effizienz Ihres Wissensmanagements in Casibase verbessern, sicherstellen, dass das System besser auf Ihre Ziele abgestimmt ist, und genauere und aufschlussreichere Informationen liefern.

Tipp

Andere Möglichkeiten zur Optimierung der Ergebnisse (möglicherweise mit Quellcodeänderungen):

  • Aktualisieren der Einbettungs-Ergebnisse: Verbessern Sie die Wissensdarstellung durch Anpassung der Einbettung Ihres Domänenwissens.

  • Ändern der Prompt-Vorlage: Durch Anpassung der Prompts können Sie präzisere Antworten vom Sprachmodell erhalten.

  • Erkunden verschiedener Sprachmodelle: Testen Sie verschiedene Modelle, um das für Ihre Antwortgenerierungsanforderungen am besten geeignete zu finden.

Online-Demo

Nur-Lese-Sites (Alle Änderungsoperationen werden fehlschlagen)

Beschreibbare Sites (Originaldaten werden alle 5 Minuten wiederhergestellt)

Globaler Admin-Login:

  • Benutzername: admin
  • Passwort: 123

Architektur

Casibase besteht aus 2 Teilen:

NameBeschreibungSpracheQuellcode
FrontendBenutzeroberfläche der Casibase-AnwendungJavaScript + Reacthttps://github.com/casibase/casibase/tree/master/web
BackendServerlogik und API von CasibaseGolang + Beego + MySQLhttps://github.com/casibase/casibase

Architektur

Unterstützte Modelle

Sprachmodelle

ModellUntertypenLink
OpenAIgpt-4-32k-0613, gpt-4-32k-0314, gpt-4-32k, gpt-4-0613, gpt-4-0314, gpt-4, gpt-3.5-turbo-0613, gpt-3.5-turbo-0301, gpt-3.5-turbo-16k, gpt-3.5-turbo-16k-0613, gpt-3.5-turbo, text-davinci-003, text-davinci-002, text-curie-001, text-babbage-001, text-ada-001, text-davinci-001, davinci-instruct-beta, davinci, curie-instruct-beta, curie, ada, babbageOpenAI
Hugging Facemeta-llama/Llama-2-7b, tiiuae/falcon-180B, bigscience/bloom, gpt2, baichuan-inc/Baichuan2-13B-Chat, THUDM/chatglm2-6bHugging Face
Claudeclaude-2, claude-v1, claude-v1-100k, claude-instant-v1, claude-instant-v1-100k, claude-v1.3, claude-v1.3-100k, claude-v1.2, claude-v1.0, claude-instant-v1.1, claude-instant-v1.1-100k, claude-instant-v1.0Claude
OpenRoutergoogle/palm-2-codechat-bison, google/palm-2-chat-bison, openai/gpt-3.5-turbo, openai/gpt-3.5-turbo-16k, openai/gpt-4, openai/gpt-4-32k, anthropic/claude-2, anthropic/claude-instant-v1, meta-llama/llama-2-13b-chat, meta-llama/llama-2-70b-chat, palm-2-codechat-bison, palm-2-chat-bison, gpt-3.5-turbo, gpt-3.5-turbo-16k, gpt-4, gpt-4-32k, claude-2, claude-instant-v1, llama-2-13b-chat, llama-2-70b-chatOpenRouter
ErnieERNIE-Bot, ERNIE-Bot-turbo, BLOOMZ-7B, Llama-2Ernie
iFlytekspark-v1.5, spark-v2.0iFlytek
ChatGLMchatglm2-6bChatGLM
MiniMaxabab5-chatMiniMax
Lokalcustom-modelLocal Computer

Einbettungsmodelle

ModellUntertypenLink
OpenAIAdaSimilarity, BabbageSimilarity, CurieSimilarity, DavinciSimilarity, AdaSearchDocument, AdaSearchQuery, BabbageSearchDocument, BabbageSearchQuery, CurieSearchDocument, CurieSearchQuery, DavinciSearchDocument, DavinciSearchQuery, AdaCodeSearchCode, AdaCodeSearchText, BabbageCodeSearchCode, BabbageCodeSearchText, AdaEmbeddingV2OpenAI
Hugging Facesentence-transformers/all-MiniLM-L6-v2Hugging Face
Cohereembed-english-v2.0, embed-english-light-v2.0, embed-multilingual-v2.0Cohere
ErnieStandardErnie
Lokalcustom-embeddingLocal Computer