概要
Casibaseは、ChatGPTを活用したオープンソースのドメイン知識データベース、インスタントメッセージング、およびフォーラムソフトウェアです。
Casibaseの機能
Golangで開発された独立したフロントエンドおよびバックエンドアーキテクチャにより、Casibaseは高並行性をサポートし、Webベースの管理UIを提供し、複数の言語(中国語、英語)をサポートしています。
Casibaseは、GitHub、Google、QQ、WeChatなどのサードパーティのアプリケーションログインをサポートし、プラグインによるサードパーティログインの拡張をサポートしています。
ナレッジマネジメントの埋め込みと迅速なエンジニアリングに基づいて、Casibaseはカスタマイズされた埋め込み方法と言語モデルをサポートしています。
Casibaseはdb同期による既存システムとの統合をサポートしているため、ユーザーはCasibaseにスムーズに移行できます。
Casibaseは、主流のデータベース:MySQL、PostgreSQL、SQL Serverなどをサポートし、プラグインによる新しいデータベースの拡張をサポートしています。
Casibaseは資産管理のための強力なツールであり、RDP経由で資産と簡単に接続できます。 VNC、SSHプロトコル、およびマシンへのリモート接続の効率的な処理。
Casibaseのセキュリティログ監査機能を使用すると、詳細な監査ログを使用してリモート接続の追跡と監視を簡単に行うことができます。 期間、およびその他の関連する詳細を確認し、Casdoorの操作のためのAPIログをキャプチャして分析することができ、セキュリティと運用の透明性を向上させます。
Casibaseはデータベース管理をサポートしています。 Casibaseのデータベース管理機能を使用すると、アクセス制御とデータベースリソースのユーザー管理と承認の簡素化を行いながら、データベースの接続、管理、整理を簡単に行うことができます。
動作方法
ステップ0(事前知識)
Casibaseの知識検索プロセスは、埋め込みとプロンプトエンジニアリングに基づいています。 埋め込みの仕組みを簡単に見てみることを強くお勧めします エンベディングへの入門。
ステップ1(知識のインポート)
Casibaseを使い始めるには、次の手順に従ってナレッジをインポートし、ドメイン固有のナレッジデータベースを作成する必要があります。
ストレージの構成: Casibaseダッシュボードでは、まずストレージの設定を行います。 これは、文書、画像、またはその他の関連データなど、知識関連のファイルを保存するために使用されるストレージシステムを指定することを含みます。 ユーザーは、自分の好みや要件に基づいて、さまざまなストレージオプションから選ぶことができます。
ファイルをストレージにアップロード: ストレージが設定されると、ユーザーはドメイン固有の知識を含むファイルを構成されたストレージシステムにアップロードできます。これらのファイルは、テキストドキュメント、画像、または構造化データファイル(CSVやJSONなど)など、様々な形式が可能です。 これらのファイルは、テキストドキュメント、画像、またはCSVやJSONのような構造化データファイルなど、さまざまな形式で存在する場合があります。
知識生成のための埋め込み方法の選択: ファイルをアップロードした後、ユーザーは知識と対応するベクトルを生成するための埋め込み方法を選択できます。埋め込みはテキストや視覚的コンテンツの数値表現であり、効率的な類似性検索とデータ分析を可能にします。 エンベディングは、テキストまたは視覚コンテンツの数値表現であり、効率的な類似性検索とデータ分析を可能にします。
知識はどのように埋め込まれますか?
テキストデータの場合:ユーザーはWord2Vec、GloVe、BERTなどの様々な埋め込み方法を選択して、テキスト知識を意味のあるベクトルに変換できます。
視覚データの場合:アップロードされたファイルに画像や視覚的コンテンツが含まれている場合、ユーザーはCNNベースの特徴抽出などの画像埋め込み技術を選択して代表的なベクトルを作成できます。
さらに多くの方法が近日公開予定です...
これらの手順に従うことで、ユーザーはドメインナレッジデータベースに関連情報と対応する埋め込み情報を入力できます。 Casibase内での効果的な検索、クラスタリング、知識の検索に使用されます。 エンベディングプロセスにより、システムは異なる知識間のコンテキストと関係性を理解でき、より効率的で洞察に満ちた知識管理と探求が可能になります。
ステップ2(知識の検索)
domain knowledge
をインポートした後、Casibaseはそれをvectors
に変換し、これらのベクトルをvectors
に格納します。 このベクトル表現により、similarity search
や efficient retrieval of related information
といった強力な機能が実現されます。 コンテキストや内容に基づいて関連するデータを迅速に見つけることができ、高度なクエリを実行し、ドメイン知識から貴重な洞察を明らかにすることが可能です。
ステップ3(プロンプトの構築)
Casibaseは、保存されたナレッジベクトルに類似性検索を実行し、ユーザのクエリに最も近い一致を見つけます。 検索結果を使用して、language model
に対する特定の質問を構築するための prompt template
を作成します。 これにより、Casibaseのドメイン知識に基づいて包括的な回答を提供し、正確で文脈に関連する応答が保証されます。
ステップ4(目標の達成)
この段階では、Casibaseを使用して、あなたが求める知識を得ることに成功しています。 ドメイン知識の革新的な組み合わせによってベクトルやChatGPTのような強力な言語モデルに変換されました。 Casibaseは、お問い合わせに対する正確で関連性の高い回答を提供します。 これにより、Casibaseに保存されているドメイン固有の情報に効率的にアクセスして利用でき、知識要件を簡単に満たすことができます。
ステップ5(オプションの微調整)
結果が完全に満足のいくものでない場合は、以下の方法でより良い結果を得ることができます:
言語モデルのパラメータを調整する
複数の質問をする
元のファイルを最適化する
これらの微調整オプションを利用することで、Casibaseで知識管理の効率を向上させることができます。 システムが目標に合致し、より正確で洞察力のある情報を提供できるようにします。
結果を最適化する他の方法(ソースコードの変更が必要な場合があります):
埋め込み
結果の更新:ドメイン知識の埋め込みを調整することで知識表現を改善します。プロンプト
テンプレートの修正:プロンプトをカスタマイズすることで、言語モデルからより正確な応答を得ることができます。異なる
言語モデル
の探索:様々なモデルを試して、応答生成の要件に最も適したものを見つけます。
オンラインデモ
読み取り専用サイト(すべての修正操作は失敗します)
- チャットボット (https://ai.casibase.com)
- Admin UI (https://ai-admin.casibase.com)
書き込み可能サイト(元データは5分ごとに復元されます)
- チャットボット (https://demo.casibase.com)
- Admin UI (https://demo-admin.casibase.com)
グローバル管理者ログイン:
- ユーザー名:
admin
- パスワード:
123
アーキテクチャ
Casibaseには2つのパートが含まれています:
名前 | 説明 | 言語 | ソースコード |
---|---|---|---|
フロントエンド | Casibaseアプリケーションのユーザー インターフェイス | JavaScript + React | https://github.com/casibase/casibase/tree/master/web |
バックエンド | サイベース用のサーバーサイドロジックと API | Golang + Beego + MySQL | https://github.com/casibase/casibase |
サポートされているモデル
言語モデル
モデル | サブタイプ | リンク |
---|---|---|
OpenAI | gpt-4-32k-0613、gpt-4-32k-0314、gpt-4-32k、gpt-4-0613、gpt-4-0314、gpt-4、gpt-3.5-turbo-0613、gpt-3.5-turbo-0301、gpt-3.5-turbo-16k、gpt-3.5-turbo-16k-0613、gpt-3.5-turbo、text-davinci-003、text-davinci-002、text-curie-001、text-babbage-001、text-ada-001、text-davinci-001、davinci-instruct-beta、davinci、curie-instruct-beta、curie、ada、babbage | OpenAI |
Hugging Face | meta-llama/Llama-2-7b、tiiuae/falcon-180B、bigscience/bloom、gpt2、baichuan-inc/Baichuan2-13B-Chat、THUDM/chatglm2-6b | Hugging Face |
Claude | claude-2、claude-v1、claude-v1-100k、claude-instant-v1、claude-instant-v1-100k、claude-v1.3、claude-v1.3-100k、claude-v1.2、claude-v1.0、claude-instant-v1.1、claude-instant-v1.1-100k、claude-instant-v1.0 | Claude |
OpenRouter | google/palm-2-codechat-bison、google/palm-2-chat-bison、openai/gpt-3.5-turbo、openai/gpt-3.5-turbo-16k、openai/gpt-4、openai/gpt-4-32k、anthropic/claude-2、anthropic/claude-instant-v1、meta-llama/llama-2-13b-chat、meta-llama/llama-2-70b-chat、palm-2-codechat-bison、palm-2-chat-bison、gpt-3.5-turbo、gpt-3.5-turbo-16k、gpt-4、gpt-4-32k、claude-2、claude-instant-v1、llama-2-13b-chat、llama-2-70b-chat | OpenRouter |
Ernie | ERNIE-Bot、ERNIE-Bot-turbo、BLOOMZ-7B、Llama-2 | Ernie |
iFlytek | spark-v1.5、spark-v2.0 | iFlytek |
ChatGLM | chatglm2-6b | ChatGLM |
MiniMax | abab5-chat | MiniMax |
ローカル | custom-model | Local Computer |
埋め込みモデル
モデル | サブタイプ | リンク |
---|---|---|
OpenAI | AdaSimilarity、BabbageSimilarity、CurieSimilarity、DavinciSimilarity、AdaSearchDocument、AdaSearchQuery、BabbageSearchDocument、BabbageSearchQuery、CurieSearchDocument、CurieSearchQuery、DavinciSearchDocument、DavinciSearchQuery、AdaCodeSearchCode、AdaCodeSearchText、BabbageCodeSearchCode、BabbageCodeSearchText、AdaEmbeddingV2 | OpenAI |
Hugging Face | sentence-transformers/all-MiniLM-L6-v2 | Hugging Face |
Cohere | embed-english-v2.0、embed-english-light-v2.0、embed-multilingual-v2.0 | Cohere |
Ernie | default | Ernie |
ローカル | custom-embedding | Local Computer |