تخطى إلى المحتوى الرئيسي

نظرة عامة

Casibase هو برنامج مفتوح المصدر لقاعدة بيانات معرفة المجال والمراسلة الفورية والمنتديات مدعوم بواسطة ChatGPT.

ميزات Casibase

  1. باستخدام بنية مفصولة بين الواجهة والخلفية مطورة بلغة Golang، يدعم Casibase التشغيل المتوازي عالي الأداء، ويوفر واجهة إدارة قائمة على الويب، ويدعم لغات متعددة (الصينية، الإنجليزية).

  2. يدعم Casibase تسجيل الدخول من تطبيقات الطرف الثالث مثل GitHub وGoogle وQQ وWeChat وغيرها، ويمكن توسيع تسجيل دخول الطرف الثالث من خلال الإضافات.

  3. باستخدام التضمين وهندسة الإرشادات لإدارة المعرفة، يدعم Casibase طرق التضمين المخصصة ونماذج اللغة.

  4. يتيح Casibase التكامل مع الأنظمة الموجودة من خلال مزامنة قاعدة البيانات، مما يسمح للمستخدمين بالانتقال بسلاسة إلى Casibase.

  5. يدعم Casibase قواعد البيانات الرئيسية: MySQL وPostgreSQL وSQL Server وغيرها، ويمكن توسيع قواعد البيانات الجديدة من خلال الإضافات.

  6. Casibase هو أداة قوية لإدارة الأصول، تتيح الاتصال السهل بالأصول عبر بروتوكولات RDP وVNC وSSH، وتعالج بكفاءة الاتصالات عن بعد للأجهزة.

  7. تتيح لك ميزة سجل الأمان في Casibase تتبع ومراقبة الاتصالات عن بعد بسهولة، مع تسجيل تفاصيل مفصلة عن وقت بدء الاتصال ومدته وتفاصيل أخرى ذات صلة، مع التقاط وتحليل سجلات API لعمليات Casdoor، مما يعزز الأمان وشفافية العمليات.

  8. يدعم Casibase إدارة قواعد البيانات. تتيح لك ميزة إدارة قواعد البيانات في Casibase الاتصال بقواعد البيانات وإدارتها وتنظيمها بسهولة مع التحكم في الوصول، مما يبسط إدارة المستخدم والتفويض لموارد قاعدة البيانات.

كيف يعمل

الخطوة 0 (المعرفة المسبقة)

تعتمد عملية استرجاع المعرفة في Casibase على التضمين وهندسة الإرشادات، لذلك يُوصى بشدة بأن تتعرف بإيجاز على كيفية عمل التضمينات. هذه مقدمة حول التضمينات.

embedding

الخطوة 1 (استيراد المعرفة)

لبدء استخدام Casibase، يحتاج المستخدمون إلى اتباع الخطوات التالية لاستيراد المعرفة وإنشاء قاعدة بيانات معرفية خاصة بالمجال:

  1. تكوين التخزين: في لوحة تحكم Casibase، يجب على المستخدمين أولاً تكوين إعدادات التخزين. يتضمن ذلك تحديد نظام التخزين المستخدم لتخزين الملفات المتعلقة بالمعرفة مثل المستندات أو الصور أو أي بيانات أخرى ذات صلة. يمكن للمستخدمين الاختيار من بين خيارات تخزين متنوعة وفقًا لتفضيلاتهم ومتطلباتهم.

  2. تحميل الملفات إلى التخزين: بمجرد إعداد التخزين، يمكن للمستخدمين تحميل الملفات التي تحتوي على معرفة خاصة بالمجال إلى نظام التخزين المكوّن. يمكن أن تكون هذه الملفات بتنسيقات مختلفة، مثل مستندات نصية أو صور أو ملفات بيانات منظمة (مثل CSV أو JSON).

  3. اختيار طريقة التضمين لتوليد المعرفة: بعد تحميل الملفات، يمكن للمستخدمين اختيار طريقة التضمين لتوليد المعرفة والمتجهات المقابلة. التضمينات هي تمثيلات رقمية للمحتوى النصي أو المرئي، مما يسهل البحث والتحليل الفعال للتشابه.

نصيحة

كيف يتم تضمين المعرفة؟

  • للبيانات النصية: يمكن للمستخدمين اختيار طرق تضمين مختلفة مثل Word2Vec أو GloVe أو BERT لتحويل المعرفة النصية إلى متجهات ذات معنى.

  • للبيانات المرئية: إذا كانت الملفات المحملة تحتوي على صور أو محتوى مرئي، يمكن للمستخدمين اختيار تقنيات تضمين الصور مثل استخراج الميزات المعتمد على CNN لإنشاء متجهات تمثيلية.

  • المزيد من الطرق قادمة قريبًا...

من خلال اتباع هذه الخطوات، يمكن للمستخدمين ملء قاعدة بيانات المعرفة الخاصة بمجالهم بمعلومات ذات صلة وتضمينات مقابلة، والتي ستستخدم للبحث والتجميع واسترجاع المعرفة الفعال في Casibase. تمكّن عملية التضمين النظام من فهم السياق والعلاقات بين شظايا المعرفة المختلفة، مما يتيح إدارة واستكشاف معرفة أكثر كفاءة وثراءً.

الخطوة 2 (استرجاع المعرفة)

بعد استيراد معرفة المجال الخاصة بك، يحولها Casibase إلى متجهات ويخزن هذه المتجهات في قاعدة بيانات المتجهات. يتيح هذا التمثيل المتجهي ميزات قوية مثل البحث عن التشابه واسترجاع المعلومات ذات الصلة بكفاءة. يمكنك العثور بسرعة على البيانات ذات الصلة بناءً على السياق أو المحتوى، وإجراء استعلامات متقدمة، واكتشاف رؤى قيمة في معرفة مجالك.

الخطوة 3 (بناء الإرشاد)

يقوم Casibase بإجراء بحث عن التشابه على متجهات المعرفة المخزنة للعثور على أفضل تطابق مع استعلام المستخدم. باستخدام نتائج البحث، ينشئ قالب إرشاد لـنموذج اللغة لبناء إجابة محددة. هذا يضمن أن تكون الاستجابات دقيقة ومرتبطة بالسياق بناءً على المعرفة المجالية المخزنة في Casibase.

الخطوة 4 (تحقيق الهدف)

في هذه المرحلة، باستخدام Casibase، حصلت بنجاح على المعرفة المطلوبة. من خلال التحويل المبتكر لمعرفة المجال إلى متجهات والجمع مع نماذج لغوية قوية مثل ChatGPT، يقدم Casibase استجابات دقيقة وذات صلة لاستعلاماتك. هذا يمكنك من الوصول بكفاءة إلى معلومات مجالية محددة واستخدامها مخزنة في Casibase، مما يلبي احتياجات المعرفة لديك بسهولة.

الخطوة 5 (الضبط الدقيق الاختياري)

إذا وجدت أن النتائج ليست مرضية تمامًا، يمكنك محاولة الحصول على نتائج أفضل من خلال:

  • ضبط معلمات نموذج اللغة

  • طرح أسئلة متعددة

  • تحسين الملفات الأصلية

من خلال الاستفادة من خيارات الضبط الدقيق هذه، يمكنك تحسين كفاءة إدارة المعرفة في Casibase، وضمان توافق النظام بشكل أفضل مع أهدافك، وتقديم معلومات أكثر دقة وثراءً.

نصيحة

طرق أخرى لتحسين النتائج (قد تتطلب تغييرات في الشفرة المصدرية):

  • تحديث نتائج التضمين: تحسين تمثيل المعرفة من خلال تعديل تضمين معرفة مجالك.

  • تعديل قالب الإرشاد: من خلال تخصيص الإرشادات، يمكنك الحصول على استجابات أكثر دقة من نموذج اللغة.

  • استكشاف نماذج لغة مختلفة: جرب نماذج مختلفة للعثور على الأنسب لمتطلبات توليد الاستجابة لديك.

عرض توضيحي عبر الإنترنت

مواقع للقراءة فقط (ستفشل أي عمليات تعديل)

مواقع قابلة للكتابة (تتم استعادة البيانات الأصلية كل 5 دقائق)

تسجيل دخول المسؤول العام:

  • اسم المستخدم: admin
  • كلمة المرور: 123

البنية

يتكون Casibase من جزأين:

الاسمالوصفاللغةالشفرة المصدرية
الواجهةواجهة مستخدم تطبيق Casibaseجافاسكريبت + رياكتhttps://github.com/casibase/casibase/tree/master/web
الخلفيةمنطق الخادم وواجهة برمجة تطبيقات CasibaseGolang + Beego + MySQLhttps://github.com/casibase/casibase

Architecture

النماذج المدعومة

نماذج اللغة

النموذجالأنواع الفرعيةالرابط
OpenAIgpt-4-32k-0613، gpt-4-32k-0314، gpt-4-32k، gpt-4-0613، gpt-4-0314، gpt-4، gpt-3.5-turbo-0613، gpt-3.5-turbo-0301، gpt-3.5-turbo-16k، gpt-3.5-turbo-16k-0613، gpt-3.5-turbo، text-davinci-003، text-davinci-002، text-curie-001، text-babbage-001، text-ada-001، text-davinci-001، davinci-instruct-beta، davinci، curie-instruct-beta، curie، ada، babbageOpenAI
هاجنغ فيسmeta-llama/Llama-2-7b، tiiuae/falcon-180B، bigscience/bloom، gpt2، baichuan-inc/Baichuan2-13B-Chat، THUDM/chatglm2-6bهاجنغ فيس
كلودclaude-2، claude-v1، claude-v1-100k، claude-instant-v1، claude-instant-v1-100k، claude-v1.3، claude-v1.3-100k، claude-v1.2، claude-v1.0، claude-instant-v1.1، claude-instant-v1.1-100k، claude-instant-v1.0كلود
OpenRoutergoogle/palm-2-codechat-bison، google/palm-2-chat-bison، openai/gpt-3.5-turbo، openai/gpt-3.5-turbo-16k، openai/gpt-4، openai/gpt-4-32k، anthropic/claude-2، anthropic/claude-instant-v1، meta-llama/llama-2-13b-chat، meta-llama/llama-2-70b-chat، palm-2-codechat-bison، palm-2-chat-bison، gpt-3.5-turbo، gpt-3.5-turbo-16k، gpt-4، gpt-4-32k، claude-2، claude-instant-v1، llama-2-13b-chat، llama-2-70b-chatOpenRouter
إرنيERNIE-Bot، ERNIE-Bot-turbo، BLOOMZ-7B، Llama-2إرني
iFlytekspark-v1.5، spark-v2.0iFlytek
ChatGLMchatglm2-6bChatGLM
ميني ماكسabab5-chatميني ماكس
المحلينموذج مخصصLocal Computer

نماذج التضمين

النموذجالأنواع الفرعيةالرابط
OpenAIAdaSimilarity، BabbageSimilarity، CurieSimilarity، DavinciSimilarity، AdaSearchDocument، AdaSearchQuery، BabbageSearchDocument، BabbageSearchQuery، CurieSearchDocument، CurieSearchQuery، DavinciSearchDocument، DavinciSearchQuery، AdaCodeSearchCode، AdaCodeSearchText، BabbageCodeSearchCode، BabbageCodeSearchText، AdaEmbeddingV2OpenAI
هاجنغ فيسsentence-transformers/all-MiniLM-L6-v2هاجنغ فيس
كوهيرembed-english-v2.0، embed-english-light-v2.0، embed-multilingual-v2.0كوهير
إرنيافتراضيإرني
المحليتضمين مخصصLocal Computer