تخطى إلى المحتوى الرئيسي

توليد المتجهات

يجب استخدام توليد المتجهات مع المخزن، مما يعني أنك تحتاج إلى فهم المخزن قبل فهم المتجهات.

المتجهات هي في الواقع نتيجة التضمين، وهي عملية تحويل أنواع مختلفة من البيانات (مثل النص والصور) إلى تمثيلات متجهية كثيفة. هذه الخطوة حاسمة للمعالجة والتحليل الفعال للبيانات في Casibase. من خلال التضمين، يتم تحويل كل من الأسئلة في المحادثة وملفات المعرفة في المخزن إلى متجهات، والتي سيتم استخدامها في الخطوة التالية للبحث عن المعرفة.

١. Automatic Embedding

Casibase automatically generates vectors when you upload files to a store. After configuring a store with storage, model, and embedding providers, simply upload your files through the file tree interface. The system immediately queues them for embedding and processes them in the background.

Each file progresses through states you can monitor in the Files page: Pending, Processing, Finished, or Error. The system calculates token counts during embedding and displays them alongside each file. If embedding fails for any file, the error details appear in the file list so you can quickly identify and fix issues like missing provider configurations or unsupported file formats.

When you delete files from storage, their vectors are automatically removed from the database. This keeps your knowledge base synchronized - you won't get outdated responses from files that no longer exist.

2. تحديث المتجهات

تم إعداد تحديث المتجهات كزر تحت قائمة المخزن لكل سجل مخزن. After configuring stores with storage providers, navigate to the Stores page to view the file tree for the storage providers.

By clicking on the Refresh Vectors button for a particular store, it will generate the corresponding vectors for all the files in the file tree for that store by embedding them. يوضح الشكل التالي الصفحة والعملية.

تحديث المتجهات.png

When you refresh vectors, the system automatically removes all existing vectors for that store before generating new ones. This ensures your vector database stays synchronized with your current files - if you've deleted files from storage, their vectors will be removed as well. The refresh always creates a clean, up-to-date vector set based on your current file tree.

Re-embedding Individual Files

For targeted updates, use the "Refresh Vectors" button in the Files page next to any specific file. This regenerates vectors for just that file while leaving others untouched - useful when you've changed embedding settings or need to fix errors on specific documents without reprocessing your entire knowledge base.

3. عرض المتجهات

After that, we can view the specific vectors generated by that store in the vector menu.

متجهات.png

كما يمكننا أن نرى، تم تحويل ملفات المخزن من الخطوة السابقة لتحديث المتجهات إلى متجهات وعرضها هنا.

صورة.png

تعرض صفحة تحرير المتجهات الخاصة بي معلومات محددة مثل اسم المخزن، واسم نموذج التضمين، واسم الملف المضمن، وحجم الملف، والأبعاد، وبيانات المتجهات، وما إلى ذلك.